반응형

머신러닝 11

ML(머신러닝) : SVM (Support Vector Machine) 개념 정리 (sklearn.svm 의 SVC 인공지능 생성)

# Support Vector Machine (SVM)은 지도 학습 알고리즘 중 하나로, 데이터를 분류하기 위한 최적의 결정 경계(decision boundary)를 찾는 것을 목표로 한다.아래의 3개 의 선 모두, 분류하는 선이 모두 맞다. 그러면 어떤것이 더 정확할까?분류선에 가장 가까운 데이터들을, 가장 큰 마진(margin)으로 설정하는 선으로 결정하자.분류선을 Maximum Margin Classifer 라고 한다.SVM은 다른 머신러닝 알고리즘과 비교해서 무엇이 특별한가?사과인지 오렌지인지 분석하는 문제일반적인 사과와 오렌지들은, 클래서파이어에서 멀리 분포한다.정상적이지 않은 것들, 즉 구분하기 힘든 부분에 있는 것들은 클래서파이어 근처에 있게 되며,이 데이터들이 레이블링 되어 있으므로, Ma..

ML(머신러닝) 실습 : Logistic Regression 분류 모델 (up sampling, SMOTE 활용법)

문제) pima-indians-diabetes.csv 파일을 읽어서, 당뇨병을 분류하는 모델을 만드시오. 컬럼 정보 : Preg=no. of pregnancy Plas=Plasma Pres=blood pressure skin=skin thickness test=insulin test mass=body mass pedi=diabetes pedigree function age=age class=target(diabetes of not, 1:diabetic, 0:not diabetic) import numpy as np import matplotlib.pyplot as plt import pandas as pd # 데이터 불러오기 df = pd.read_csv('../data/pima-..

ML(머신러닝) 실습 문제 : Linear regression 예측 모델 실습 (sklearn.linear, LinearRegression model)

auto-mpg.csv 데이터를 통해, mpg (mile per gallern, 자동차 연비) 를 예측하는 모델을 만드세요. # 필요한 import를 한번에 정리 # numpy와 pnadas 데이터 시각화에 필요 import numpy as np import matplotlib.pyplot as plt import pandas as pd import seaborn as sb # 데이터 인코딩에 필요 from sklearn.preprocessing import LabelEncoder, OneHotEncoder from sklearn.compose import ColumnTransformer # 스케일링에 필요 from sklearn.preprocessing import StandardScaler, MinM..

Machine Learning 개념 정리

편지봉투에 손으로 쓴 우편번호 숫자 자동 판별 의료 영상 이미지에 기반한, 종양 판단 의심되는 신용카드 거래 감지 블로그 글의 주제 분류 고객들을 취향이 비슷한 그룹으로 묶기 가지고 이는 데이터가 내가 원하는 문제의 답을 가지고 있는가? 내 문제를 가장 잘 해결할 수 있는 머신러닝 방법은 무엇인가 문제를 풀기에 충분한 데이터를 모았는가? 머신러닝의 성과를 어떻게 측정할 것인가 레퍼런스 : https://www.youtube.com/watch?v=KDrys0OnVho 우리는 Iris꽃의 꽃잎의 길이와 넓이, 꽃받..

728x90
반응형