반응형

2024/04 59

ML(머신러닝) 실습 : Logistic Regression 분류 모델 (up sampling, SMOTE 활용법)

문제) pima-indians-diabetes.csv 파일을 읽어서, 당뇨병을 분류하는 모델을 만드시오. 컬럼 정보 : Preg=no. of pregnancy Plas=Plasma Pres=blood pressure skin=skin thickness test=insulin test mass=body mass pedi=diabetes pedigree function age=age class=target(diabetes of not, 1:diabetic, 0:not diabetic) import numpy as np import matplotlib.pyplot as plt import pandas as pd # 데이터 불러오기 df = pd.read_csv('../data/pima-..

ML(머신러닝) : Logistic Regression 개념 정리 (sklearn 으로 classifier 생성 및 Confusion Matrix = cm 만들기)

- Logistic Regression은 기계 학습과 통계에서 사용되는 통계적 분류 방법 - 주로 두 개 이상의 클래스 중 하나에 속하는 경우를 예측하는 데 사용된다. - 주로 이진 분류(binary classification) 문제에 적용되며, 예를 들어 스팸 메일 여부 판별, 질병 진단 등 다양한 분야에서 활용된다. - 이 방법은 선형 회귀(Linear Regression)와 비슷해 보이지만, 출력 값이 0과 1 사이의 확률값으로 제한되며, S자 형태의 로지스틱 함수를 사용하고, 이를 통해 예측값을 확률로 해석할 수 있다. - 간단히 말하면, Logistic Regression은 주어진 입력 변수를 기반으로 특정 클래스에 속할 확률을 예측하는 모델 ..

ML(머신러닝) : Multiple Linear Regression 개념 정리 (regressor / ct 만들기 joblib 으로 pkl 파일로 저장하고 불러오기)

다중 선형 회귀(Multiple Linear Regression)는 두 개 이상의 독립 변수가 종속 변수에 미치는 영향을 분석하는 회귀 분석 방법이다. 단순 선형 회귀(Linear Regression)와 달리, 다중 선형 회귀는 종속 변수와 관련된 여러 개의 독립 변수를 사용하여 예측 모델을 구축한다. 아래처럼, 여러개의 features 를 기반으로, 수익을 예측하려 한다. 위와 같이, 여러개의 변수들을 통해, 수익과의 관계를 분석하고, 이를 통해, 새로운 데이터가 들어왔을 때, 수익이 어떻게 될 지를 예측하고자 한다. 아래는 하나의 변수일때와, 여러개의 변수가 있을때의 leaner regression 을 나타낸다. 2차원에서는 선 이지만, ..

프로젝트(범죄현황) 연습(1) : 데이터 주무르기, API 키 생성 활용(googlemaps.Client())

레퍼런스 : 파이썬으로 데이터 주무르기# 이전장에서 사용했던 CCTV 데이터 불러와서 시작df_cctv = pd.read_csv('../데이터분석2/CCTV_result.csv')df_cctv 서울시 구별 범죄 발생과 검거율 데이터 분석'서울시 관서별 5대 범죄 발생 검거 현황' 파일을 가지고 분석합니다. # 한글 찍기import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport seaborn as sb%matplotlib inlineimport platformfrom matplotlib import font_manager, rcplt.rcParams['axes.unicode_minus'] = Falseif platform.syste..

프로젝트(CCTV설치) 연습 : 데이터를 분석 가공하여 상관관계 분석(.corr())과 데이터 시각화까지

# 실습전 기본 라이브러리 및 한글 찍기 import import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sb %matplotlib inline import platform from matplotlib import font_manager, rc plt.rcParams['axes.unicode_minus'] = False if platform.system() == 'Darwin': rc('font', family='AppleGothic') elif platform.system() == 'Windows': path = "c:/Windows/Fonts/malgun.ttf" font_name = font_..

프로젝트(대중교통) 연습 : 데이터를 분석하여 파이차트 그리기 plt.pie()

# 실행전 기본 라이브러리 및 한글 찍기 import import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sb %matplotlib inline import platform from matplotlib import font_manager, rc plt.rcParams['axes.unicode_minus'] = False if platform.system() == 'Darwin': rc('font', family='AppleGothic') elif platform.system() == 'Windows': path = "c:/Windows/Fonts/malgun.ttf" font_name = font_..

프로젝트(기온데이터분석) 연습 : 데이터 가공하여 히스토그램, 산점도 그리기 plt.hist() , plt.scatter()

# 실행에 필요한 기본 항목과 한글 인식하게하는 라이브러리 까지 한꺼번에 import import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sb %matplotlib inline import platform from matplotlib import font_manager, rc plt.rcParams['axes.unicode_minus'] = False if platform.system() == 'Darwin': rc('font', family='AppleGothic') elif platform.system() == 'Windows': path = "c:/Windows/Fonts/malgun.ttf"..

728x90
반응형