728x90
반응형

MACHINE LEARNING/Machine Learning Library 12

ML(머신러닝) : 구글 티처블 머신(Teachable Machine) 시작 하기

티처블 머신(Teachable Machine) ># 티처블 머신(Teachable Machine)은 구글이 개발한 웹 기반의 머신러닝 플랫폼 # 이 플랫폼은 사용자가 간단한 인터페이스를 통해 이미지, 음성 또는 동작과 같은 데이터를 입력하고, 이를 기반으로 모델을 학습시킬 수 있고, 사용자는 이를 통해 기계에게 어떤 입력이 어떤 출력을 가져오는지를 가르칠 수 있다.# https://teachablemachine.withgoogle.com/ Teachable MachineTrain a computer to recognize your own images, sounds, & poses. A fast, easy way to create machine learning models for your sites, ap..

ML(머신러닝) : Hierarchical Clustering (Dendrogram을 그리고 Agglomerative Clustering 활용)

Hierarchical Clustering > - 데이터 포인트들을 계층적으로 그룹화하는 클러스터링 방법 - 복잡한 데이터 구조를 가진 데이터 세트에서 패턴이나 관계를 파악하는 데 유용 - Hierarchical Clustering의 결과는 트리 형태로 나타낼 수 있으며, 이를 덴드로그램(dendrogram)이라고 한다. - 덴드로그램은 각 클러스터의 병합 순서와 유사도를 시각적으로 표현하고, 클러스터의 수를 사전에 지정할 필요가 없으므로, 클러스터의 개수를 자유롭게 선택할 수 있어 매우 유연하게 사용할 수 있다.묶인 클러스터를 점 하나로 보고, 반복하여 가까운것끼리 묶는다. # Library 임포트import numpy as npimport matplotlib.pyplot as pltimport pan..

ML(머신러닝) : K-Means Clustering 개념 정리 (K-Means++ 알고리즘, sklearn.cluster, KMeans 활용)

- K-Means Clustering은 비지도 학습 알고리즘 중 하나로, 데이터를 여러 개의 클러스터로 그룹화하는 데 사용된다.- 이 알고리즘의 목표는 데이터 포인트들을 그룹 내에서 가능한 작은 거리의 합계로 클러스터링하는 것! # 이전까지 작성한 Classification(분류)에 KNN, SVM, Decision Tree, Logistic regression# Prediction(예측)에 regression(회귀) 은 모두 Supervised Learnig # Clustering은 모두 Unsupervised Learning 이다. k 개의 그룹을 만든다. 즉, 비슷한 특징을 갖는 것들끼리 묶는것다음을 두개, 세개, 네개 그룹 등등 원하는 그룹으로 만들 수 있다. 알고리즘또다..

ML(머신러닝) : Decision Tree 개념 정리 (sklearn.svm 의 SVC 인공지능 생성)

# Decision Tree(의사결정트리)는 지도 학습 알고리즘 중 하나로, 데이터를 특정 기준을 기반으로 여러 노드로 분할하여 결정을 내리는 트리 구조를 사용 계속하여 이것인지 저것인지 결정한다.   # Importing the librariesimport numpy as npimport matplotlib.pyplot as pltimport pandas as pd # 이전 게시글에서 사용한 데이터와 동일한 데이터로 실습df = pd.read_csv('../data/Social_Network_Ads.csv') # X,y 분류y = df['Purchased']X = df.loc[ : , 'Age' : 'EstimatedSalary' ] # 피쳐 스케일링from sk..

ML(머신러닝) : SVM (Support Vector Machine) 개념 정리 (sklearn.svm 의 SVC 인공지능 생성)

# Support Vector Machine (SVM)은 지도 학습 알고리즘 중 하나로, 데이터를 분류하기 위한 최적의 결정 경계(decision boundary)를 찾는 것을 목표로 한다.아래의 3개 의 선 모두, 분류하는 선이 모두 맞다. 그러면 어떤것이 더 정확할까?분류선에 가장 가까운 데이터들을, 가장 큰 마진(margin)으로 설정하는 선으로 결정하자.분류선을 Maximum Margin Classifer 라고 한다.SVM은 다른 머신러닝 알고리즘과 비교해서 무엇이 특별한가?사과인지 오렌지인지 분석하는 문제일반적인 사과와 오렌지들은, 클래서파이어에서 멀리 분포한다.정상적이지 않은 것들, 즉 구분하기 힘든 부분에 있는 것들은 클래서파이어 근처에 있게 되며,이 데이터들이 레이블링 되어 있으므로, Ma..

ML(머신러닝) : KNN 개념 정리 및 sklearn 라이브러리의 KNeighborsClassifier 만들기

# K-Nearest Neighbors (K-NN)는 지도 학습 알고리즘 중 하나로, 학습 데이터셋 내에서 새로운 데이터 포인트와 가장 가까운 k개의 이웃을 찾아 해당 이웃들의 라벨 또는 값을 기반으로 예측을 수행 # Logistic Regression과 같은 분류형 내 주위에 몇개의 이웃을 확인해 볼것인가를 결정한다. => K 새로운 데이터가 발생 시, Euclidean distance 에 의해서, 가장 가까운 K 개의 이웃을 택한다. K 개의 이웃의 카테고리를 확인한다. 카테고리의 숫자가 많은 쪽으로, 새로운 데이터의 카테고리를 정해버린다. import pandas as pd # Logistic Regr..

ML(머신러닝) : Logistic Regression 개념 정리 (sklearn 으로 classifier 생성 및 Confusion Matrix = cm 만들기)

- Logistic Regression은 기계 학습과 통계에서 사용되는 통계적 분류 방법 - 주로 두 개 이상의 클래스 중 하나에 속하는 경우를 예측하는 데 사용된다. - 주로 이진 분류(binary classification) 문제에 적용되며, 예를 들어 스팸 메일 여부 판별, 질병 진단 등 다양한 분야에서 활용된다. - 이 방법은 선형 회귀(Linear Regression)와 비슷해 보이지만, 출력 값이 0과 1 사이의 확률값으로 제한되며, S자 형태의 로지스틱 함수를 사용하고, 이를 통해 예측값을 확률로 해석할 수 있다. - 간단히 말하면, Logistic Regression은 주어진 입력 변수를 기반으로 특정 클래스에 속할 확률을 예측하는 모델 ..

728x90
반응형