728x90
반응형

k-means 3

ML(머신러닝) 실습 : Clustering (K-Means, Agglomerative)을 활용한 고객 파악

음식소비 데이터를 통해서 비슷한 고객으로 그룹핑 하자 > import numpy as npimport matplotlib.pyplot as pltimport pandas as pd df = pd.read_csv('../data/Cust_Spend_Data.csv') df.isna().sum()Cust_ID 0Name 0Avg_Mthly_Spend 0No_Of_Visits 0Apparel_Items 0FnV_Items 0Staples_Items 0dtype: int64 X = df.iloc[:,2:] import scipy.cluster.hierarchy as schimport matplotlib.pyplot a..

ML(머신러닝) 실습 : K-Means Clustering (for 문을 활용해 Elbow Method 찾기)

기술 지원 데이터는 종종 고객 경험 개선 기회에 대한 풍부한 정보 소스가 될 수 있습니다. 제품에 대한 고객의 문제가 적을수록 좋습니다. 고객이 최소한의 노력으로 기술적 과제를 신속하게 극복 할 수 있다면 더욱 좋습니다. 기술 지원 데이터를 분석하고 문제 유형, 문제 해결 시간 및 가장 적합한 지원 채널에 대한 기본적인 분석을 수행하겠습니다. 문제) technical_support_data.csv 파일을 통해, 비슷한 유형의 문제들을 도출하시오.import pandas as pd# 데이터 불러오기df = pd.read_csv('../data/technical_support_data.csv') # 비어있는 데이터 확인df.isna().sum()PROBLEM_TYPE ..

ML(머신러닝) : K-Means Clustering 개념 정리 (K-Means++ 알고리즘, sklearn.cluster, KMeans 활용)

- K-Means Clustering은 비지도 학습 알고리즘 중 하나로, 데이터를 여러 개의 클러스터로 그룹화하는 데 사용된다.- 이 알고리즘의 목표는 데이터 포인트들을 그룹 내에서 가능한 작은 거리의 합계로 클러스터링하는 것! # 이전까지 작성한 Classification(분류)에 KNN, SVM, Decision Tree, Logistic regression# Prediction(예측)에 regression(회귀) 은 모두 Supervised Learnig # Clustering은 모두 Unsupervised Learning 이다. k 개의 그룹을 만든다. 즉, 비슷한 특징을 갖는 것들끼리 묶는것다음을 두개, 세개, 네개 그룹 등등 원하는 그룹으로 만들 수 있다. 알고리즘또다..

728x90
반응형