728x90
반응형

분류 전체보기 206

AWS EC2 SERVER : (2) Windows에서 EC2 Linux에 접속하기 (PuTTY 와 AWS 설정)

(2) Windows에서 EC2 Linux에 접속하기 (PuTTY 와 AWS 설정) # PuTTY를 사용하여 Windows에서 Linux 인스턴스에 연결- 순서에 따라 진행하면됨- 프라이빗 키 변환은 안해도됨!! 이미 생성할때 선택하여 생성함 다운로드 받은것!https://docs.aws.amazon.com/ko_kr/AWSEC2/latest/UserGuide/putty.html PuTTY를 사용하여 Windows에서 Linux 인스턴스에 연결 - Amazon Elastic Compute Cloud프라이빗 키의 암호는 추가 보호 계층입니다. 프라이빗 키가 노출되더라도 암호 없이 사용할 수 없습니다. 암호문 사용의 단점은 인스턴스에 로그온하거나 인스턴스에 파일을 복사하기 위해 사docs.aws.amazon..

AWS EC2 SERVER : (1) EC2 인스턴스 생성하기

(1) AWS EC2 인스턴스 생성하기 # 사전준비로 AWS 가입후 메인 화면에서 region 설정!# 우측 아이디 옆에 region 무조건 서울로 설정하고 만들어야 한다!!! # EC2 서비스 검색하여 화면 진입- 인스턴스 시작! # 원하는 프로젝트명칭에 맞게 이름을 입력 # 애플리케이션 및 OS 이미지는 Amazon Linux로 설정  # 키 페어(로그인) 생성- 내가 사용하는 컴퓨터에서 AWS 서버에 접속하여야 한다.- 이 키 페어를 가지고 있어야 서버에 접속을 승인해 준다. 즉, 우리집에 들어올수 있도록 집키를 나누어 주는 것처럼.- '새 키 페어 생성' 누르기 # 키페어 유형은 RSA 선택, Window 환경이면 키 파일 형식은 .ppk를 사용! # 생성이 성공되면 자동으로 다운됨. 이 키페어가..

ML(머신러닝) 실습 : K-Means Clustering (for 문을 활용해 Elbow Method 찾기)

기술 지원 데이터는 종종 고객 경험 개선 기회에 대한 풍부한 정보 소스가 될 수 있습니다. 제품에 대한 고객의 문제가 적을수록 좋습니다. 고객이 최소한의 노력으로 기술적 과제를 신속하게 극복 할 수 있다면 더욱 좋습니다. 기술 지원 데이터를 분석하고 문제 유형, 문제 해결 시간 및 가장 적합한 지원 채널에 대한 기본적인 분석을 수행하겠습니다. 문제) technical_support_data.csv 파일을 통해, 비슷한 유형의 문제들을 도출하시오.import pandas as pd# 데이터 불러오기df = pd.read_csv('../data/technical_support_data.csv') # 비어있는 데이터 확인df.isna().sum()PROBLEM_TYPE ..

ML(머신러닝) : K-Means Clustering 개념 정리 (K-Means++ 알고리즘, sklearn.cluster, KMeans 활용)

- K-Means Clustering은 비지도 학습 알고리즘 중 하나로, 데이터를 여러 개의 클러스터로 그룹화하는 데 사용된다.- 이 알고리즘의 목표는 데이터 포인트들을 그룹 내에서 가능한 작은 거리의 합계로 클러스터링하는 것! # 이전까지 작성한 Classification(분류)에 KNN, SVM, Decision Tree, Logistic regression# Prediction(예측)에 regression(회귀) 은 모두 Supervised Learnig # Clustering은 모두 Unsupervised Learning 이다. k 개의 그룹을 만든다. 즉, 비슷한 특징을 갖는 것들끼리 묶는것다음을 두개, 세개, 네개 그룹 등등 원하는 그룹으로 만들 수 있다. 알고리즘또다..

ML(머신러닝) : Decision Tree 개념 정리 (sklearn.svm 의 SVC 인공지능 생성)

# Decision Tree(의사결정트리)는 지도 학습 알고리즘 중 하나로, 데이터를 특정 기준을 기반으로 여러 노드로 분할하여 결정을 내리는 트리 구조를 사용 계속하여 이것인지 저것인지 결정한다.   # Importing the librariesimport numpy as npimport matplotlib.pyplot as pltimport pandas as pd # 이전 게시글에서 사용한 데이터와 동일한 데이터로 실습df = pd.read_csv('../data/Social_Network_Ads.csv') # X,y 분류y = df['Purchased']X = df.loc[ : , 'Age' : 'EstimatedSalary' ] # 피쳐 스케일링from sk..

ML(머신러닝) : SVM (Support Vector Machine) 개념 정리 (sklearn.svm 의 SVC 인공지능 생성)

# Support Vector Machine (SVM)은 지도 학습 알고리즘 중 하나로, 데이터를 분류하기 위한 최적의 결정 경계(decision boundary)를 찾는 것을 목표로 한다.아래의 3개 의 선 모두, 분류하는 선이 모두 맞다. 그러면 어떤것이 더 정확할까?분류선에 가장 가까운 데이터들을, 가장 큰 마진(margin)으로 설정하는 선으로 결정하자.분류선을 Maximum Margin Classifer 라고 한다.SVM은 다른 머신러닝 알고리즘과 비교해서 무엇이 특별한가?사과인지 오렌지인지 분석하는 문제일반적인 사과와 오렌지들은, 클래서파이어에서 멀리 분포한다.정상적이지 않은 것들, 즉 구분하기 힘든 부분에 있는 것들은 클래서파이어 근처에 있게 되며,이 데이터들이 레이블링 되어 있으므로, Ma..

ML(머신러닝) : KNN 개념 정리 및 sklearn 라이브러리의 KNeighborsClassifier 만들기

# K-Nearest Neighbors (K-NN)는 지도 학습 알고리즘 중 하나로, 학습 데이터셋 내에서 새로운 데이터 포인트와 가장 가까운 k개의 이웃을 찾아 해당 이웃들의 라벨 또는 값을 기반으로 예측을 수행 # Logistic Regression과 같은 분류형 내 주위에 몇개의 이웃을 확인해 볼것인가를 결정한다. => K 새로운 데이터가 발생 시, Euclidean distance 에 의해서, 가장 가까운 K 개의 이웃을 택한다. K 개의 이웃의 카테고리를 확인한다. 카테고리의 숫자가 많은 쪽으로, 새로운 데이터의 카테고리를 정해버린다. import pandas as pd # Logistic Regr..

728x90
반응형