728x90
반응형

Python 12

Python Pandas로 데이터 다루기 : 데이터 액서스 .loc, .iloc 및 기본 인덱싱 방법

import pandas as pd # We create a list of Python dictionaries items2 = [{'bikes': 20, 'pants': 30, 'watches': 35}, {'watches': 10, 'glasses': 50, 'bikes': 15, 'pants':5}] # 상단에서 생성한 items2 딕셔너리를 데이터프레임으로 변환 df = pd.DataFrame(data= items2, index= ['store 1', 'store 2']) df ### 가장 중요한것!!! "데이터 프레임" 에서 원하는 데이터를 억세스 하는..

Python Pandas로 시작하는 데이터 분석 : Series 데이터 생성 pd.Series()

Pandas 의 장점 Allows the use of labels for rows and columns 기본적인 통계데이터 제공 NaN values 를 알아서 처리함. 숫자 문자열을 알아서 로드함. 데이터셋들을 merge 할 수 있음. It integrates with NumPy and Matplotlib # 파이썬의 라이브러리 # 판다스는 넘파이를 확장해서 만든 데이터 스트렉쳐 / numpy는 기계 친화적 (숫자로 구성됨) # 판다스는 넘파이를 포함하고 있다 import pandas as pd index = ['eggs', 'apples', 'milk', 'bread'] data = [30, 6, 'Yes', 'No'] # numpy에서 1차원 데이터 벡..

Python NumPy의 기본 함수와 메서드 : 배열 생성부터 형태 변환까지

# zeros() 함수를 사용하여 0으로만 구성된 벡터 (Vector) 생성 np.zeros( 5 ) array([0., 0., 0., 0., 0.]) # 3행 4열짜리, 0으로 되어있는 행렬 (Matrix) 생성 np.zeros( (3,4) ) array([[0., 0., 0., 0.], [0., 0., 0., 0.], [0., 0., 0., 0.]]) # ones() 함수를 사용하여 1로만 구성된 벡터 (Vector) 생성 np.ones( 7 ) array([1., 1., 1., 1., 1., 1., 1.]) # 4행 5열짜리, 1로 되어있는 행렬 (Matrix) 생성 np.ones((4,5)) array([[1., 1., 1., 1., 1.], [1., 1., 1., 1., 1.], [1., 1.,..

Python에서 데이터 저장 및 불러오기 : NumPy의 save와 load 함수 사용법

# 2차원 배열의 데이터 생성 X = np.array([[1, 2] , [3, 4]]) X array([[1, 2], [3, 4]]) # 데이터 저장하기 (save 함수 사용) np.save('my_array', X) - 상단에 첨부한 이미지처럼 최초 실행시 지정하였던 경로의 .npy 형식으로 데이터가 저장된것을 볼수 있다. - .npy 는 NumPy에서 배열을 바이너리 형태로 저장할 때 사용되는 기본 확장자이다. # 데이터 불러오기 (load 함수 사용) Y = np.load('my_array.npy') Y array([[1, 2], [3, 4]])..

Python과 NumPy 기초 : 다차원 배열과 선형대수학 라이브러리 시작하기

NUMPY BASICS NumPy는 다차원 배열을 처리할 수 있는 선형대수학(Linear Algebra) 라이브러리입니다. 다음이 실행이 안되면 아나콘다프롬프트에서 conda install numpy 를 실행하여 설치합니다. 1차원 배열 = 벡터 (Vector) / 2차원 배열 = 행렬 (Matrix) score_list = [100, 90, 75, 66, 98] # 리스트 마지막에 값을 추가할떄 .append 사용 score_list.append(58) [100, 90, 75, 66, 98, 58] # 삭제할때는 변수명 앞에 del를 붙여서 사용 ** index 위치를 [] 안에 기재해 줘야함 del score_list[5] [100, 90, 75, 66, 98] # 합계 sum(score_list) ..

728x90
반응형