반응형

PYTHON LIBRARY/Pandas Library 11

Python Pandas로 데이터 다루기 : 데이터 액서스 .loc, .iloc 및 기본 인덱싱 방법

import pandas as pd # We create a list of Python dictionaries items2 = [{'bikes': 20, 'pants': 30, 'watches': 35}, {'watches': 10, 'glasses': 50, 'bikes': 15, 'pants':5}] # 상단에서 생성한 items2 딕셔너리를 데이터프레임으로 변환 df = pd.DataFrame(data= items2, index= ['store 1', 'store 2']) df ### 가장 중요한것!!! "데이터 프레임" 에서 원하는 데이터를 억세스 하는..

Python Pandas로 데이터 분석 시작하기 : DataFrame 기초

레이블로 생성하기 # 판다스의 2차원 데이터 처리는, 데이터 프레임으로 한다. (DataFrame) # 실제 데이터 분석에서는 csv 파일을 판다스의 데이터 프레임으로 읽어와서 작업한다. # 연습을 위해 예제로 데이터 프레임을 생성하여 분석해 보자. import pandas as pd # We create a dictionary of Pandas Series items = {'Bob' : pd.Series(data = [245, 25, 55], index = ['bike', 'pants', 'watch']), 'Alice' : pd.Series(data = [40, 110, 500, 45], index = ['book', 'glasses', 'bike', 'pants..

Python Pandas로 데이터 처리하기 : 시리즈의 레이블 접근과 산술 연산

# Pandas Series에서의 데이터 접근과 삭제 # 이전장에서 사용하였던 데이터를 사용하여 진행 groceries eggs 30 apples 6 milk Yes bread No dtype: object # 판다스에서는 인덱스 수를 계산하여 부를 필요없이 지정된 명칭을 사용하면 된다. groceries['eggs'] 30 groceries['bread'] 'No' # 따로 출력되는 값을 불러올때는, list 로 묶음 처리를 하여 활용 groceries[['eggs','bread']] eggs 30 bread No dtype: object groceries['apples' : 'bread'..

Python Pandas로 시작하는 데이터 분석 : Series 데이터 생성 pd.Series()

Pandas 의 장점 Allows the use of labels for rows and columns 기본적인 통계데이터 제공 NaN values 를 알아서 처리함. 숫자 문자열을 알아서 로드함. 데이터셋들을 merge 할 수 있음. It integrates with NumPy and Matplotlib # 파이썬의 라이브러리 # 판다스는 넘파이를 확장해서 만든 데이터 스트렉쳐 / numpy는 기계 친화적 (숫자로 구성됨) # 판다스는 넘파이를 포함하고 있다 import pandas as pd index = ['eggs', 'apples', 'milk', 'bread'] data = [30, 6, 'Yes', 'No'] # numpy에서 1차원 데이터 벡..

728x90
반응형