728x90
반응형

python pandas 5

Python Pandas 카테고리컬 데이터 다루기 : groupby() , agg(), value_counts() 함수 활용

# 새로운 데이터 불러오기 # 상위 폴더로 경로 지절할땐 '../' 을 사용 df = pd.read_csv('../data/fake_company.csv') # 중복이 발생하는 데이터 ex) 성별, 나이 등.. # 유니크한 데이터의 개수와 데이터 확인 # 상단에 데이터에서 'Year'을 가지고 실행 df['Year'].unique() array([1990, 1991, 1992], dtype=int64) ㄴ 데이터의 종류는 총 3가지인것 확인 # 유니크한 항목이 몇개인지 숫자로 바로 확인할떄 df['Year'].nunique() 3 # 'Department' 컬럼을 가지고 실행 df['Department'].unique() array..

Python Pandas로 결측치 데이터 처리하기: NaN 처리 isna(), notna(), dropna(), fillna()

# We create a list of Python dictionaries # 실습전 데이터 프레임에 사용할 item2 변수 생성 items2 = [{'bikes': 20, 'pants': 30, 'watches': 35, 'shirts': 15, 'shoes':8, 'suits':45}, {'watches': 10, 'glasses': 50, 'bikes': 15, 'pants':5, 'shirts': 2, 'shoes':5, 'suits':7}, {'bikes': 20, 'pants': 30, 'watches': 35, 'glasses': 4, 'shoes':10}] # 비어있는 데이터를 어떻게 처리할 것인가??? df = pd.DataFrame(data= ite..

Python Pandas로 데이터 다루기 : 데이터 액서스 .loc, .iloc 및 기본 인덱싱 방법

import pandas as pd # We create a list of Python dictionaries items2 = [{'bikes': 20, 'pants': 30, 'watches': 35}, {'watches': 10, 'glasses': 50, 'bikes': 15, 'pants':5}] # 상단에서 생성한 items2 딕셔너리를 데이터프레임으로 변환 df = pd.DataFrame(data= items2, index= ['store 1', 'store 2']) df ### 가장 중요한것!!! "데이터 프레임" 에서 원하는 데이터를 억세스 하는..

Python Pandas로 데이터 분석 시작하기 : DataFrame 기초

레이블로 생성하기 # 판다스의 2차원 데이터 처리는, 데이터 프레임으로 한다. (DataFrame) # 실제 데이터 분석에서는 csv 파일을 판다스의 데이터 프레임으로 읽어와서 작업한다. # 연습을 위해 예제로 데이터 프레임을 생성하여 분석해 보자. import pandas as pd # We create a dictionary of Pandas Series items = {'Bob' : pd.Series(data = [245, 25, 55], index = ['bike', 'pants', 'watch']), 'Alice' : pd.Series(data = [40, 110, 500, 45], index = ['book', 'glasses', 'bike', 'pants..

Python Pandas로 데이터 처리하기 : 시리즈의 레이블 접근과 산술 연산

# Pandas Series에서의 데이터 접근과 삭제 # 이전장에서 사용하였던 데이터를 사용하여 진행 groceries eggs 30 apples 6 milk Yes bread No dtype: object # 판다스에서는 인덱스 수를 계산하여 부를 필요없이 지정된 명칭을 사용하면 된다. groceries['eggs'] 30 groceries['bread'] 'No' # 따로 출력되는 값을 불러올때는, list 로 묶음 처리를 하여 활용 groceries[['eggs','bread']] eggs 30 bread No dtype: object groceries['apples' : 'bread'..

728x90
반응형