반응형

value_counts() 3

Pandas 실습 문제 : value_counts() , to_frame(), groupby(), agg() 활용

# 기초개념에서 배운것들을 실습문제를 통해서 복습 뉴욕 airBnB : https://www.kaggle.com/ptoscano230382/air-bnb-ny-2019 DataUrl = ‘https://raw.githubusercontent.com/Datamanim/pandas/main/AB_NYC_2019.csv’ df= pd.read_csv('https://raw.githubusercontent.com/Datamanim/pandas/main/AB_NYC_2019.csv') df 문제) 데이터의 각 host_name의 빈도수를 구하고 host_name으로 정렬하여 상위 5개를 출력하라 df['host_name'].value_counts().head() host_name Michael 417 David ..

Pandas 실습 문제 : 데이터 불러오기 index_col, 인덱스 세팅 set_index, 통계 함수 복습, value_counts() 활용법

# 기초개념에서 배운것들을 실습문제를 통해서 복습 winemag-data-130k-v2.csv 파일을 reviews 로 읽는다. # import import pandas as pd pd.read_csv('../data/winemag-data.csv') ㄴ Unnamed: 0 라고 뜨는것은 인덱스가 컬럼으로 올라온것이라 밑으로 네려줘야함 # index_col= 0 자리에 'Unnamed: 0' 로 적어줘도됨 pd.read_csv('../data/winemag-data.csv' , index_col= 0) # 변수로 저장 df = pd.read_csv('../data/winemag-data.csv' , index_col= 0) 문제) 인덱스를 title 컬럼으로 셋팅한다. # 변수명.set_index('셋팅..

Python Pandas 카테고리컬 데이터 다루기 : groupby() , agg(), value_counts() 함수 활용

# 새로운 데이터 불러오기 # 상위 폴더로 경로 지절할땐 '../' 을 사용 df = pd.read_csv('../data/fake_company.csv') # 중복이 발생하는 데이터 ex) 성별, 나이 등.. # 유니크한 데이터의 개수와 데이터 확인 # 상단에 데이터에서 'Year'을 가지고 실행 df['Year'].unique() array([1990, 1991, 1992], dtype=int64) ㄴ 데이터의 종류는 총 3가지인것 확인 # 유니크한 항목이 몇개인지 숫자로 바로 확인할떄 df['Year'].nunique() 3 # 'Department' 컬럼을 가지고 실행 df['Department'].unique() array..

728x90
반응형