반응형

데이터 다루기 3

Pandas 실습 문제 : 데이터 columns 다루기 및 read(encoding) 사용법과 기초 함수 복습

# 기초개념에서 배운것들을 실습문제를 통해서 복습 import pandas as pd 롤 랭킹 데이터 : https://www.kaggle.com/datasnaek/league-of-legends DataUrl = ‘https://raw.githubusercontent.com/Datamanim/pandas/main/lol.csv’ DataUrl = 'https://raw.githubusercontent.com/Datamanim/pandas/main/lol.csv' df = pd.read_csv(DataUrl, sep='\t') ㄴ pd.read_csv() 함수는 기본적으로 쉼표(,)로 구분된 CSV 파일을 읽는다. 그러나 데이터 파일이 쉼표 외의 다른 구분자(예: 탭, 공백 등)로 구분되어 있다면 sep..

Pandas 실습 문제 : nparray[], loc, iloc, 조건부 기호 &, |, 기초 함수 및 데이터 다루기 복습

# 기초개념에서 배운것들을 실습문제를 통해서 복습 winemag-data-130k-v2.csv 파일을 reviews 로 읽는다. import pandas as pd df = pd.read_csv('../data/winemag-data_first150k.csv' , index_col= 0) # Unnamed: 0 이런 형태로 컬럼에 올라오는 형태는 인덱스가 컬럼으로 올라온것임 # 그럴땐 index_col= 0 을 사용하여 불러오면 정상적으로 출력됨 # 분석을 위해 해당 데이터의 기술 통계 확인 df.describe() 문제) 리뷰의 디스크립션 컬럼을 desc 로 저장한다. desc = df['description'] desc 0 This tremendous 100% varietal wine hails fr..

Python Pandas로 데이터 다루기 : 데이터 액서스 .loc, .iloc 및 기본 인덱싱 방법

import pandas as pd # We create a list of Python dictionaries items2 = [{'bikes': 20, 'pants': 30, 'watches': 35}, {'watches': 10, 'glasses': 50, 'bikes': 15, 'pants':5}] # 상단에서 생성한 items2 딕셔너리를 데이터프레임으로 변환 df = pd.DataFrame(data= items2, index= ['store 1', 'store 2']) df ### 가장 중요한것!!! "데이터 프레임" 에서 원하는 데이터를 억세스 하는..

728x90
반응형