반응형

Def 2

Pandas 실습 문제 : 기초 연산함수 + 데이터 정렬 sort_index()/values(), 문자열 함수 str.contains(), def/apply() 함수 생성 및 적용

# 기초개념에서 배운것들을 실습문제를 통해서 복습 import pandas as pd # 리뷰 데이터를 read해 df 변수로 메모리에 업로드 df = pd.read_csv('../data/winemag-data.csv' , index_col=0) 문제) 리뷰 데이터프레임에서 points 컬럼의 median 값은? df['points'].median() 88.0 # describe()를 통해 한꺼번에 볼수도 있음. median()은 정렬후 정가운데 값이므로 50% 값과 일치 df['points'].describe() count 129971.000000 mean 88.447138 std 3.039730 min 80.000000 25% 86.000000 50% 88.000000 75% 91.000000 ma..

Pandas 데이터프레임 컬럼에 함수(문자열 전용 함수까지) 적용하기 : def와 apply() 사용법

# 데이터 가공할때 사용 ! => 기존의 데이터를 가지고 새로운 컬럼을 만들때 많이 사용 # 고급 함수로 데이터 분석시에 굉장히 중요한 개념 # 이전장 예제에서 사용하였던 데이터를 가지고 실행 # 시급이 30 이상이면 'A' 이고 그렇지 않으면 'B' 라고 해라. = 조건문 // 이전 실습 예시에서 일정 수치보다 큰 데이터를 가져와라 라는것과는 다름 # salary >= 30 : # print('A') # else : # print('B') # 이런 결과를 얻고 싶은것이기 때문에 함수로 만들어서 사용한다. # 예로 35인 그룹은 A로 28인 그룹은 B가 되도록 코드 블록을 만들고 싶다. #get_group(35) # 'A' #get_group(28) # 'B' #..

728x90
반응형