반응형

2024/04/14 10

Pandas로 데이터 정렬하기 : sort_values()와 sort_index() 활용법

# 정렬할 데이터프레임을 먼저 생성하여 df 라는 변수명으로 저장 df = pd.DataFrame({'Employee ID':[111, 222, 333, 444], 'Employee Name':['Chanel', 'Steve', 'Mitch', 'Bird'], 'Salary [$/h]':[35, 29, 38, 20], 'Years of Experience':[3, 4 ,9, 1]}) # 경력을 가지고 오름차순 정렬 => index가 아니라 values 로 df.sort_values('Years of Experience') # 경력을 가지고 내림차순 정렬 ascending= False 를 컬럼명 뒤에 기재 # ascending 의 de..

Pandas 데이터프레임 컬럼에 함수(문자열 전용 함수까지) 적용하기 : def와 apply() 사용법

# 데이터 가공할때 사용 ! => 기존의 데이터를 가지고 새로운 컬럼을 만들때 많이 사용 # 고급 함수로 데이터 분석시에 굉장히 중요한 개념 # 이전장 예제에서 사용하였던 데이터를 가지고 실행 # 시급이 30 이상이면 'A' 이고 그렇지 않으면 'B' 라고 해라. = 조건문 // 이전 실습 예시에서 일정 수치보다 큰 데이터를 가져와라 라는것과는 다름 # salary >= 30 : # print('A') # else : # print('B') # 이런 결과를 얻고 싶은것이기 때문에 함수로 만들어서 사용한다. # 예로 35인 그룹은 A로 28인 그룹은 B가 되도록 코드 블록을 만들고 싶다. #get_group(35) # 'A' #get_group(28) # 'B' #..

Pandas Operations 예제 : 데이터 필터링과 분석 .loc(), .iloc(), 조건부 기호 &, | 활용

import pandas as pd # 예제 실행을 위해 데이터 프레임 생성 df = pd.DataFrame({'Employee ID':[111, 222, 333, 444], 'Employee Name':['Chanel', 'Steve', 'Mitch', 'Bird'], 'Salary [$/h]':[35, 29, 38, 20], 'Years of Experience':[3, 4 ,9, 1]}) # 판다스는 반복문 필요없이 알아서 데이터(행)를 찾아준다. df['Years of Experience'] >= 3 0 True 1 True 2 True 3 False Name: Years of Experience, dt..

728x90
반응형