반응형

PYTHON LIBRARY 29

프로젝트(범죄현황) 연습(2) : Pandas pivot_table 익혀서 범죄 데이터에 적용 및 데이터 시각화

- 바로 이전 프로젝트 연습예제문을 이어서 진행 # 구이름을 인덱스로 만들려는데# 인덱스는 유니크해야 하므로 구이름이 중복된 값은 모든 데이터 값을 합친다# 그러기 위한 방법이 pivot_table ( 데이터프레임의 데이터를 피벗하여 요약하는 데 사용) import pandas as pdimport numpy as np # 피봇팅 한다. 즉 컬럼의 값을 인덱스로 만들되, # 인덱스를 중복제거하여 유니크 하게 만드는 방법# 새로운 데이터로 코딩 한다. df_test = pd.read_excel('../data/sales-funnel.xlsx')df_test # Name 열을 가지고 하나로 합쳐서 인덱스로 만들고 싶을때#기본적으로 동일한 데이터를 합칠때, 숫자 데이터를 default 평균으로 출력한다 pd...

프로젝트(범죄현황) 연습(1) : 데이터 주무르기, API 키 생성 활용(googlemaps.Client())

레퍼런스 : 파이썬으로 데이터 주무르기# 이전장에서 사용했던 CCTV 데이터 불러와서 시작df_cctv = pd.read_csv('../데이터분석2/CCTV_result.csv')df_cctv 서울시 구별 범죄 발생과 검거율 데이터 분석'서울시 관서별 5대 범죄 발생 검거 현황' 파일을 가지고 분석합니다. # 한글 찍기import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport seaborn as sb%matplotlib inlineimport platformfrom matplotlib import font_manager, rcplt.rcParams['axes.unicode_minus'] = Falseif platform.syste..

프로젝트(CCTV설치) 연습 : 데이터를 분석 가공하여 상관관계 분석(.corr())과 데이터 시각화까지

# 실습전 기본 라이브러리 및 한글 찍기 import import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sb %matplotlib inline import platform from matplotlib import font_manager, rc plt.rcParams['axes.unicode_minus'] = False if platform.system() == 'Darwin': rc('font', family='AppleGothic') elif platform.system() == 'Windows': path = "c:/Windows/Fonts/malgun.ttf" font_name = font_..

프로젝트(대중교통) 연습 : 데이터를 분석하여 파이차트 그리기 plt.pie()

# 실행전 기본 라이브러리 및 한글 찍기 import import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sb %matplotlib inline import platform from matplotlib import font_manager, rc plt.rcParams['axes.unicode_minus'] = False if platform.system() == 'Darwin': rc('font', family='AppleGothic') elif platform.system() == 'Windows': path = "c:/Windows/Fonts/malgun.ttf" font_name = font_..

프로젝트(기온데이터분석) 연습 : 데이터 가공하여 히스토그램, 산점도 그리기 plt.hist() , plt.scatter()

# 실행에 필요한 기본 항목과 한글 인식하게하는 라이브러리 까지 한꺼번에 import import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sb %matplotlib inline import platform from matplotlib import font_manager, rc plt.rcParams['axes.unicode_minus'] = False if platform.system() == 'Darwin': rc('font', family='AppleGothic') elif platform.system() == 'Windows': path = "c:/Windows/Fonts/malgun.ttf"..

Python 데이터 시각화 : Matplotlib와 Seaborn 으로 Plot, Bar 차트 그리기

# Pandas를 통해서 가공한 데이터를 가지고 차트로 데이터 시각화를 할수있다 Tidy Data : 데이터 분석과 시각화에 적합한 형식으로 데이터를 정리한 것 each variable(변수) is a column (컬럼은 형식) each observation(하나의 행 => 행은 데이터) is a row each type of observational unit is a table # 파이썬에서 2D 그래픽을 생성하는 데 사용되는 라이브러리 # 다양한 유형의 그래프와 플롯을 만들 수 있으며, 데이터 분석 및 시각화 작업에서 널리 사용된다 # ref : 참고 레퍼런스 https://matplotlib.org/gallery.html#scales https://seaborn.pyda..

Pandas 실습 문제 : value_counts() , to_frame(), groupby(), agg() 활용

# 기초개념에서 배운것들을 실습문제를 통해서 복습 뉴욕 airBnB : https://www.kaggle.com/ptoscano230382/air-bnb-ny-2019 DataUrl = ‘https://raw.githubusercontent.com/Datamanim/pandas/main/AB_NYC_2019.csv’ df= pd.read_csv('https://raw.githubusercontent.com/Datamanim/pandas/main/AB_NYC_2019.csv') df 문제) 데이터의 각 host_name의 빈도수를 구하고 host_name으로 정렬하여 상위 5개를 출력하라 df['host_name'].value_counts().head() host_name Michael 417 David ..

728x90
반응형