728x90
반응형

데이터 불러오기 3

Pandas 실습 문제 : 데이터 불러오기 index_col, 인덱스 세팅 set_index, 통계 함수 복습, value_counts() 활용법

# 기초개념에서 배운것들을 실습문제를 통해서 복습 winemag-data-130k-v2.csv 파일을 reviews 로 읽는다. # import import pandas as pd pd.read_csv('../data/winemag-data.csv') ㄴ Unnamed: 0 라고 뜨는것은 인덱스가 컬럼으로 올라온것이라 밑으로 네려줘야함 # index_col= 0 자리에 'Unnamed: 0' 로 적어줘도됨 pd.read_csv('../data/winemag-data.csv' , index_col= 0) # 변수로 저장 df = pd.read_csv('../data/winemag-data.csv' , index_col= 0) 문제) 인덱스를 title 컬럼으로 셋팅한다. # 변수명.set_index('셋팅..

Python Pandas로 데이터 분석 시작하기 : DataFrame 기초

레이블로 생성하기 # 판다스의 2차원 데이터 처리는, 데이터 프레임으로 한다. (DataFrame) # 실제 데이터 분석에서는 csv 파일을 판다스의 데이터 프레임으로 읽어와서 작업한다. # 연습을 위해 예제로 데이터 프레임을 생성하여 분석해 보자. import pandas as pd # We create a dictionary of Pandas Series items = {'Bob' : pd.Series(data = [245, 25, 55], index = ['bike', 'pants', 'watch']), 'Alice' : pd.Series(data = [40, 110, 500, 45], index = ['book', 'glasses', 'bike', 'pants..

Python에서 데이터 저장 및 불러오기 : NumPy의 save와 load 함수 사용법

# 2차원 배열의 데이터 생성 X = np.array([[1, 2] , [3, 4]]) X array([[1, 2], [3, 4]]) # 데이터 저장하기 (save 함수 사용) np.save('my_array', X) - 상단에 첨부한 이미지처럼 최초 실행시 지정하였던 경로의 .npy 형식으로 데이터가 저장된것을 볼수 있다. - .npy 는 NumPy에서 배열을 바이너리 형태로 저장할 때 사용되는 기본 확장자이다. # 데이터 불러오기 (load 함수 사용) Y = np.load('my_array.npy') Y array([[1, 2], [3, 4]])..

728x90
반응형