파이썬에서 데이터 불러오기 및 내보내기
1, 데이터 불러오기
의미
- 다양한 Resource에서 파이썬으로 데이터를 로딩 하고 읽는 과정을 의미함
형식(Format)
- .csv, .json, .xlsx, .hdf...
데이터셋의 파일 경로
https://archive.ics.uci.edu/ml/machinelearning-databases/autos/imports-85.data
https://s3-api.us-geo.objectstorage.softlayer.net/cf-courses-data/CognitiveClass/DA0101EN/auto.csv
2. 파이썬으로 CSV 가져오기
- 판다스(Pandas) 라이브러리는 다양한 데이터 세트를
데이터 프레임으로 읽을 수 있는 유용한 도구임
- 주피터 노트북 플랫폼에는 판다스(Pandas) 라이브러리가
내장되어 있으므로 설치하지 않고 판다스(Pandas)를
가져오기만 하면 됨
- csv 파일을 읽기 위해 pandas.read_csv () 함수를 사용함
- 괄호 안에는 따옴표와 함께 파일 경로를 입력하여 판다스(Pandas)가 해당 주소의 데이터 프레임으로 파일을 읽음
- 파일 경로는 URL 또는 로컬 파일 주소 가능
3. 헤더 없이 CSV 가져오기
- 데이터에 헤더가 포함되어 있지 않기 때문에 read_csv () 메서드 내에 headers = None 인수를 추가하여 판다스(Pandas)가 첫 번째 행을 헤더로 자동 설정하지 않도록 할 수 있음
- 생성한 모든 변수에 데이터 세트를 할당할 수도 있음
4. 파이썬에서 데이터 프레임 인쇄하기
- 데이터 세트를 읽은 후 dataframe.head(n) 메서드를 사용하여 데이터 프레임의 상위 n 개 행을 확인할 수 있음(n은 정수)
- dataframe.head(n)과 달리 dataframe.tail(n)은 데이터 프레임의 하단 n 개 행을 표시
- 데이터 세트를 읽은 후 dataframe.head(n) 메서드를 사용하여 데이터 프레임의 상위 n 개 행을 확인할 수 있음(n은 정수)
- dataframe.head(n)과 달리 dataframe.tail(n)은 데이터 프레임의 하단 n 개 행을 표시
5. 판다스(Pandas) 데이터 프레임을 CSV로 내보내기
- 판다스(Pandas)를 사용하면 dataframe.to_csv () 메서드를 사용하여 데이터 집합을 csv에 저장할 수 있음
- 괄호 안에 따옴표와 함께 파일 경로와 이름을 추가 할 수 있음
예) 데이터 프레임 df를 자동차 .csv로 로컬 컴퓨터에
저장하려면 아래 구문을 사용할 수 있음 - df.to_csv ("automobile.csv", index=False)
6. 파이썬에서 다른 형식으로 내보내기
Data Formate | Read | Save |
csv | pd.read_csv() | df.to_csv() |
json | pd.read_json() | df.to_json() |
excel | pd.read_excel() | df.to_excel() |
hdf | pd.read_hdf() | df.to_hdf() |
sql | pd.read_sql() | df.to_sql() |
'데이터과학' 카테고리의 다른 글
파이썬의 시각화 라이브러리 -시본(Seaborn) (0) | 2021.06.08 |
---|---|
파이썬의 시각화 라이브러리 - 맷플롯립(Matplotlib) (0) | 2021.06.08 |
파이썬의 컴퓨팅 라이브러리 - 사이파이(SciPy) (0) | 2021.06.08 |
파이썬의 컴퓨팅 라이브러리 - 넘파이(NumPy) (1) | 2021.06.08 |