본문 바로가기

데이터과학

파이썬에서 데이터 가져오기 및 내보내기

파이썬에서 데이터 불러오기 및 내보내기

1, 데이터 불러오기

의미

- 다양한 Resource에서 파이썬으로 데이터를 로딩 하고 읽는 과정을 의미함

형식(Format)

- .csv, .json, .xlsx, .hdf...

데이터셋의 파일 경로

https://archive.ics.uci.edu/ml/machinelearning-databases/autos/imports-85.data

https://s3-api.us-geo.objectstorage.softlayer.net/cf-courses-data/CognitiveClass/DA0101EN/auto.csv

2. 파이썬으로 CSV 가져오기

- 판다스(Pandas) 라이브러리는 다양한 데이터 세트를

데이터 프레임으로 읽을 수 있는 유용한 도구임

- 주피터 노트북 플랫폼에는 판다스(Pandas) 라이브러리가

내장되어 있으므로 설치하지 않고 판다스(Pandas)

가져오기만 하면 됨

- csv 파일을 읽기 위해 pandas.read_csv () 함수를 사용함

- 괄호 안에는 따옴표와 함께 파일 경로를 입력하여 판다스(Pandas)가 해당 주소의 데이터 프레임으로 파일을 읽음

- 파일 경로는 URL 또는 로컬 파일 주소 가능

 

3. 헤더 없이 CSV 가져오기

- 데이터에 헤더가 포함되어 있지 않기 때문에 read_csv () 메서드 내에 headers = None 인수를 추가하여 판다스(Pandas)가 첫 번째 행을 헤더로 자동 설정하지 않도록 할 수 있음

- 생성한 모든 변수에 데이터 세트를 할당할 수도 있음

 

4. 파이썬에서 데이터 프레임 인쇄하기

- 데이터 세트를 읽은 후 dataframe.head(n) 메서드를 사용하여 데이터 프레임의 상위 n 개 행을 확인할 수 있음(n은 정수)

- dataframe.head(n)과 달리 dataframe.tail(n)은 데이터 프레임의 하단 n 개 행을 표시

- 데이터 세트를 읽은 후 dataframe.head(n) 메서드를 사용하여 데이터 프레임의 상위 n 개 행을 확인할 수 있음(n은 정수)

- dataframe.head(n)과 달리 dataframe.tail(n)은 데이터 프레임의 하단 n 개 행을 표시

 

5. 판다스(Pandas) 데이터 프레임을 CSV로 내보내기

- 판다스(Pandas)를 사용하면 dataframe.to_csv () 메서드를 사용하여 데이터 집합을 csv에 저장할 수 있음

- 괄호 안에 따옴표와 함께 파일 경로와 이름을 추가 할 수 있음

) 데이터 프레임 df를 자동차 .csv로 로컬 컴퓨터에

저장하려면 아래 구문을 사용할 수 있음 - df.to_csv ("automobile.csv", index=False)

 

6. 파이썬에서 다른 형식으로 내보내기

Data Formate Read Save
csv pd.read_csv() df.to_csv()
json pd.read_json() df.to_json()
excel pd.read_excel() df.to_excel()
hdf pd.read_hdf() df.to_hdf()
sql pd.read_sql() df.to_sql()