본문 바로가기

데이터과학

(5)
파이썬의 시각화 라이브러리 -시본(Seaborn) 파이썬의 시각화 라이브러리 -시본(Seaborn) 파이썬의 대표적인 시각화 도구로는 matplotlib과 seaborn이 있습니다. seaborn은 matplotlib 대비 손쉽게 그래프를 그리고 그래프 스타일 설정을 할 수 있다는 장점이 있습니다. 정교하게 그래프의 크기를 조절하거나 각 축의 범례 값을 조절할 때에는 matplotlib을 함께 사용해야하지만, seaborn 사용법에 익숙해진다면 큰 문제가 되진 않습니다. 아래 표는 Seaborn 라이브러리에서 제공해주는 그래프(plot)의 종류를 정리한 내용입니다. 다양한 종류의 plot을 제공하기 때문에 처음에는 어떤 그래프를 가져다 써야할지 막막합니다. 모든 plot의 사용법을 숙지할 필요는 없습니다. 데이터의 종류가 연속형 데이터인지, 카테고리 데..
파이썬의 시각화 라이브러리 - 맷플롯립(Matplotlib) 파이썬의 시각화 라이브러리 - 맷플롯립(Matplotlib) 플롯(그래프)을 그릴 때 주로 쓰이는 2D, 3D 플롯팅 패키지(모듈) 맷플롯립(Matplotlib)은 데이터를 차트(chart)나 플롯(plot)으로 시각화(visulaization)하는 패키지입니다. 데이터 분석에서 Matplotlib은 데이터 분석 이전에 데이터 이해를 위한 시각화나, 데이터 분석 후에 결과를 시각화하기 위해서 사용됩니다. 아나콘다를 설치하지 않았다면 아래의 커맨드로 Matplotlib를 별도 설치할 수 있습니다. pip install matplotlib > ipython ... In [1]: import matplotlib as mpl In [2]: mpl.__version__ Out[2]: '2.2.3' Matplotl..
파이썬의 컴퓨팅 라이브러리 - 사이파이(SciPy) SciPy SciPy('사이파이'라고 읽음)는 과학기술계산을 위한 Python 라이브러리이다. NumPy, Matplotlib, pandas, SymPy와 연계되어 있다(특히 NumPy와). 가능한 알고리즘과 관련 부패키지는 다음과 같다. Clustering package (scipy.cluster) Constants (scipy.constants) Discrete Fourier transforms (scipy.fftpack) Integration and ODEs (scipy.integrate) Interpolation (scipy.interpolate) Input and output (scipy.io) Linear algebra (scipy.linalg) Miscellaneous routines (sc..
파이썬의 컴퓨팅 라이브러리 - 넘파이(NumPy) 파이썬의 컴퓨팅 라이브러리 - 넘파이(NumPy) - Numerical Python의 줄임말로 파이썬에서 컴퓨팅과 데이터 분석 등에 이용 - 배열을 만들고 연산을 하고 랜덤 넘버 생성 - 구조화된 데이터나 표형식의 데이터 분석 시 이용 넘파이(Numpy)는 수치 데이터를 다루는 파이썬 패키지입니다. Numpy의 핵심이라고 불리는 다차원 행렬 자료구조인 ndarray를 통해 벡터 및 행렬을 사용하는 선형 대수 계산에서 주로 사용됩니다. Numpy는 편의성뿐만 아니라, 속도면에서도 순수 파이썬에 비해 압도적으로 빠르다는 장점이 있습니다. 아나콘다를 설치하지 않았다면 아래의 커맨드로 Numpy를 별도 설치할 수 있습니다. pip install numpy > ipython ... In [1]: import nu..
파이썬에서 데이터 가져오기 및 내보내기 파이썬에서 데이터 불러오기 및 내보내기 1, 데이터 불러오기 의미 - 다양한 Resource에서 파이썬으로 데이터를 로딩 하고 읽는 과정을 의미함 형식(Format) - .csv, .json, .xlsx, .hdf... 데이터셋의 파일 경로 https://archive.ics.uci.edu/ml/machinelearning-databases/autos/imports-85.data https://s3-api.us-geo.objectstorage.softlayer.net/cf-courses-data/CognitiveClass/DA0101EN/auto.csv 2. 파이썬으로 CSV 가져오기 - 판다스(Pandas) 라이브러리는 다양한 데이터 세트를 데이터 프레임으로 읽을 수 있는 유용한 도구임 - 주피터 노트..