본문 바로가기

Python

(57)
Part03 Chapter.02 데이터 분석 라이브러리 07. Seaborn을 사용하는 이유 Seaborn Seaborn : Statistical Data Visualization library based on matplotlib. Matplotlib 파이썬 오픈소스 라이브러리 중에 가장 널리 사용되는 시각화 라이브러리이다. 2002년부터 만들어졌으며, MATLAB의 기능들을 파이썬으로 가져오는 컨셉으로 시작되었다. 각종 논문에서 figure를 그릴 때, 사용될 만큼 깔끔하게 그래프를 그려주는 것으로 유명하다. figure 라는 도화지에 여러가지 component를 얹어서 그래프를 완성하는 컨셉으로 구현된다. 크게 pyplot 을 이용하여 구현하는 방법과 OOP-style 를 이용하여 구현하는 두 가지 방법이 있다. 빠르게 적당한 퀄리티의 그래프를 그린다면 pyplot을, 디테일하게 이것저것 표..
Part03 Chapter.02 데이터 분석 라이브러리 06. Pandas method (실습) Pandas 1. Pandas DataFrame and Operations # pandas 라이브러리를 불러오자. pd를 약칭으로 사용 import pandas as pd import numpy as np DataFrame은 2차원 테이블이고, 테이블의 한 줄(행/열)을 Series라고 함 Series의 모임이 곧, DataFrame # s는 1, 3, 5, np.nan, 6, 8을 원소로 가지는 pandas.Series를 만들자. pd.Series([1,3,5,np.nan,6,8]) 0 1.0 1 3.0 2 5.0 3 NaN 4 6.0 5 8.0 dtype: float64 # nan이 float로 인식, 판다스에서는 한 줄에 같은 데이터 타입, 정수대신 전부 실수로 인식. # 12x4 행렬에 1부터 4..
Part03 Chapter.02 데이터 분석 라이브러리 05. Pandas DataFrame Pandas DataFrame Pandas DataFrame : pandas 라이브러리가 사용하는 기본 자료구조. DataFrame은 2차원 테이블 구조를 말한다. 1차원 구조인 Series 도 있다. (1 row, 1 column) row, column으로 모든 원소를 구분한다. (indexing) index, columns, values라는 객체 변수를 가지고 있다. Relational DB와 완전히 호환됩니다. 하나의 column을 기준으로 모든 원소의 data type이 동일합니다. (모두 numpy array가 가지는 data type과 동일) DataFrame은 numpy array를 상위 호환하는 개념으로 universal function이 사용 가능합니다. → 내부 구현체로 numpy ar..
Part03 Chapter.02 데이터 분석 라이브러리 04. Pandas를 사용하는 이유 Pandas! Pandas : Python Data Analysis Library. 정형 데이터 분석에 최적화된 라이브러리. https://pandas.pydata.org/ pandas - Python Data Analysis Library pandas pandas is a fast, powerful, flexible and easy to use open source data analysis and manipulation tool, built on top of the Python programming language. Install pandas now! pandas.pydata.org 2008년에 만들어졌으며, 2009년에 100% 오픈소스가 되었다. 정형 데이터를 효율적으로 표현할 수 있는 DataFr..
Python_Basic 05 Q1 # 1. 간단한 메모장을 만들어보시오. # input으로 입력받은 내용을 파일에 기록하고 # 입력을 종료하면 파일을 저장한다. # 내용 불러오기 메뉴를 선택하면 기존에 작성했던 메모를 화면에 보여준다. while True: choice = int(input("메뉴를 선택하세요 1. 입력 , 2. 불러오기")) if choice == 1: while True: file = open('memo.txt','a') msg = input("남길 메모 : ") print(msg, file = file) if not msg : # msg == ' ' (msg가 False) file.close break if choice == 2: file2 = open('memo.txt','r') print(file2.read..
Python_Basic_04 # 튜플 # 만들기 test_tuple = tuple() test_tuple2 = ( ) test = (1, 2, 3, 4) type(test) >>> tuple # ? 값이 하나인 튜플 # 만들때 튜플은 괄호 여부와 상관 없이 , 여부를 묶어서 사용한다. test_tuple3 = (1, ) test_tuple3 = 1, len(test_tuple3) # 값 읽기 type(test_tuple3) >>> tuple # 변경 # 튜플은 값 변경이 불가능 하다. # 값 추가 삭제가 불가능 하다. # 용도 자체가 보통 매개변수로 많이 쓰이기 때문이다. test[2] =5 --------------------------------------------------------------------------- Typ..
Part03 Chapter.02 데이터 분석 라이브러리-03. Numpy method (실습) Numpy 1. Numpy Array and Operation numpy의 기본적인 사용법에 대해서 배워봅니다. numpy에서 numpy.array를 만드는 여러가지 방법과 지원하는 연산자에 대해서 공부합니다. 1.1. Numpy Array creation # numpy 라이브러리를 불러옵니다. import numpy as np # 파이썬 리스트 선언 data = [1, 2, 3, 4, 5] # 파이썬 2차원 리스트(행렬) 선언 data2 = [[1,2],[3,4]] # 파이썬 list를 numpy array로 변환합니다. # numpy array를 만드는 방식의 대부분은 파이썬 리스트를 np.array로 변환하는 방식입니다. arr = np.array(data) arr >>> array([1, 2, 3..
배열의 축(axis) 이해하기