본문 바로가기

분류 전체보기

(320)
Part03 Chapter.02 데이터 분석 라이브러리 06. Pandas method (실습) Pandas 1. Pandas DataFrame and Operations # pandas 라이브러리를 불러오자. pd를 약칭으로 사용 import pandas as pd import numpy as np DataFrame은 2차원 테이블이고, 테이블의 한 줄(행/열)을 Series라고 함 Series의 모임이 곧, DataFrame # s는 1, 3, 5, np.nan, 6, 8을 원소로 가지는 pandas.Series를 만들자. pd.Series([1,3,5,np.nan,6,8]) 0 1.0 1 3.0 2 5.0 3 NaN 4 6.0 5 8.0 dtype: float64 # nan이 float로 인식, 판다스에서는 한 줄에 같은 데이터 타입, 정수대신 전부 실수로 인식. # 12x4 행렬에 1부터 4..
Part03 Chapter.02 데이터 분석 라이브러리 05. Pandas DataFrame Pandas DataFrame Pandas DataFrame : pandas 라이브러리가 사용하는 기본 자료구조. DataFrame은 2차원 테이블 구조를 말한다. 1차원 구조인 Series 도 있다. (1 row, 1 column) row, column으로 모든 원소를 구분한다. (indexing) index, columns, values라는 객체 변수를 가지고 있다. Relational DB와 완전히 호환됩니다. 하나의 column을 기준으로 모든 원소의 data type이 동일합니다. (모두 numpy array가 가지는 data type과 동일) DataFrame은 numpy array를 상위 호환하는 개념으로 universal function이 사용 가능합니다. → 내부 구현체로 numpy ar..
Part03 Chapter.02 데이터 분석 라이브러리 04. Pandas를 사용하는 이유 Pandas! Pandas : Python Data Analysis Library. 정형 데이터 분석에 최적화된 라이브러리. https://pandas.pydata.org/ pandas - Python Data Analysis Library pandas pandas is a fast, powerful, flexible and easy to use open source data analysis and manipulation tool, built on top of the Python programming language. Install pandas now! pandas.pydata.org 2008년에 만들어졌으며, 2009년에 100% 오픈소스가 되었다. 정형 데이터를 효율적으로 표현할 수 있는 DataFr..
Python_Basic 05 Q1 # 1. 간단한 메모장을 만들어보시오. # input으로 입력받은 내용을 파일에 기록하고 # 입력을 종료하면 파일을 저장한다. # 내용 불러오기 메뉴를 선택하면 기존에 작성했던 메모를 화면에 보여준다. while True: choice = int(input("메뉴를 선택하세요 1. 입력 , 2. 불러오기")) if choice == 1: while True: file = open('memo.txt','a') msg = input("남길 메모 : ") print(msg, file = file) if not msg : # msg == ' ' (msg가 False) file.close break if choice == 2: file2 = open('memo.txt','r') print(file2.read..
Python_Basic_04 # 튜플 # 만들기 test_tuple = tuple() test_tuple2 = ( ) test = (1, 2, 3, 4) type(test) >>> tuple # ? 값이 하나인 튜플 # 만들때 튜플은 괄호 여부와 상관 없이 , 여부를 묶어서 사용한다. test_tuple3 = (1, ) test_tuple3 = 1, len(test_tuple3) # 값 읽기 type(test_tuple3) >>> tuple # 변경 # 튜플은 값 변경이 불가능 하다. # 값 추가 삭제가 불가능 하다. # 용도 자체가 보통 매개변수로 많이 쓰이기 때문이다. test[2] =5 --------------------------------------------------------------------------- Typ..
Part03 Chapter.02 데이터 분석 라이브러리-03. Numpy method (실습) Numpy 1. Numpy Array and Operation numpy의 기본적인 사용법에 대해서 배워봅니다. numpy에서 numpy.array를 만드는 여러가지 방법과 지원하는 연산자에 대해서 공부합니다. 1.1. Numpy Array creation # numpy 라이브러리를 불러옵니다. import numpy as np # 파이썬 리스트 선언 data = [1, 2, 3, 4, 5] # 파이썬 2차원 리스트(행렬) 선언 data2 = [[1,2],[3,4]] # 파이썬 list를 numpy array로 변환합니다. # numpy array를 만드는 방식의 대부분은 파이썬 리스트를 np.array로 변환하는 방식입니다. arr = np.array(data) arr >>> array([1, 2, 3..
배열의 축(axis) 이해하기
고유값(eigenvalue), 고유벡터(eigenvector) 의 정의 정방행렬 A에 대하여 Ax = λx (상수 λ) 가 성립하는 0이 아닌 벡터 x가 존재할 때 상수 λ 를 행렬 A의 고유값 (eigenvalue), x 를 이에 대응하는 고유벡터 (eigenvector) 라고 합니다. 행렬 A에 대한 고유값(eigenvalue) λ ("Lambda", "람다" 라고 읽음)은 특성값(characteristic value), 또는 잠정근(latent root) 라고도 합니다. (eigen은 '고유' 또는 '특성'을 뜻하는 독일어임. '아이겐'이라고 읽음) Ax = λx 를 만족하는 0이 아닌 고유벡터(eigenvector) x 는 특성벡터(characteristic vector) 라고도 합니다. 그리고 행렬 A의 모든 고유값의 집합을 A의 스펙트럼(spectrum) 이라고 ..