본문 바로가기

Machine Learning/머신러닝 완벽가이드 for Python

(65)
ch.2.3 사이킷런 프레임워크 붓꽃 데이터 분류 예측 프로세스 사이킷런 기반 프레임 워크 - Estimator(추정량) 와 fit(), predict() cf) Pycaret 을 통해 여러 머신러닝 방법 중에 효율적인 방법을 찾을 수 있다. https://pycaret.org/ Home - PyCaret With PyCaret, you don’t have to leave your Notebook. Train your model, analyze it, iterate faster than ever before, and deploy it instantaneously as a REST API or even build a simple front-end ML app. All from the comfort of your Notebook. pyca..
ch 2.2 첫 번째 머신러닝 만들어 보기 - 붓꽃 품종 예측하기(실습) 1 사이킷런을 이용하여 붓꽃(Iris) 데이터 품종 예측하기 # 사이킷런 버전 확인 import sklearn print(sklearn.__version__) >>> 1.0.2 ** 붓꽃 예측을 위한 사이킷런 필요 모듈 로딩 ** from sklearn.datasets import load_iris # iris 데이터 로드 from sklearn.tree import DecisionTreeClassifier # 의사결정나무 분류기 from sklearn.model_selection import train_test_split # 학습,테스트 데이터 분리 2 데이터 세트를 로딩 import pandas as pd # 붓꽃 데이터 세트를 로딩합니다. iris = load_iris() iris 더보기 {'dat..
ch.2.1~2.2 사이킷런 소개, 머신러닝 Iris 품종 예측 CH 2.1 사이킷런 소개 파이썬 기반의 다른 머신러닝 패키지도 사이킷런 스타일의 API를 지향할 정도로 가장 파이썬스러운 API를 제공 머신러닝을 위한 매우 다양한 알고리즘과개발을 위한 편리한 프레임워크와 API를 제공합니 다 오랜 기간 실전 환경에서 검증됐으며, 매우 많은 환겅에서 사용되는성숙한 라이브러리입니다 주로 Numpy와 Scipy 기반 위에서 구축된 라이브러리 사이킷런을 이용하여 붓꽃 데이터 분류 사이킷런을 통해 젓 번째로 만들어볼 머신러닝 모델은 붓꽂 데이터 세트로 붓꽂의 품종을 분류(Classification) 하는 것입니다. 붓꽃 데이터 세트는 꽂잎의 길이와 너비, 꽂받침의 길이와 너비 피쳐(Feature) 를 기반으로 꽃의 품종을 예즉하기 위한 것입니다. 알고리즘도 중요하지만 피쳐(특..
ch.1.5 정리 1장 Summary 머신러닝이란 애플리케이선을수정하지 않고도 데이터를 기반으로패턴을학습하고 길과를추론하는 알고리즘 기법을 통칭합니다, 직관적인 문법, 많은 라이브러리, 뛰어난 생산성을 가지는파이썬 언어를 기반으로한 머신러닝 애플리게이션은 유연성, 통합성 등의 많은 장점을 사용자에게 제공해 줍니다. 파이썬 기반의 머신러닝을 익히기 위해서는 비단 머신러닝 패키지 뿐만아니라, 넘파이, 판다스, 시각화 등의 다양한지원 패키지들도 같이 학습되어야 합니다. 단 이들 지원 패키지들 익히기 위해서 많은 시간을 투자할 필요는 없습니다. 기본 내용은 숙지하되, 상세한 사용법은 머신러닝 애플리케이션을 작성하면서 인터넷 등을 통해 찾아 가면서 구현하는 것이 이들 지원패키지들 빨리 익히는데 도움이 더 될 것입니다.
ch 1.4 판다스(실습) 1 Pandas 시작- 파일을 DataFrame 로딩, 기본 API import pandas as pd read_csv() read_csv()를 이용하여 csv 파일을 편리하게 DataFrame으로 로딩합니다. read_csv() 의 sep 인자를 콤마(,)가 아닌 다른 분리자로 변경하여 다른 유형의 파일도 로드가 가능합니다. titanic_df = pd.read_csv("C:/Users/JIN SEONG EUN/OneDrive/바탕 화면/빅데이터 분석가 과정/머신러닝/타이타닉 데이터/titanic_train.csv") print('titanic 변수 type:',type(titanic_df)) ** DataFrame의 생성 ** 딕셔너리로 데이터 프레임을 생성할 수 있다. dic1 = {'Name': ..
ch.1.4 판다스(이론) 판다스의 이해 판다스 (Pandas) 판다스는파이썬에서 데이터 처리를 위해 존재하는 가장 인기 있는 라이브러리입니다. 일반적으로 대부분의 데이터 세트는 2 자원 데이터입니다. 즉, 행 (Row) X 열 (Column) 로 구성돼 있습니다(RDBMS의 TABLE 이나 엑셀의 시트를 떠올리면 됩니다). 행과 열의 2 자원 데이터가 인기 있는 이유는 바로 인간이 가장 이해하기 쉬운 데이터 구조이면서도 효과적으로 데이터를 담을수 있는 구조이기 때문입니다. 판다스는 이저럼 행과 열로 이뤄진 2차원 데이터를효율적으로 가공/ 처리 할수 있는 다양하고 훌륭한 기능을 제공합니다. 판다스의 주요 구성 요소 - DataFrame, Series, Index 기본 API • read_csv( ) • head( ) • shape..
ch1.3 넘파이(실습) 1 Numpy ndarray 개요 ndarray 생성 np.array( ) import numpy as np list1 = [1, 2, 3] print("list1:", list1) print("list1 type:", type(list1)) >>> list1: [1, 2, 3] list1 type: array1 = np.array(list1) print("array1:", array1) print("array1 type:", type(array1)) >>> array1: [1 2 3] array1 type: ndarray 의 형태(shape)와 차원 # 1차원 ndarray array1 = np.array([1,2,3]) print('array1 type:',type(array1)) print('arr..
ch.1.3 넘파이(이론) ch.1.3 넘파이 넘파이 ndarray 소개 넘파이 ndarray ndarray: N차원(Dimension) 배열(Array) 객체 ndarray 생성 Numpy 모듈의 array( ) 함수로 생성 인자로 주로 파이썬 list 또는 ndarray 입력 import numpy as np arrayl = np.array( [1, 2, 3] ) array2 = np.array( [[1, 2, 3], [1 2 3] (2, 3, 4]] ) array1 [1 2 3] array2 [[1 2 3] [4 5 6]] ndarray 형태 (Shape)와 차원 ndarray의 shape 는 ndarray.shape 속성으로, 자원은 ndarray.ndim 속성으로 알수 있습니다. ndarray 타입 (type) ndarr..