Machine Learning (95) 썸네일형 리스트형 CH08.05 감성 분석 보호되어 있는 글입니다. CH08.04 텍스트 분류 실습 - 20 뉴스그룹 분류 보호되어 있는 글입니다. CH08.03 Bag of words - BOW 보호되어 있는 글입니다. CH08.02 텍스트 사전 준비작업(텍스트 전처리) - 텍스트 정규화 보호되어 있는 글입니다. CH08.01 텍스트 분석의 이해 보호되어 있는 글입니다. Recommation System ch3. 장바구니 분석 추천시스템 종류 연관 분석(장바구니 분석)이란? 상품 간 연관 찾기 1. Frequent - 상품 A와 B가 얼마나 같이 구매되는가? 2. A & B - 상품 A를 구매하는 사람이 B도 구매하는가? 예시 - 월마트의 맥주-기저귀 진열 연관 분석의 평가 지표 : Support, Confidence, Lift 1. 지지도(Support) (=교집합) - 정의 : 전체 거래(N) 중 item A와 B를 동시에 포함하는 거래 비율. S(A->B) - 해석 : 지지도가 높을수록 item A와 B를 함께 구매할 가능성이 높다. - 사용 : 빈발 아이템 집합(frequent item sets)을 찾거나 불필요한 연산을 줄일 때(pruning) 사용 2. 신뢰도(Confidence) (=조건부 확률) - 정의 : it.. Recommation System ch2. 추천 시스템 준비 ch2. 추천시스템 준비 Jaccard index (similarity) 두 집합 사이의 유사도를 측정하는 방법 자카드 지수는 0과 1 사이의 값을 가지며, 두 집합이 동일하면 1의 값을 가지고, 공통의 원소가 하나도 없으면 0의 값을 가진다. Manhattan Distance (L1 distance) 해당 속성 값 내에서 취 할 수있는 경로를 고려하기 때문에, 이산(discrete)형 및 이진(binary)데이터 간 거리를 계산하는데 사용된다. Euclidean Distance (L2 distance) • 매우 직관적이고 구현이 간단하고 좋은 결과를 보여주기 때문에 많이 사용된다. • 저차원의 데이터를 사용하고 벡터의 크기를 측정하는것이 중요한 경우 효과적 - 데이터의 차원이 증가할수록 유클리드의 유용.. Recommation System ch1. 추천시스템이란? 목차 1. 추천시스템이란 2. 추천시스템 준비 3. 장바구니 분석 4. CBF(컨텐츠 기반 추천시스템) 5. CF(협업 필터링) - KNN(최근접 이웃 기반) 협업 필터링 - MF(행렬 분해) 협업 필터링 6. 딥러닝 추천시스템 ch1. 추천시스템이란 개인 맞춤형 서비스 제공 위해 구매패턴 등 과거 데이터를 분석하여 상품을 추천하는 시스템 고객 선택 및 구매 적중률을 높이기 위해 데이터에 대한 메타 정보 관리와 분석 알고리즘이 중요해지고 있다. 롱테일 문제를 해결할 수 있다 고객, 기업 양측 모두에게 이익이 된다 추천시스템은 여러 가지 종류가 존재한다 1. 사용자 프로파일링 기반 2. Segment 기반 3. 상품 연관규칙 기반 4. CF(협업 필터링) 기반 5. CBF(컨텐츠 베이스 필터링) 기반 6... 이전 1 2 3 4 ··· 12 다음