전체 글 7

추천시스템

콘텐츠 기반 필터링카카오 AI 추천 : 카카오의 콘텐츠 기반 필터링사용자들의 아이템(콘텐츠 또는 상품) 소비 패턴을 살펴보면> 기존에 유사한 아이템을 소비하는 경우를 쉽게 볼 수 있다.> 이런 소비 패턴이 뚜렷한 경우, 아이템의 정보를 활용해 추천하는> 콘텐츠 기반 필터링(Content-based filtering) 방식이 효과적 콘텐츠 기반 필터링은 위의 그림에 표현된 것과 같이, 사용자가 소비한 아이템에 대해 아이템의 내용이 비슷하거나 관계가 있는 다른 아이템을 추천하는 방법이다.아이템의 내용은 아이템을 표현할 수 있는 데이터를 지칭하는데, 카테고리, 이름과 같은 텍스트 데이터, 이미지 데이터를 주로 사용한다.다른 사용자의 아이템 소비 이력을 활용하는 협업 필터링(Collaborative filter..

카테고리 없음 2024.11.06

파이썬 데이터분석 실무 테크닉 100 10장

10장 앙케트 분석을 위한 자연어 처리 테크닉 1091. 데이터 불러서 파악해 보자 import pandas as pdsurvey = pd.read_csv("survey.csv")print(len(survey))survey.head() 이처럼 코드를 실행하면 datetime, comment(의견), satisfaction(만족도)를 확인할 수 있다. 결측치 확인survey.isna().sum()아래의 결과가 결측치이다.그래서 설문조사의 경우는 결측치가 많은 경우가 있기에 반드시 결측치를 확인해야 한다.86개중 2가지가 결측치인 경우는 제거해준다. survey = survey.dropna()survey.isna().sum()제거가 완료된 것을 볼 수 있다. 92. 불필요한 문자를 제거하자.언어는 사람에 따..

카테고리 없음 2024.11.02

통계101_11장

11장 베이즈 통계11.1 베이즈 통계의 사고방식이전에 본 통계 방법은 빈도주의 통계(frequentist statistics)라 부르는 흐름으로 분류된다.이번 장에서는 베이즈 통계(Bayesian statistics)라 부르는 흐름. 2가지 통계의 차이확률로 다루는 방식이나 수리적 가정이다. 베이즈 통계의 중요성컴퓨터를 사용함으로써 복잡한 통계 모형도 추정할 수 있기에 중요도는 더욱 높아짐. 불확실성빈도주의 흐름 : 모집단에서 표본을 추출하는 경우이런 불확실성에 대해 고정된 파라미터 θ를 가진 확률분포(모집단)을 상정하여, 데이터 x가 나타날 확률 p(x| θ)로 표현함.활용 예시가설검정 : 극단적인 값이 나타날 확률최대가능도 방법 : 고정된 파라미터에서 확률을 최대화하는 방법무한한 반복 실행== 객관..

카테고리 없음 2024.11.02