BLOG

추천 알고리즘은 어떻게 내 취향을 알까?

2021-06-17


유튜브와 넷플릭스에서는 내가 검색하지 않아도 흥미로운 컨텐츠들을 보여주고 쇼핑몰과 인스타그램, 페이스북과 같은 SNS에서는 내가 필요로 하는 물건, 주변 친구까지 추천해준다. 이러한 추천 알고리즘은 때로는 지나치게 제공되는 경우도 있지만, 사용자에게 요긴하게 이용되는 경우도 있다. 이처럼 추천 알고리즘은 내가 알려주지 않아도 나의 취향과 니즈를 어떻게 알고 있는 건지 알아보자.

 

내용 기반 추천

이 기법은 항목 자체를 분석하여 사용자에게 항목을 추천해준다. 이는 많은 양의 사용자 행동 정보가 필요하지 않아 앞서 언급한 콜드 스타트(Cold Start) 문제를 해결할 수 있다. 내용 기반 추천 방법은 사용자 프로파일을 통해 과거 구매나 추천결과를 쉽게 반영할 수 있으며 추천 속도도 빠르다. 하지만 다양한 형식의 데이터를 추천해야 하는 경우 각 항목에서 얻는 정보의 형태가 다르기 때문에 추천이 어려워진다. 쉽게 말해 음악 데이터를 바탕으로 사진 데이터를 추천하는데에 어려움이 있다는 것이다.

 

협업 필터링

협업필터링은 특정 집단에서 발생하는 유사한 행동을 파악하여 비슷한 성향의 사람들에게 아이템을 추천하는 기술이다. 많은 사용자로부터 얻은 기호 정보가 많을수록 결과의 정확도가 높아진다. 협업 필터링은 사용자 기반 필터링과 아이템 기반 필터링으로 나눌 수 있다.

사용자 기반 필터링은 이름에서 알 수 있듯이 비슷한 사용자의 행동 패턴을 통해 나에게 아이템을 추천해주는 방식이다. 예를들어, 한 사용자가 햄버거와 감자튀김, 콜라를 구매하고 다른 사용자가 햄버거와 콜라를 구매했다면, 다른 사용자에게 감자튀김을 추천해주는 방식이다.

마찬가지로 아이템 기반 필터링은 연필과 지우개를 같이 구매한 사용자가 많다면 연필을 구매하려는 사용자에게 지우개를 추천해준다. 이때 실제 제품 용도의 상관관계는 파악하지 않는다. 구매기록에 의존할 뿐이다.

협업 필터링의 사용자와 아이템의 구매 패턴에 따라 상품을 추천하는 시스템은 합리적인 것처럼 보이지만, 앞서 말했듯이 과거 정보에 의존하기 때문에 몇 가지 한계가 존재한다.

첫 번째, 콜드 스타트(Cold Start) 문제이다. 협업 필터링은 기존 데이터에 의존하기 때문에 행동 패턴이 기록되지 않은 신규 사용자에게는 아무것도 추천할 수 없다. 콜드 스타트의 의미 그대로 ‘새로 시작할 때의 곤란함’을 갖고 있다.

두 번째, 효율 저하 문제이다. 협업 필터링은 계산량이 비교적 많은 알고리즘이라 사용자가 많아질수록 계산시간이 길어진다.

세 번째, 롱테일의 문제이다. 롱테일법칙은 아마존에서 소외받던 80%의 책들이 매출의 20%를 차지하는 베스트셀러의 매출을 능가한 결과를 두고 나온 개념이다. 이처럼 사용자들에게는 소수의 인기있는 항목에만 관심을 보이기 때문에 비주류 항목은 추천되지 못하는 문제가 발생할 수 있다.

 

하이브리드 추천 시스템

하이브리드 추천 시스템은 협업 필터링 추천 시스템과 내용 기반 추천 시스템을 상호보완하여 개발된 알고리즘이다. 협업 필터링의 콜드스타트 문제 해결을 위해 신규 컨텐츠는 내용 기반 필터링 기술로 분석하여 추천하고, 충분한 데이터가 쌓인 다음부터는 협업 필터링으로 추천의 정확성을 높일 수 있다.

 

유튜브는 이러한 추천 시스템으로 비디오 시청 시간을 20배 이상 증가시켰고, 넷플릭스도 매출의 75%가 추천 시스템에 의해 발생한다고 발표하였다. 이러한 추천 알고리즘이 곧 수익으로 연결되는 시대인 만큼, 앞으로도 지속적으로 더 발전된 추천 알고리즘들이 개발될 것으로 전망된다.

 

사업자등록번호 : 492-04-01429ㅣ업태 : 정보통신업ㅣ데이터베이스 및 온라인 정보 제공업 ㅣseo_daeho@naver.com ㅣ 대표 :서대호

서울특별시 구로구 디지털로34길 55, 715호(구로동, 코오롱싸이언스밸리2차)  문의 010-8598-7735 / 010-7130-2441