Системы рекомендаций в науке о данных
Практически каждое приложение или веб-сайт, которые вы посещаете, показывает вам то, что может вас заинтересовать больше всего. Например, если вы давно пользуетесь YouTube, вы, должно быть, видели контент от своих любимых авторов или видео того типа, которые вам нравятся, каждый раз, когда вы посещаете ресурс. Это не более чем система рекомендаций. Системы рекомендаций – одно из самых широко используемых приложений в науке о данных, и как специалист по данным вы должны знать все о таких системах. В этой статье я представлю вам введение в системы рекомендаций в науке о данных.
Системы рекомендаций
Если вы внимательно посмотрите на каждое посещаемое приложение или веб-сайт, то поймете, как работает каждая из систем рекомендаций. Когда вы впервые посещаете приложение или веб-сайт, оно, вероятно, покажет вам самый популярный контент среди различных пользователей, но, если вы продолжите посещать его в течение некоторого времени, он начинает рекомендовать вам элементы, которые вы должны прочитать, купить, посмотреть, послушать, или которым нужно уделить свое время. Это означает, что системы рекомендаций основаны на важных факторах:
- Пользователи
- Содержание
- Рейтинги
Комбинация пользователей, контента и рейтингов дает два разных подхода к созданию систем рекомендаций, а именно:
Теперь давайте рассмотрим оба этих подхода, чтобы понять, как работает система рекомендаций.
На основе контента:
Контентно-ориентированный подход основан на пользовательских данных или контенте (под контентом я имею в виду книги, статьи, видео, музыку, продукты для покупки или все, что вы получите по рекомендации). Пользовательские данные или контент используются для нацеливания на нового пользователя, который попадает в ту же категорию пользователей. Например, все читатели, читающие эту статью, изучают науку о данных, поэтому, если данные новых пользователей имеют те же функции, то эти новые пользователи, увидят эту статью в рекомендациях.
Совместная фильтрация:
Совместная фильтрация очень сложна по сравнению с системами рекомендаций на основе контента. Она основана на оценках или комментариях, данных пользователем, и ее цель – предсказать оценки для каждого контента и каждого пользователя. Например, если большинство людей оценивают последний iPhone на 5 звезд, в этом случае система рекомендаций предскажет, как вы оцените это предложение на основе данных о ваших интересах, и покажет вам это предложение только в том случае, если оно предполагает положительный отзыв.
Совместная фильтрация более точна, чем системы рекомендаций на основе контента, поскольку она работает с большими наборами данных с большей вычислительной мощностью. Большинство веб-сайтов, использующих совместную фильтрацию, обеспечивают ежедневное обновление своей системы рекомендаций путем переобучения модели и обновления данных о пользователях.
Резюме
Системы рекомендаций – одно из самых широко используемых приложений в науке о данных, и как специалист по данным вы должны знать все о рекомендательных системах. Надеюсь, вы теперь поняли, что такое рекомендательные системы и как они работают. Я старался писать эту статью простым языком, чтобы вы могли легко понять концепции, лежащие в основе системы рекомендаций. Надеюсь, вам понравилась эта статья о введении в рекомендательные системы. Не стесняйтесь задавать свои вопросы в разделе комментариев ниже.