Для
okra
Система для поиска родных душ. С целью выяснить, какое кино посмотреть в следующий раз.
Периодически такие системы появляются в IMDB, Netflix, но потом пропадают. Я огорчаюсь. Хочется надежности.
Нашла одну действующую в унив. Миннесота, но там только американские фильмы.
Теория вопроса:
Recommender systems, also known as Collaborative Filtering Systems, are used to predict user preferences in commercial (and non-commercial) environments. They function by:
* recording behavior of a large number of people (e.g. web pages visited, explicit item ratings provided, previous purchases),
* selecting a number of "neighbors" for the current user (i.e. other people whose past behavior is similar to this person),
* extrapolate future behavior for the user, based on behavior of these neighbors (e.g. this user will probably like the movie Romeo Must Die a lot, because many of his neighbors did).
The catch is that these systems deal with large numbers of people (> 100,000) with many different behaviorial aspects (> 1000), few values per user (~ 1% per user), many recorded values (>> 1,000,000)
Полезные ссылки
Здорово было бы начинить такую систему данными от русских пользователей, но там много всяких "но".
Система для поиска родных душ. С целью выяснить, какое кино посмотреть в следующий раз.
Периодически такие системы появляются в IMDB, Netflix, но потом пропадают. Я огорчаюсь. Хочется надежности.
Нашла одну действующую в унив. Миннесота, но там только американские фильмы.
Теория вопроса:
Recommender systems, also known as Collaborative Filtering Systems, are used to predict user preferences in commercial (and non-commercial) environments. They function by:
* recording behavior of a large number of people (e.g. web pages visited, explicit item ratings provided, previous purchases),
* selecting a number of "neighbors" for the current user (i.e. other people whose past behavior is similar to this person),
* extrapolate future behavior for the user, based on behavior of these neighbors (e.g. this user will probably like the movie Romeo Must Die a lot, because many of his neighbors did).
The catch is that these systems deal with large numbers of people (> 100,000) with many different behaviorial aspects (> 1000), few values per user (~ 1% per user), many recorded values (>> 1,000,000)
Полезные ссылки
Здорово было бы начинить такую систему данными от русских пользователей, но там много всяких "но".