Les moteurs de recommandation

La découverte de contenu s’effectue par une recherche active (qui doit être simplifiée au maximum) ou par des mécanismes de recommandation, qui amènent le contenu vers l’utilisateur (qui se souvient de la réplique du Bossu « Si tu ne viens pas à Lagardère, Lagardère ira à toi  » ?).

Quand un catalogue de films (par exemple) est complet, la recherche est facilitée par un bonne catégorisation des contenus, selon plusieurs axes; en particulier le genre et le thème des films, mais aussi le mood, c’est à dire l’envie qui sous-tend le choix d’un film : zen, rire, glamour etc. Spideo a mis en place cette fonctionnalité sur CanalPlay Infinity avec une interface très pratique :

spideo-moods

Une approche traditionnelle de la « recommandation » est l’approche éditoriale traditionnelle des médias, telle qu’on la trouve sur UniversCiné ; c’est l’équipe éditoriale (et marketing) qui sélectionne les films mis en avant. Sur SensCritique, la recommandation est tout aussi manuelle, mais créée cette fois-ci par la communauté.

Cette approche est généralement complétée par la mise en avant de tops (les plus vus, les plus loués, achetés par ceux qui ont aussi acheté, etc.), que l’on trouve sur tous les sites e-commerce, Amazon en premier lieu.

Mais le top du top en matière de recommandation est celle qui s’adapte à chaque utilisateur, en prétendant connaitre ses goûts de manière précise.

Netflix, en particulier, parvient à convaincre ses utilisateurs de conserver leur abonnement en faisant émerger des films de son catalogue via un système de recommandations personnalisées reconnu. C’est indispensable dans leur cas, puisque les clients de l’offre seraient très déçus par les résultats de leurs recherches de films …

Une recommandation peut être basée sur différentes approches complémentaires :

  • l’approche par les similarités de contenu
  • l’approche par traitement des traces de navigation
  • l’approche par filtrage collaboratif
  • l’approche sociale par les amis
  • l’approche sociale par le choix de référent

Passons en revue ces différents cas :

Approche par les similarités de contenu

Les informations qui caractérisent chaque film ou série sont traitées par un moteur d’analyse puissant pour rapprocher les contenus similaires ; on parle de data mining. On constitue ainsi un graphe dans lequel les contenus sont agrégés en fonction de leur similarité, la proximité indiquant une similarité plus grande.

On prend en compte des caractéristiques objectives de l’œuvre comme son , année de production, ses nationalités, son casting, mais aussi des caractéristiques éditoriales telles que ses genres et thèmes.

Cette approche permet de répondre au besoin de recommandation en temps réel de contenus à des utilisateurs que l’on connait peu et qui ne peuvent donc pas être pris en charge par une approche collaborative.

Cette approche par le contenu a cependant des limites dans le domaine du cinéma, où la similarité de deux films n’entraîne pas forcément une appréciation identique.

Approche par traitement des traces de navigation

Les pages visitées, les vidéos vues par la masse des internautes sur un site Web ou via une application mobile constituent des signaux faibles, mais néanmoins très utiles.

Ces indications permettent par exemple de savoir quels sont les films ou les séries qui font le buzz sur la plateforme à un moment donné. Amazon utilise ces informations pour sa section “Les clients ayant consulté cet article ont également regardé” (la FNAC fait de même d’ailleurs).

Approche par filtrage collaboratif

On aborde là la recommandation personnalisée. C’est l’approche la plus ouverte, car elle s’applique à tout type de produit, culturel ou non. C’est potentiellement la plus pertinente pour les produits culturels, mais c’est aussi la plus complexe à mettre en œuvre.

La première difficulté est d’obtenir des informations suffisamment fines pour pouvoir qualifier ces informations d’ « appréciation ». En effet certains sites e-commerce (dont les services VOD) disposent uniquement de décisions d’achat, qui sont alors interprétées – souvent abusivement – comme des opinions positives.

La seconde difficulté est d’obtenir un nombre suffisant d’opinions de la part d’ un nombre important de personnes, pour pouvoir rapprocher efficacement ceux qui ont les mêmes opinions sur les mêmes contenus, et donc on l’espère les mêmes goûts.

Pour les amateurs qui n’hésitent pas à noter 10, 100 voire 1000 films ou séries, un logiciel de datamining puissant malaxe quotidiennement les opinions qu’ils ont laissées sur le site et les rapproche de celles émises par l’ensemble des utilisateurs de la plateforme. Les contenus appréciés par le groupe d’intérêt ainsi constitué leurs sont alors recommandés, pourvu qu’ils ne les aient pas déjà vus (ou plutôt notés), et ces contenus recommandés sont présentés par score décroissant.

Les utilisateurs d’AlloCiné émettent par exemple des opinions précises et en grand nombre : c’est donc l’une des rares plateformes françaises à pouvoir mettre en œuvre des services basés sur un graphe d’intérêt et dont la performance peut atteindre celle de Last.fm dans le domaine de la recommandation musicale ou celle de Netflix dans celui de la recommandation cinéma.

Approche sociale par les amis

C’est avec ses amis que l’on va au cinéma, avec eux que l’on discute du film que l’on a vu la veille. La recommandation sociale est donc d’une force au moins égale à la recommandation « anonyme » issue d’un algorithme, aussi puissant soit-il.

Il est intéressant de proposer aux utilisateurs authentifiés sur le site marchant via leur compte Facebook de rassembler dans une page dédiée les opinions de leurs amis, si ces amis ont noté des films ou séries sur la même plateforme bien entendu.

J’ai eu l’occasion de tenter cette approche dans le cadre du projet R&D CinéGift d’AlloCiné. Mais je ne l’ai jamais vue appliquée à un site marchant en production.

Approche sociale par le choix de référents

La proximité sociale est-elle garante d’une proximité de goût cinématographique ? Rien n’est moins sûr.

Pour compléter l’approche sociale basée sur le réseau d’amis, on peut donc proposer la mise en valeur des opinions de cinéphiles qui partagent vos goûts, à la manière des pratiques de followers en vigueur sur Twitter.

Ces éclaireurs sont les membres les plus actifs du groupe d’intérêt auquel appartient l’utilisateur (cela n’est possible que si une approche collaborative est mise en oeuvre). L’utilisateur choisit un référent après avoir eu accès à son profil ; les opinions de ces référents seront alors mises en avant sous la forme de recommandations éclairées.

R&D : le “deep learning”

Les dernières avancées sur les moteurs de recommandation proviennent du champ scientifique nommé deep-learning. Les techniques de deep-learning sont à la mode depuis que Google a racheté DeepMind, startup spécialisée dans l’IA, combinant neurosciences et machine learning. Netflix emboite actuellement le pas et compte améliorer substantiellement son moteur de recherche par l’utilisation de réseaux neuronaux hébergés sur le Cloud Amazon.

Mais là, nous sommes encore dans le champ de la recherche, et j’attends avec impatience de voir une première implémentation sur un site marchand.

A suivre …

Dans un prochain article, je décrirai différentes solutions de recommandation applicables au domaine du cinéma : Spideo, Cognik, AntVoice, TasteHit,  CinéTrafic, Jinny, xroadmedia, ThinkAnalytics, EasyRec, DigitalSmiths, Gravity, ContentWise et MoviePilot.

Leave a Reply

Your email address will not be published. Required fields are marked *

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code class="" title="" data-url=""> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong> <pre class="" title="" data-url=""> <span class="" title="" data-url="">

WordPress Anti Spam par WP-SpamShield