Skip to content

[WWW2012] De la puissance des commentaires

Pour cette 4e journée du WWW2012, je me suis intéressé aux commentaires sur le web. La capacité à interagir avec les contributions des autres étant une des composantes les plus importantes du web social, la gestion des commentaires (notamment leur classement et leur modération) est devenu un enjeu majeur pour toutes les plateformes web. D’ailleurs, j’ai aperçu dans la salle des gens de chez Facebook, Amazon.com et Yahoo!… et encore, je n’ai pas pu voir tous les badges…

La première présentation à laquelle j’ai assisté s’intitule « Multi-objective Ranking of comments », c’est une méthode développée par des chercheurs indiens pour classer les commentaires.

Les commentaires sont souvent aussi importants que le contenu lui-même (surtout sur Facebook d’ailleurs). Mais plus un contenu est intéressant, plus il y a de commentaires et moins les commentaires ont de valeur. Alors la seule solution, c’est d’offrir aux lecteurs une sélection des meilleurs commentaires.

Quelle méthode utiliser pour classer les commentaires ?

Il existe plusieurs critères de classement : la pertinence, la popularité (author reputation), la note, la date… Et la meilleure solution est d’utiliser une savante combinaison de tous ces critères.

Considérons que le classement des commentaires {A, B, C ,D} selon le critère de date donne le graph G1, et selon le critère de réputation donne le graph G2… Bref, chaque critère de classement donne un graph. La méthode proposée par le chercheur consiste à :

  1. combiner tous ces graphs simples pour faire un beau graph bien complexe (du style G3) (Rank agregation)
  2. identifier et résoudre les conflits (Active learning)
  3. mettre à jour le graph automatiquement dés qu’il y a un changement dans les commentaires (Online update)


La combinaison de tous les graphs simples en un graph complexe avec des relations pondérées est traduite en formule mathématique (voir photo ci-dessous) pour obtenir un beau classement de vos commentaires et permettre d’en faire une sélection pertinente pour vos lecteurs.

Yahoo! cherche à prédire les contenus que vous allez commenter

Dans une autre conférence menée par un chercheur de Yahoo! et intitulée « Care to comment », j’ai appris que Yahoo! s’intéresse beaucoup au commentaire car il est le signal de l’intérêt, des émotions et de l’engagement de leur audience. Ainsi le chercheur nous a présenté son travail sur un algorithme permettant de prédire, pour un utilisateur donné, les contenus qu’il sera susceptible de commenter. En anglais, ça fait plus classe : the ability to connect users with stories they are likely to comment on !

Le principe est simple ; après avoir commenté un article, un message apparaît : « Merci pour votre commentaire, vous serez peut-être intéressé de commenter ces articles aussi » Ce qui est plus compliqué c’est évidemment l’algorithme qui permet de prédire ces articles. Ils utilisent une combinatoire des tags et des co-commentateurs :

  • Les tags des histoires que vous avez déjà commentées
  • Les histoires commentées par ceux qui ont commenté sur les mêmes histoires que vous

Je vous laisse savourer la formule qui se trouve sur la photo ci-dessus.

Utiliser les commentaires pour améliorer les résultats de recherche

Enfin, j’ai découvert le travail d’un groupe de scientifiques espagnols sur l’utilisation des commentaires pour améliorer les résultats de recherche dans une banque d’images (comme Flickr). La conférence s’intitulait « Leveraging User comments for Aesthetic Aware / Image Search Reranking ». Ils ont expliqué comment, avec une petite analyse sémantique des commentaires de photos, ils peuvent considérablement augmenter la pertinence des résultats de recherche.

En résumé, ils éliminent d’abord tous les commentaires purement subjectifs (beautiful, nice, awesome…) puis ils récupèrent les commentaires qui contiennent des termes en rapport avec la notion de photographie : lumière, contraste, géométrie, texture, sujet, idée… Ces derniers commentaires participent à la note finale de la photo, celle qui va déterminer son rang dans les résultats de recherche.

Compte-rendu de la journée d’hier (J3 du WWW2012) :

Published inCarnet de routeEvénements

Be First to Comment

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *