Big Data : la prévision en mode numérique | Janvier 2013


Twitter, un instantané de l’opinion

Lorsque l’information factuelle est remplacée par des contributions personnelles et arrivant en masse, les professionnels doivent adapter leurs manières d’extraire de l’information. Des méthodes ont été développées pour analyser les sentiments et opinions de groupes de personnes et développer des actions ciblées sur ces derniers.

Les messages Twitter sont des textes courts nommés « tweets », transmis par des individus à une communauté de lecteurs nommés communément followers. Ces messages créés et transmis à vif constituent une source d’information permettant de déceler les tendances et les sentiments des utilisateurs sur des événements particuliers. Ce concept lancé en 2006 a eu un succès conséquent, et aujourd’hui, plus de 500 millions de membres alimentent régulièrement le système avec plus de 400 millions de  messages, avis et commentaires chaque jour.

Nouveau champ d’investigation

L’analyse du flux d’information permet d’identifier les sujets à la mode et les tendances futures. Ceci permet de relier ces sujets à des groupes d’utilisateurs caractérisés par leur profils personnels, leur localisation, leur groupes de followers ou bien même par le contenu de leur tweets

Des applications commerciales

Parmi les sociétés qui se sont spécialisées dans ce domaine, Research.ly, une filiale de la société Peoplebrowsr lancée en 2010, se focalise sur le marché de  l’analyse des messages Twitter.

L’analyse de trois années d’historique des messages stockés permet à Research.ly d’extraire des sentiments, des opinions et des sujets récurrents qui sont autant d’indications sur les intérêts du public. Ces éléments permettent ainsi l’élaboration d’un interest graph (voir partie analyse pour une définition) sur un thème donné.

Cette nouvelle méthode d’analyse par l’interest graph est à contre-courant des méthodes classiques de type social graph. En effet, il ne s’agit plus d’identifier les utilisateurs par  leur réseau social ou des facteurs socio-économiques, mais plutôt de regrouper des communautés par leurs centres d’intérêts. C’est le cas ici avec l’interest graph et l’analyse de mots-clefs sur Twitter.

Le challenge est clair : si une marque veut engager la conversation avec des personnes potentiellement intéressées, elle doit d’abord comprendre ce que les gens expriment à son sujet ainsi que sur les domaines d’intérêt relatifs. Il ne s’agit plus d’identifier directement la communauté, mais plutôt de comprendre ce qui lui importe réellement.

En outre, Research.ly peut aussi relier ces analyses à des informations personnelles de l’auteur (âge, sexe, pays, position, etc.) pour un meilleur filtrage des analyses.

Le résultat peut alors être présenté sous forme de graphiques indiquant les variations de ces opinions sur un thème en fonction de paramètres comme le temps, la région ou les groupes sociaux considérés.

Analyse démographique et psychographique instantanée

En voici la démarche :

- introduire un mot-clef pertinent (nom de la compagnie, du produit, du concurrent, autre sujet)

- Research.ly effectue quarante recherches simultanées. Il identifie en premier lieu les personnes qui parlent du mot-clef, puis cherche en profondeur instantanément pour découvrir des données intéressantes. Ces données incluent la localisation, le sentiment, le genre ainsi que les world clouds, les hashtags, liens et autres @names. Les résultats sont délivrés quasi instantanément.

- Les données extraites donnent aux brand managers la possibilité de cibler très simplement par exemple des segments démographiques spécifiques (les femmes dans la région genevoise) ou des sentiments pour n’importe quel mot-clef.

C’est là le fondement de la méthode de Research.ly. Celui-ci fonctionne comme une mémoire des tweets et vous permet d’ouvrir une fenêtre sur la richesse des données démographiques, d’analyse de sentiments, de mentions à la fois historiques et en temps réel, pour n’importe quel mot-clef sélectionné.

Plus récemment, Peoplebrowsr a introduit de nouveaux concepts qui consistent à identifier les meneurs d’opinion sur le web. L’intérêt d’identifier ces utilisateurs provient du fait qu’ils sont capables d’influencer les groupes sociaux sur un thème donné (Kred).

L’utilisation de ces outils d’analyse est facturée moyennant une redevance mensuelle d’une centaine de dollars US par utilisateur.

L’exemple Starbucks

A l’automne 2011, M. Brian Solis de la société  Peoplebrowsr a conduit une étude sur les tweets et informations personnelles à partir des profils des 50'000 followers les plus actifs parmi le million de followers que compte la société Starbucks sur Twitter.

Une analyse des  profils  de ces personnes met en évidence que ce groupe est constitué principalement de new yorkais ou californiens, attachés aux valeurs familiales, et travaillant majoritairement dans les médias sociaux ou le marketing.

L’historique des tweets a permis d’identifier les acteurs dominants à l’origine de la propagation des micro-messages sur des sujets de discussion divers parmi les followers de Starbucks.

A partir de là, M. Solis a développé un interest graph afin de comprendre ce qui les motive, et éventuellement, d’en déduire comment il serait possible d’influencer favorablement leur opinion.

Cela a été possible en définissant un word cloud issu des mots-clefs les plus communément utilisés. Ce word cloud, finalement converti en brand graph, a permis de capter le ton et le style de la communauté web qui anime Starbucks.

Mise en perspective

Néanmoins, le contenu des messages sur Twitter ne répond pas à une structure sémantique et grammaticale fixe. Il donne lieu à la création continuelle de néologismes, abréviations et astuces linguistiques permettant d’exprimer des idées en quelque 140 caractères.

Les outils d’analyse de texte ont alors une efficacité limitée, qui se résume à compter les occurrences de termes donnés. 

La plus grande source d’analyse provient en fait d’éléments externes que sont les metadata (balises d’informations gérées par Twitter, comme le nom de l’auteur, la localisation de l’émetteur, le nombre de followers de l’auteur, l’historique de ses tweets) ainsi que les données du profil Twitter de l’auteur.

Malgré cette difficulté d’analyser les tweets, ce domaine d’étude revêt un grand intérêt. Plusieurs acteurs, tels que Datasift, s’installent sur le marché de l’exploitation des données Twitter, tandis que ce dernier modifie les conditions d’accès à ses données par des sociétés tierces. Depuis quelques mois, un différend juridique oppose d’ailleurs Twitter à Research.ly suite aux restrictions d’accès qui sont dorénavant imposées à ce dernier. 

L’année 2013 devrait permettre à ce secteur de se structurer et de clarifier les questions  de droits d’accès aux « tweets » par des sociétés commerciales tierces. Cette structuration permettra ainsi de mieux définir les services qui pourront être offerts par les acteurs de ce secteur.

Pour en prolonger la réflexion - nos sources

-McCarthy, Brad, [en ligne], 2010, « Research.ly: Twitter analytics, sentiment and trend tracking done right»,  http://thenextweb.com/apps/2010/12/02/research-ly-analytics-sentiment-and-trend-tracking-done-right/ , [consulté le 16 Janvier 2013];

-« Peoplebroswr », [en ligne], 2012,   http://www.peoplebrowsr.com, [consulté le 16 Janvier 2013];

-Solis, Brian, [en ligne], 2010, « Introducing ReSearch.ly – A Window into Twitter’s Interest Graphs », http://www.briansolis.com/2010/12/introducing-research-ly-a-window-into-twitters-interest-graphs/ , [consulté le 16 Janvier 2013];

-Solis, Brian, [en ligne], 2010, « The Interest Graph on Twitter is Alive: Studying Starbucks Top Followers »,  http://www.briansolis.com/2011/02/the-interest-graph-on-twitter-is-alive-studying-starbucks-top-followers/, [consulté le 16 Janvier 2013];

-« Twitter », [en ligne], 2012,  http://www.twitter.com, [consulté le 16 Janvier 2013];

-« Datasift », [en ligne], 2012, http://www.datasift.com, [consulté le 16 Janvier 2013];

Source image

-Research.ly, « Starbucks Big Word cloud », [en ligne], 2012, http://www.briansolis.com/2011/02/the-interest-graph-on-twitter-is-alive-studying-starbucks-top-followers/ , [consulté le 16 Janvier 2013];


dossier préparé par:


Nadia Atienza, Galya Nizamaldin, Nabil Sahraoui, Lijuan Wu