Pages

mercredi 18 septembre 2013

Le seuil d'ensemencement de la désinformation

Hier j'ai découvert une info qui m'a bouleversé ! Il s'agit de la publication d'une recherche intitulée "A Scalable Heuristic for Viral Marketing Under the Tipping Model", signée par MM. Paulo Shakarian, Sean Eyre & Damon Paulo, qui sont trois militaires américains instructeurs à West Point.

Car il est hautement symbolique tout autant que fortement préoccupant qu'une étude aussi sérieuse sur la possibilité d'infecter à grande échelle des réseaux sociaux ayant au minimum des centaines de millions de membres et au maximum plus d'un milliard (pour l'instant...) émane des militaires !

Vous l'aurez noté, je ne publie plus beaucoup, mais là, l'info est de taille et la tentative de la décortiquer un peu me semble largement justifiée.

Plantons d'abord le décors : le contexte est 1) la sociologie, et le terrain de jeu est 2) l'univers des réseaux sociaux.

Selon Wikipedia, la sociologie peut être définie comme la branche des sciences humaines qui cherche à comprendre et à expliquer l'impact de la dimension sociale sur les représentations (façons de penser) et comportements (façons d'agir) humains...

Quant à la traduction du titre : "A Scalable Heuristic for Viral Marketing Under the Tipping Model", nous pourrions la décomposer comme suit :

- Toujours en sociologie, l’heuristique est la « discipline qui se propose de dégager les règles de la recherche scientifique ». Le terme heuristique désigne d'une manière courante, une méthode de résolution d'un problème qui ne passe pas par l'analyse détaillée du problème mais par son appartenance ou adhérence à une classe de problèmes donnés déjà identifiés.

- Scalable fait désormais partie de notre vocabulaire (au risque de faire hurler les puristes), et signifie la capacité de montée en puissance d'un réseau, par exemple, son adaptabilité, son évolutivité. Si mon réseau est scalable, cela veut dire qu'il tiendra toujours la charge nécessaire au fur et à mesure que la demande de prestations augmentera...

- Marketing viral n'a pas vraiment besoin d'être explicité, mais bon : capacité de propagation d'un message quelconque (indépendamment de sa nature, sa forme ou son format), viralité d'un bouche à oreille électronique, etc.

- Tipping point est le point - seuil - de basculement, au-delà duquel il y a changement de comportement, et où le message précédemment connu mais tu commence à être diffusé et se propager.

Donc en fait, le but de l'étude, c'est de trouver une solution algorithmique pour cibler un réseau social à grande échelle (large social network), identifier en son sein le noyau minimum d'utilisateurs (en quantité et en qualité : seed sets) à partir duquel injecter un message dont on sait qu'il aura alors toutes les chances de se propager à l'ensemble du réseau, et même en dehors : puisqu'il est fort probable qu'une info faisant le tour de Facebook soit reprise ensuite sur Twitter, sur les blogs, voire à la télé, la radio et dans la presse, etc., et finisse par contaminer (manipuler) l'ensemble des médias ... et donc des esprits ! Sans oublier que demain la maîtrise du "graphe social" sera, en termes d'efficacité "chirurgicale", à des années-lumière de ce que fut hier la télévision...

Une technologie que ne renieraient point un Goebbels ou un Berlusconi (pour rester contemporains), car de là à la propagande, il n'y a qu'un pas à franchir, et s'il est petit pour l'homme, le danger est grand - très grand - pour l'humanité !

Car je suis désolé de retirer leurs illusions à celles et ceux qui s'en font encore, mais depuis la fin de la deuxième guerre mondiale, nos soit-disant démocraties ne sont basées que sur les capacités incomparables de nos gouvernants bienveillants (genre "petit père du peuple") de manipuler les opinions publiques, soit en les maintenant dans des conditions de béate ignorance, soit en leur faisant avaler des bobards si énormes que même un anaconda géant s'en étoufferait...

Il faut dire qu'ils maîtrisent parfaitement toutes les techniques de manipulation mentale, qu'ils ont largement su parfaire après un demi-siècle de télévision : toute la panoplie des armes populistes et démagogiques n'a plus aucun secret pour eux, pas plus que la psychologie benoîte des masses abruties.

Or Internet étant venu leur casser les œufs dans le panier, puisque le Web est désormais un espace où il est possible pour celles et ceux qui souhaitent vraiment s'informer de faire la part du vrai (ce qui fait parfois gripper un système parfaitement bien huilé, puisqu'une opinion publique informée est beaucoup moins manipulable), il était clair que ça ne pouvait pas durer.

Cette étude est donc une première réponse à la problématique ! Voyons ça de plus près...

* * *
En commençant par le résumé :
In a "tipping" model, each node in a social network, representing an individual, adopts a property or behavior if a certain number of his incoming neighbors currently exhibit the same. In viral marketing, a key problem is to select an initial "seed" set from the network such that the entire network adopts any behavior given to the seed. Here we introduce a method for quickly finding seed sets that scales to very large networks. Our approach finds a set of nodes that guarantees spreading to the entire network under the tipping model. After experimentally evaluating 31 real-world networks, we found that our approach often finds seed sets that are several orders of magnitude smaller than the population size and outperform nodal centrality measures in most cases. In addition, our approach scales well - on a Friendster social network consisting of 5.6 million nodes and 28 million edges we found a seed set in under 3.6 hours. Our experiments also indicate that our algorithm provides small seed sets even if high-degree nodes are removed. Lastly, we find that highly clustered local neighborhoods, together with dense network-wide community structures, suppress a trend's ability to spread under the tipping model.
Que j'adapterais de la façon suivante :
Selon le modèle du « basculement », dans un réseau social, chaque nœud – qui représente un individu – adopte un attribut ou un comportement dès lors qu’un certain nombre de ses voisins entrent dans le réseau en adoptant le même type d’attribut ou de comportement. Or l’un des problèmes clés du marketing viral réside en la sélection d’un ensemble initial « d'amorçage » au sein du réseau, pour que l'ensemble du réseau adopte ensuite le même attribut - comportement que celui du groupe d’amorçage. La méthode présentée ici consiste à trouver rapidement des ensembles d’amorçage capables d’évoluer pour s'adapter à de très grands réseaux. Notre approche permet de trouver un ensemble de nœuds pouvant assurer la propagation à tout le réseau en suivant ce modèle de basculement. Après avoir évalué de façon expérimentale 31 réseaux dans le monde réel, nous avons constaté que cette approche consent souvent d’identifier des groupes d’amorçage proportionnellement bien plus petits que la taille de la population concernée, en surperformant dans la plupart des cas les mesures sur la centralité des nœuds. En outre, la scalabilité de cette approche est au rendez-vous, puisque sur un réseau social tel que Friendster, composé de 5,6 millions de nœuds et de 28 millions de bords, nous avons identifié un groupe d'amorçage en moins de 3h40'. Nos expériences montrent également que même en cas de suppression de nœuds de haut degré, cet algorithme identifie pareillement de petits groupes d'amorçage. En dernier lieu, une autre conclusion de notre expérimentation est que la cohabitation entre des voisinages locaux fortement clustérisés et des structures communautaires denses disséminées sur l'ensemble du réseau supprime la capacité d'une tendance de se propager selon le modèle du basculement.
Publiée ce mois-ci, cette étude est pourtant le fruit d'un cheminement plus ancien, puisqu'on en retrouve la genèse sur Internet dès 2012, sous cet autre titre : "Large Social Networks can be Targeted for Viral Marketing with Small Seed Sets", ou encore : "Algorithmic Network Science", document daté d'avril 2012 qui me semble le plus intéressant, puisqu'il examine un réseau VRN (Village Relationship Network) en utilisant un réseau de relations tribales (tribal relationship network) pour modéliser les relations entre les cellules.

Et d'expliquer le mode d'actionnement d'un VRN afin de propager un sentiment contre-insurrectionnaliste dans un village dès lors qu'au moins la moitié des villages environnants basculent vers un comportement contre-insurrectionnel :


En analysant le problème de l'extension du VRN dans les termes suivants :
En 2010, nos forces spéciales ont entraîné les habitants du village de Gizab qui s'étaient révoltés contre les talibans. 
Donc, si nous supposons l'application du modèle de basculement au VPN, peut-être alors serons-nous en mesure d'identifier un ensemble de nœuds capables de générer chez TOUS tous les autres villages la volonté d'agir pour combattre les talibans. 
Par conséquent, la question qui se pose est la suivante :
Pouvons-nous identifier, dans le cadre du modèle de basculement, un ensemble minimal de nœuds susceptible d'assurer l'adoption du comportement en question par toute la population ?
Ce que l'on nomme le problème du groupe d'amorçage minimum.
Le problème du groupe d'amorçage minimum étant défini comme un problème NP-Complet, et l'annonce qui suit, péremptoire, met froid dans le dos :
« Notre nouvelle heuristique d'élagage (pruning heuristic) garantit que le résultat conduira à l'adoption du comportement par l'ensemble de la population, mais sans garantir de taille minimale. »
Or la modélisation du réseau est exactement la même que celle de l'étude publiée ces jours-ci :


Nous avons donc à la base un modèle étudié "sur le terrain" (c'est le cas de dire), qui est désormais étendu et transposé au marketing viral sur les réseaux sociaux !


Par conséquent, pour conclure, je ne sais pas, mais pour celles et ceux qui s'en souviennent, l'explosion du printemps arabe sur les réseaux sociaux a débuté en ... décembre 2010... !

Une expérimentation grandeur nature ?


3 commentaires:

Fabrice Epelboin a dit…

Pour le printemps arabe, non, c'est autre chose, même s'il y a clairement eu instrumentalisation de l'information par un petit groupe, nul armée US en vue.

Par contre, pour ce qui est de la Libye, on peut très clairement se poser la question (cf operation Cyberdawn)

Super article, merci d'avoir pris le temps de l'écrire.

Jean-Marie Le Ray a dit…

Fabrice, merci pour le commentaire et pour m'avoir appris l'existence de l'opération CyberDawn, que j'ignorais, mais c'est clairement une piste parmi d'autres à approfondir...

Liens Entrants a dit…

Désinformation... Tout est désinformation !