ACCUEIL

Consignes aux
auteurs et coordonnateurs
Nos règles d'éthique

APPEL À
CONTRIBUTION
Masses de données hétérogènes
En savoir plus >>
Autres revues >>

Revue d'Intelligence Artificielle

0992-499X
Revue des Sciences et Technologies de l'Information
 

 ARTICLE VOL 30/4 - 2016  - pp.419-440  - doi:10.3166/RIA.30.419-439
TITRE
Une méthodologie pour la détection automatique de comptes multiples dans les réseaux sociaux

TITLE
A methodology for the detection of multiple accounts in social networks

RÉSUMÉ

Avec la croissance des médias sociaux (MS) comme l’élément le plus important d’Internet en termes de visiteurs, la détection des faux comptes est devenue l’un des problèmes de sécurité les plus difficiles de ces médias. Durant les dernières années, les MS ont évolué de façon importante, convertissant de fait une partie de nos vies personnelles vers le virtuel. Mais cette évolution a aussi des effets négatifs. En 2012, 16,6 millions d’américains ont été victimes de vol d’identité, selon une estimation de la ‘U.S. Bureau of Justice Statistics’, avec des pertes financières évaluées jusqu’à $24,7 milliards pour l’ensemble de ces victimes.

Diverses techniques sont utilisées pour manipuler les utilisateurs dans les environnements des MS telles que le spam social, le vol d’identité, le spear phishing et les attaques sybilles... Dans cet article, nous nous intéressons à l’analyse du comportement des comptes multiples qui es- saient de contourner les régulations des MS. Dans ce contexte de détection de manipulation dans les MS, nous nous concentrons sur la détection des identités multiples (Faux-nez, ou sock- puppets) créées sur la plateforme Wikipédia anglophone (EnWiki). Nous mettons en place une méthodologie complète allant de l’extraction des données nécessaires de l’EnWiki, jusqu’à l’apprentissage et les tests de nos données sélectionnées à l’aide de plusieurs algorithmes d’apprentissage automatique. Nous proposons un ensemble des caractéristiques étendant celles trouvées dans la littérature existante, de façon à les utiliser dans l’analyse automatique des données afin de détecter les comptes Faux-nez créés sur EnWiki. Nous les appliquons sur une base de données de 10 000 comptes d’utilisateurs. Les résultats comparent plusieurs algorithmes d’ap- prentissage automatique afin de montrer que ces nouvelles caractéristiques et données d’ap- prentissage permettent de détecter 99 % de faux comptes, améliorant ainsi les résultats de la littérature.



ABSTRACT

With the growth of social media as the most important element of internet in term of visitors, fake accounts detection has become one of the hardest social media security challenges. Over the years, online social media (OSN) have evolved widely, converting part of our personal lives to virtual ones. But this evolution also has negative effects. In 2012, 16.6 million of Americans were victims of identity theft according to an estimate from the U.S. Bureau of Justice Statistics, with up to $24.7 billion of financial losses for these victims.

Various techniques are used to manipulate users in OSN environments such as social spam, identity theft, spear phishing and Sybil attacks... In this article, we are interested in analyzing the behavior of multiple fake accounts that try to bypass the OSN regulation. In the context of social media manipulation detection, we focus on the special case of multiple Identity ac- counts (Sockpuppet) created on English Wikipedia (EnWiki). We set up a complete methodology spanning from the data extraction from EnWiki to the training and testing of our selected data using several machine learning algorithms. In our methodology we propose a set of features that grows on previous literature to use in automatic data analysis in order to detect the Sock- puppets accounts created on EnWiki. We apply them on a database of 10 000 user accounts. The results compare several machine learning algorithms to show that our new features and training data enable to detect 99 % of fake accounts, improving previous results from the literature



AUTEUR(S)
Zaher YAMAK, Julien SAUNIER, Laurent VERCOUTER

MOTS-CLÉS
aux-nez, application d’apprentissage automatique, manipulation, identité, wikipédia, projets collaboratifs, média social.

KEYWORDS
sockpuppet, machine learning application, manipulation, deception, identity, wikipedia, collaborative project, social media.

LANGUE DE L'ARTICLE
Français

 PRIX
• Abonné (hors accès direct) : 7.5 €
• Non abonné : 15.0 €
|
|
--> Tous les articles sont dans un format PDF protégé par tatouage 
   
ACCÉDER A L'ARTICLE COMPLET  (783 Ko)



Mot de passe oublié ?

ABONNEZ-VOUS !

CONTACTS
Comité de
rédaction
Conditions
générales de vente

 English version >> 
Lavoisier