Bonjour
Nous avons des besoins importants et très urgents pour différents projets, et faisons un appel à bénévolat.
Nous comptons donc vraiment sur vous… Il y a différents importants combats à mener, autour de la protection de nos données pour limiter le fichage.
Juristes RGPD
Nous avons évidemment besoin de personnes spécialistes du Droit de la protection des données, en particulier pour des questions liées à la RGPD, pour nous donner des conseils ou rédiger quelques courts articles de synthèse.
API Twitter
Nous aimerions bien comprendre ce que permet l’API Twitter, ce qu’elle contient, comment elle s’interroge via des programmes, etc.
Création de sites Web
Il nous faut créer rapidement un site Web très simple pour aider les gens à porter plainte contre le fichage par la Galaxie Disinfo…
Graphistes
Nous avons de différents graphistes (pour partager les taches) pour réaliser de belles images (Photoshop) pour illustrer les articles.
Data Scientists
Comme l’affaire touche au Big Data, nous aimerions avoir des contacts avec des personnes spécialisées sur le traitement en masse de données, en cas de besoin. M. Vanderbiest indique avoir utilisé la « méthode de Louvain » pour rapprocher les comptes, nous aimerions qu’un spécialiste nous explique comment cela marche…
Organisateurs
Le suivi de ces projets demande de l’aide en organisation ; les personnes à l’aise avec ceci et ayant un peu de temps sont bienvenues.
Rédacteurs
Enfin, de l’aide pour la rédaction d’articles de synthèse (courts et simples) sur ces sujets serait bienvenue – si vous avez une belle plume et une bonne capacité de recherche et de synthèse, n’hésitez pas…
=> Contact
Contactez-nous ici en indiquant en objet le sujet sur lequel vous vous proposez…
Merci d’avance aux volontaires ! (vos soutiens sont vraiment très précieux) 🙂
P.S. si on ne répond pas tout de suite, excusez-nous (vos propositions sont enregistrées et utilisées en fonction des besoins, merci !). N’hésitez pas aussi à re-proposer une 2e fois si vous l’avez fait par le passé, une erreur est toujours possible…
Commentaire recommandé
Ne serait-il pas judicieux de réaliser un partenariat étroit – pour l’occasion – sur les problèmes juridiques avec la quadrature du net ? Il y a des pointures là-bas.
12 réactions et commentaires
Ne serait-il pas judicieux de réaliser un partenariat étroit – pour l’occasion – sur les problèmes juridiques avec la quadrature du net ? Il y a des pointures là-bas.
+11
AlerterLa quadrature du net… Vous parlez de l’association financée par George Soros ?
https://www.laquadrature.net/fr/ils-soutiennent-la-quadrature-du-net
+2
AlerterPour la Méthode de Louvain:
https://youtu.be/PTkIQuj6rrk
+6
AlerterPetite info: un des auteurs à l’origine de cette méthode (http://iopscience.iop.org/article/10.1088/1742-5468/2008/10/P10008/meta) est le recteur actuel de cette université catholique de louvain. Ces auteurs, qui sont eux des vrais scientifiques (profs et dr. en maths appliquées, data science, informatique), n’ont évidemment absolument rien à voir dans disinfo et leurs trucs machins brols complètement foireux. On peut juste regretter que l’UCL ne vérifie pas à deux fois la qualité et l’éthique de ses doctorants en communication.
+2
AlerterTrès bien (bien que je n’ai pas tout compris pour le moment, seulement l’idée globale de la méthode ).
Resterait à décrypter cette méthode plutôt technique. Pour le laplacien du graphe (et non le laplacien en tant qu’opérateur, il n’y a aucun espace vectoriel), la matrice des degrés et le spectre, je pense que cette page wiki peut être utile pour en comprendre un peu plus :
https://fr.wikipedia.org/wiki/Matrice_laplacienne
+0
AlerterPour l’idée globale de la méthode, je pense qu’on peut la comprendre comme cela (et si j’ai bien compris) :
– Au début il y a un grand nombre de comptes (noeuds) et de relations (arêtes) entre les comptes. Le but est de déterminer des communautés dans cet ensemble de comptes.
Cependant, si j’en crois la page wiki, il faut que les relations ne soient pas orientées (si JL Mélenchon envoie un tweet à E.Macron, on ne peut pas en déduire que les deux appartiennent à la même communauté …). Aussi il resterait à connaître la façon adoptée sur le comment une relation non orientée est déterminée entre deux comptes avant d’utiliser la méthode de Louvain.
– Une fonction (modularité) permet de comparer les relations à l’intérieur des communautés avec les relations inter-communautaires. Plus le résultat donné par cette fonction est grand et plus ces communautés se définissent.
– Pour chaque compte, on détermine les relations -non orientées- avec les voisins, puis les communautés élémentaires de façon que la modularité soit la plus grande possible.
– Une fois ces communautés élémentaires définies, on passe à l’étape suivante (graphe agrégé), celle où on assimile ces communautés élémentaires à des noeuds (en gros, on rassemble les comptes par petits paquets). Les nombres d’arêtes sont recalculées. C’est le passage dans la vidéo où on comprend difficilement (car passé rapidement)… Sans doute pour trouver des ‘communautés de communautés élémentaires’ ?
– Enclenchement de l’algorithme : On répéte les deux dernières phases jusqu’à ce que la modularité soit à son maximum. La première phase étant refaite en affinant davantage les communautés élémentaires.
Note : Bien que j’ai fait mes études dans les mathématiques pures (il y a une vingtaine d’années – niveau maîtrise), je n’avais jamais étudié la branche de la théorie des graphes (que je trouve intéressante). Ce serait bien qu’une personne qui travaille dans ce domaine puisse donner son avis. Il semblerait aussi que la recherche des méthodes de « clustérisation » (partitionnement) aient des applications dans des domaines divers dont celui-ci en particulier avec les réseaux sociaux.
Un lien intéressant sinon : https://hal.archives-ouvertes.fr/hal-01218625/document
+0
AlerterHmm… j’ai dit que, dans la phase 1 de l’algorithme les communautés étaient affinées, et que dans la phase 2 je m’interrogeais sur une recherche de grandes communautés à partir du graphe agrégé.
Je pense désormais qu’il serait plus probable que la phase 2 ne recherche pas de grandes communautés et que dans la phase 1 les communautés élémentaires grossissent, au fur et à mesure de l’avancée de la répétition des deux phases, jusqu’à devenir les grandes communautés recherchées.
Je m’arrête là (au risque de couvrir le fil des discussions :-p), en laissant ma réflexion dans l’attente d’une confirmation (ou du contraire).
+0
Alerter(Edit : J’ai dit une -petite- bêtise, je n’avais pas vu qu’il était possible d’utiliser la matrice de Laplace dans le cas d’un graphe orienté, bien que cette matrice ne soit plus symétrique dans ce cas.
Dans la vidéo, l’auteur ne montre pas de flèches entre les noeuds, il songeait donc à un graphe non orienté pour son explication.
Sinon, le choix d’un graphe non orienté me paraît plus pertinent dans notre « cas d’étude » sur un réseau social, un simple envoi de tweet d’un individu à un autre ne suffisant pas pour établir la constitution des communautés)
+1
AlerterRédacteur
Je vous propose mon aide, en tant que rédacteur.
à bientôt
+3
AlerterEn ce qui concerne le Twitter API – Data Mining, voilà une série d’explications (en anglais) sur l’extraction des données:
en Python:
https://www.youtube.com/watch?v=qZgx0pMR-Ps
https://www.coursera.org/lecture/social-media-data-analytics/video-3-using-python-to-extract-data-from-twitter-rs7Oh
ou en PHP:
https://youtu.be/1ItudXGjLpM
Il existe même des outils tout fait apparemment: https://marketplace.informatica.com/solutions/extract_data_from_linkedin_facebook_and_twitter
Je sais pas si c’est ce que vous recherchez mais il y a pas mal d’infos sur YT !
+1
Alerter« API Twitter
Nous aimerions bien comprendre ce que permet l’API Twitter, ce qu’elle contient … »
Mais il suffit de demander à Twitter lui-même :
https://developer.twitter.com/en/docs/tweets/search/overview
On apprend que l’API twitter se décline en trois outils
1) « standard », qui permet des recherches simples sur un échantillon de tweets des sept derniers jours. Vise à la pertinence, mais pas à l’exhaustivité.
2) « premium », lui-même divisé en recherche sur les trente derniers jours, et recherche sur les archives complètes depuis 2006. Chaque demande peut comporter jusqu’à 1024 caractères.
3) « enterprise », partagé comme premium. Chaque demande peut comporter jusqu’à 2048 caractères.
Pour savoir ce que l’on peut chercher, et comment (connexion à une URI, du style https://api.twitter.com/1.1/tweets/search/), il faut lire les pages présentant les syntaxes, les mots-clefs et les opérateurs de chacun de ces trois outils.
Par exemple les opérateurs de la version « premium » sont ici :
https://developer.twitter.com/en/docs/tweets/search/guides/premium-operators
Au passage, des graphistes qui font des taches, ce n’est pas vraiment professionnel, il vaudrait mieux leur demander des tâches.
+2
AlerterJ’vous ai fait un mail il y a 3 jours en qualité de spécialiste en amateur (mais dév web de métier) de l’API Twitter, officiant avec @YMobActus et @ToPolitiq un fichage de plusieurs dizaines de milliers de profils de journalistes, médias, politiques et institutions depuis 2010.
Un expert dans l’usage Pro de Twitter conviendrait mieux, mais je pense pouvoir vous pré-informer correctement.
+2
AlerterLes commentaires sont fermés.