WatchNews (2018)

Besoin

Lien vers la présentation du projet

En 2018, le projet s'est focalisé sur l'analyse de la presse en ligne. L'idée était de développer un site web effectuant quotidiennement et en temps réel cette analyse, et permettant d'obtenir des statistiques générales, par thème ou par mot-clé.

20 mn
Futura Sciences
La Dépêche
Le Figaro
Le Gorafi
Le Monde
Le Point
L'équipe
L'Humanité
iberation
L'obs
Sciences et Vie

Le site doit permettre la comparaison du traitement d'un thème en fonction des sources, permettant ainsi d'étudier les éventuels biais de traitements des différentes sources.

Organisation du projet

Pour ce projet, les étudiants ont été répartis en 9 groupes de travail, dirigés par un groupe de gestion de projet, composé de 6 étudiants. Cette année, les technologies utilisées ont été imposées.

Les groupes de travail étaient les suivants :

  • Groupe 1: Supervision
  • Groupe 2: BD-Index
  • Groupe 3: BD-Serveur
  • Groupe 4: Robot
  • Groupe 5: Filtrage de texte
  • Groupe 6: Analyse sémantique
  • Groupe 7: Prédiction / Classification
  • Groupe 8: Analyse de tendance / statistiques
  • Groupe 9: Application Web
  • Groupe 10: Qualité / Communication

Technologies utilisées

mySQL
flask
laravel
html
python
nltk
spacy
spacy

Quelques fonctionnalités de l'application finale

Deux étudiants de L3 ont repris en stage le travail effectué par les 3 promos pour aboutir à un produit fini et visible de tous. L'application est en ligne ici.

Jauges d'évolution des tendances liées aux sentiments du jour et de la semaine par rapport à la tendance globale.

La flèche noire correspond au jour tandis que la grise est pour la semaine. Pour les sentiments négatifs (Peur, Colère, Tristesse, Dégoût), une augmentation se traduira par une jauge dans le rouge. A l'inverse, pour les sentiments positifs (Joie, Surprise), l'augmentation sera montrée dans la jauge verte.

Nuage des mots-clés de la semaine, c'est-à-dire des mots les plus présents.

Plus le mot est écrit en gros, plus son niveau de pertinence est élevé. La couleur du mot indique sa tendance, s'il est écrit en rouge, alors cela signifie qu'il est de moins en moins présent. Au contraire, la couleur verte indique qu'il aura pris de l'importance.

Ratio de sentiments pour les articles qui contiennent le mot choisi, ici le mot "vaccin".

Analyse possible sur la semaine, le mois,l'année ou bien une période choisie.

Evolution du nombre d'articles de la période donnée contenant le mot choisi (ici "vaccin" de nouveau) selon le jour et le thème.

Pour visualiser un thème en particulier, il est possible de retirer un thème de l'affichage en cliquant sur sa légende. .

Plus en détail

Twitter du projet

Voici quelques documents effectués par les étudiants à l'issue des 15 jours de travail: