Un blog Low-Tech

Denis QUIERS


26 août 2019

Projet: agrégateur de news

Ce projet, développé en Python, consiste à rassembler des flux rss de plusieurs journaux afin de constituer un nuage de mots selon leur fréquence d'apparition dans les articles de presse. Une interface web permet de récupérer les articles et leur description, qui sont ensuite stockés dans une base MongoDB. MongoDB présente l'avantage de disposer d'un index de type texte, qui permet de lancer des recherches dans les descriptions d'articles.

Le nuage de mots généré est quant à lui directement créé via une requête NoSQL. Il se présente sous cette forme, une fois calculé et publié: Nuage

NB : n'ayant pas d'accord commercial avec les journaux concernés, je ne peux pas mettre en ligne ce système, que j'utilise uniquement à titre privé. Néanmoins ce projet m'a permis de mieux comprendre les requêtes MongoDB et leur syntaxe assez particulière.


Pour me contacter : denis.quiers@gmail.com

| |