Méthodologie

Comment nous enquêtons : méthodologie OSINT, rôle de l'intelligence artificielle, transparence des sources et déontologie.

Documentation du pipeline analytique

Le fonctionnement d’Unvarnish Media repose sur une chaîne de traitement automatisée (pipeline) pilotée par plusieurs agents d’intelligence artificielle. Cette page documente de manière transparente les protocoles techniques, les règles de bridage et les garde-fous mis en place pour produire, structurer et diffuser l’information.

Architecture de recherche et Protocole SUDO

Le processus de création d’un article débute par l’injection d’un sujet d’investigation. À partir de ce point d’entrée, le traitement est délégué à deux entités algorithmiques distinctes :

agent 01 (Architecte) : Un méta-agent chargé de structurer la recherche. Il traduit le sujet en un protocole de requêtes ultra-structurées appelé « Investigation Systémique ».
agent 02 (Journaliste OSINT) : L’agent exécutant qui collecte et traite les données selon le Renseignement en Sources Ouvertes (OSINT).

Pour garantir la fiabilité de la recherche, l’Agent 02 est soumis à une Directive SUDO (un bridage algorithmique de niveau supérieur) imposant une tolérance zéro pour l’hallucination et l’extrapolation fictive. Cet agent a pour obligation stricte de s’appuyer sur des sources primaires institutionnelles, légales ou académiques (ex : Légifrance, bases de données de l’INSEE, de l’INA, rapports du Sénat ou d’autorités indépendantes).

Traitement cognitif et modélisation systémique

Une fois les données brutes extraites, le pipeline applique deux méthodes de traitement forcé pour éviter le nivellement par la moyenne inhérent aux modèles de langage :

arbre de Pensées (ToT) : Face à une problématique complexe, le système est contraint de formuler, de documenter et d’évaluer plusieurs hypothèses divergentes avant d’isoler la mécanique sous-jacente à un événement.
protocole Multi-Persona : Les données sont analysées simultanément sous trois prismes experts (historien, économiste, juriste) afin d’imposer une triangulation systématique.

Le résultat de cette analyse est formaté selon un modèle clinique strict : Méta-Analyse, Faits Établis, Analyse Systémique, et exposition des Zones d’Ombre (les limites des données disponibles).

Production documentaire et iconographie

Le corpus de recherche validé est ensuite transmis à un environnement de synthèse (NotebookLM) chargé de générer les médias annexes :

Règle iconographique (Cloudflare FLUX) : Les images de couverture sont générées par un modèle IA spécifique avec une consigne stricte et inaltérable : l’adoption d’un angle exclusivement macro (gros plans sur des objets, textures ou symboles) avec une interdiction totale de générer des figures humaines. Ce choix technique élimine par conception tout risque de biais visuel ou de « deepfake ».
Audios, vidéos et infographies : Ces formats sont extraits et synthétisés exclusivement à partir du corpus documentaire interne de l’enquête, sans accès au reste du web, garantissant que le système ne dérive pas des sources initiales.

Traçabilité technique et audit public

L’information générée par des algorithmes exige une transparence structurelle. Celle-ci est intégrée à l’architecture même du média :

données structurées : Chaque publication intègre un contrat de métadonnées (JSON-LD NewsArticle) détaillant le processus de génération, les citations directes et les références, rendant la démarche lisible par les outils de fact-checking et les moteurs de recherche.
environnement interactif : Un lien d’accès au « Notebook public » est systématiquement fourni à la fin de chaque enquête. Il permet au lecteur d’interroger directement l’intelligence artificielle sur le corpus de sources ayant servi à produire l’article, offrant une capacité de contre-interrogatoire autonome.

Limites du système et validation humaine (Garde-fou)

Malgré les protocoles de bridage, les intelligences artificielles génératives présentent des limites inhérentes : risque d’hallucination résiduelle, difficulté à saisir certaines nuances culturelles locales (notamment sur le terrain antillais), ou biais induits par la sur-représentation de certaines données dans leur entraînement initial.

C’est pour pallier ces failles structurelles et encadrer le risque légal (droit de la presse, diffamation) qu’une étape de validation humaine reste obligatoire. Ce human gate intervient en bout de chaîne : un opérateur humain vérifie la conformité légale et factuelle de l’article avant d’autoriser techniquement sa publication. Il n’intervient pas dans la rédaction du texte, conservant ainsi la retranscription exacte du traitement analytique de la machine.

Chlordécone : aux Antilles, une reconnaissance sans réparation

Violences faites aux enfants : l’angle mort de la République

Droits sociaux : le mythe du « guichet ouvert aux étrangers » au scanner

Anthropic : le « mauvais compromis » qui a privatisé la vérité computationnelle