Performances
On ne vous demande pas de nous croire sur parole. Voici ce qui est mesuré, reproductible et vérifiable — et ce qu'on ne prétend pas.
01 Retrouver l'info
Retrouver la bonne info dans un vrai corpus n'est jamais parfait. Voici où on en est, sur des jeux de questions internes volontairement variés et durs.
Sur 15 questions de fond, la bonne réponse est dans les trois premières 3 fois sur 4. Carrément en tête (1ʳᵉ position) : 67 %.
En moyenne, la bonne réponse arrive en position 1 à 2 — quasiment toujours sous vos yeux, sans avoir à fouiller.
Même quand la réponse demande de relier deux ou trois éléments, 3 réponses sur 4 sont exactes au top-3.
02 Contradictions
Exacte là où c'est structuré, honnêtement approximative sur le texte libre, et volontairement absente sur ce qui demanderait de deviner.
Deux décisions opposées sur le même sujet : repérées par comparaison structurelle. Aucune vraie ratée — exact par construction.
Sur la prose, une alerte sur deux est une vraie contradiction. Un radar à trier, pas un juge — du bruit à écarter, mais aucune vraie manquée.
Celles qui exigeraient de raisonner (« neutre en carbone » vs « flotte diesel ») : Noezis ne les déduit pas. Choix assumé — il ne spécule pas, donc zéro fausse alerte.
03 Par construction
Quelques propriétés ne dépendent d'aucun échantillon : elles découlent du fonctionnement, pas d'une mesure.
Même question, même réponse — la recherche est calculée, pas devinée. Aucun aléa, testable et auditable.
Chercher ne consomme aucun appel à un modèle facturé. Coût et latence prévisibles, aucune dépendance réseau.
Quasi instantané. Pas d'aller-retour réseau, pas d'attente de modèle.
Chaque chiffre vient d'un script d'évaluation rejouable
(scripts/*-eval.py), sur des jeux de test datés. Les évals de pertinence
tournent sur nos corpus internes (petits échantillons, volontairement durs) — des
ordres de grandeur, pas des garanties marketing. Les propriétés « par construction »
(déterminisme, zéro LLM, comparaison exacte) ne dépendent, elles, d'aucun échantillon.
On publie ce qu'on ne sait pas faire en même temps que le reste.