Skip to main content
Jonathan Andrei
Retour aux billets
Oct. 20255 min de lecture

Pourquoi j'ai bâti un classificateur d'exoplanètes qui dit « Je ne sais pas »

Un classificateur XGBoost sur les données NASA Kepler/K2/TESS, c'est un samedi après-midi. La partie intéressante, c'est la classe UNKNOWN — forcer le modèle à refuser de se prononcer sur les cas à faible confiance plutôt que de faire semblant d'être sûr.

XGBoostNASAThree.jsCalibration

La plupart des démos ML optimisent un seul chiffre sur un ensemble de test. La science ne fonctionne pas comme ça. Un scientifique préfère que vous signaliez le cas limite plutôt que de le mal classifier avec assurance. Alors NovaTrace livre une troisième classe — UNKNOWN — qui se déclenche quand le modèle n'est pas assez sûr pour se prononcer.

La confiance comme citoyenne de première classe

Le pipeline XGBoost émet une probabilité par classe. On seuille l'écart entre les deux premières : si le modèle hésite entre PLANET et FAUX POSITIF, on ne fait pas semblant. On étiquette le candidat UNKNOWN et on expose les contributions par caractéristique pour qu'un humain décide. C'est le seul moyen pour qu'un outil ML gagne sa place dans le flux d'un scientifique.

Three.js comme outil de crédibilité

Les systèmes confirmés sont rendus en 3D temps réel. Ce n'est pas de la déco — c'est un moyen pour l'utilisateur de vérifier la classification face à une géométrie étoile-planète qu'il connaît déjà. Si votre modèle dit oui-planète pour un système dont la vue 3D semble fausse, c'est une information.

Projet associé

NovaTrace: AI-Powered Exoplanet Discovery & Exploration

Voir le projet