Codex Security: pourquoi OpenAI se passe d’un rapport SAST

En bref

OpenAI a publié une note technique qui va faire réagir pas mal d’équipes sécurité: Codex Security ne démarre pas avec un rapport SAST, mais avec une lecture directe du dépôt, du contexte applicatif et une phase de validation en sandbox.

Le pari: réduire le bruit, remonter moins d’alertes mais avec un niveau de preuve plus élevé. Pour les décideurs, l’enjeu n’est pas de “remplacer le SAST”, mais de changer l’ordre des outils dans la chaîne DevSecOps.

Ce qu'il faut retenir

OpenAI explique que les vulnérabilités les plus coûteuses sont souvent des problèmes d’invariants (ordre des transformations, logique métier, écarts entre intention et implémentation), pas uniquement des flux source → sink.
Le SAST reste utile pour les classes connues et la standardisation, mais il peine sur certains cas complexes (normalisation, ambiguïtés de parsing, faux positifs massifs).
L’approche proposée par Codex Security vise une sortie “prête à décider”: hypothèse, reproduction, validation, puis proposition de correction.
Pour une direction tech, cela implique de passer d’une logique “volume d’alertes” à une logique “qualité des preuves + temps de remédiation”.

Analyse

1) Le changement de paradigme: de la détection à la démonstration

Dans son billet, OpenAI insiste sur un point simple: voir une fonction de sanitization dans le code ne prouve pas que la propriété de sécurité tient jusqu’au bout de la chaîne de transformations.

C’est un peu comme vérifier qu’un pêcheur a bien mis son gilet de sauvetage… sans regarder si le bateau a une voie d’eau. Le geste est là, mais la sécurité réelle dépend du système complet.

En pratique, l’approche décrite est orientée “preuve”: lecture contextualisée, réduction en micro-cas testables, puis validation technique (jusqu’au PoC quand possible).

2) Pourquoi ce sujet est “business critical”

Côté management, le vrai coût n’est pas l’alerte brute, c’est le temps perdu en triage puis en aller-retour entre sécurité et delivery.

La documentation NIST SSDF rappelle justement qu’une démarche sécurité efficace doit rester orientée résultats et intégrée au cycle de développement, pas transformée en checklist cosmétique. Cette logique colle bien avec le positionnement “moins d’alertes, plus actionnables”.

Autrement dit: une équipe qui corrige 5 vulnérabilités prouvées par sprint est souvent plus performante qu’une équipe qui ferme 200 tickets “probablement faux positifs”.

3) Le point technique qui compte: les bugs de transformation

OpenAI cite explicitement les failles liées à l’ordre validation/décodage et aux ambiguïtés de parsing. Le cas Express (CVE-2024-29041) illustre bien le sujet: le flux de données paraît propre, mais l’interprétation finale du redirect peut contourner une allowlist.

Ce type de bug échappe souvent aux approches trop linéaires. D’où l’intérêt d’un moteur qui tente de falsifier l’invariant, au lieu de cocher “sanitizer trouvé = dossier classé”.

Risques

Risque de sur-promesse IA: ce modèle n’élimine pas le besoin d’expertise humaine, surtout sur la priorisation métier.
Risque d’abandon trop rapide du SAST: mauvaise idée. Le SAST reste un filet utile pour les classes standards et la conformité.
Risque opérationnel: sans métriques de qualité (taux de validation, temps de correction, réouverture), impossible de prouver le ROI.
Risque de gouvernance: un pipeline agentique sans garde-fous (sandbox, traçabilité, revue) peut créer de nouvelles surfaces d’erreur.

Sources

OpenAI — Why Codex Security Doesn’t Include a SAST Report: https://openai.com/index/why-codex-security-doesnt-include-sast (consulté le 2026-03-17)
NIST — Secure Software Development Framework (SP 800-218): https://csrc.nist.gov/Projects/ssdf (consulté le 2026-03-17)
OWASP — Source Code Analysis Tools (SAST): https://owasp.org/www-community/Source_Code_Analysis_Tools (consulté le 2026-03-17)
NVD — CVE-2024-29041 (Express open redirect): https://nvd.nist.gov/vuln/detail/CVE-2024-29041 (consulté le 2026-03-17)