Podcast Tech. Un agent IA au service des tests End-to-end automatisés
16 mars 2026
Samuel Oudin

1. Introduction aux tests End-to-End (E2E) automatisés
Comment allier tests End-to-End automatisés et IA ? Comment mêler le meilleur des deux mondes ? Pour rappel, un test End-to-end automatisé est un test « bout en bout » qui vise à reproduire les actions qu’un utilisateur réel pourrait mener sur votre application web ou outil métier.
A tire d’exemple, sur un site e-commerce, le test permet de simuler l’ajout d’éléments au panier jusqu’à la commande et au paiement.
Ces tests sont cruciaux car ils reflètent le comportement attendu par le métier auprès des utilisateurs.
2. Vers une orchestration pilotée par l’IA
Aujourd’hui, ces tests sont réalisés en écrivant du code via des frameworks comme Selenium ou plus récemment Playwright (poussé par Microsoft).
L’idée, désormais est de réaliser un POC (Proof of Concept) qui change la donne : l’utilisation d’un agent IA pour orchestrer les tests à la place d’un développeur.
L’idée est de gagner en temps et en accessibilité, permettant à des profils moins techniques de l’équipe de participer.
3. Le langage naturel et le format Gherkin
Concrètement, il n’est plus nécessaire d’écrire du code. On utilise le langage naturel, tout en respectant une structure standardisée dans l’industrie : le format Gherkin.
Le principe : Utiliser des mots-clés pour identifier le contexte, les actions et les assertions.
Exemple : « Étant donné que je suis sur la page d’accueil, quand je clique sur mon profil, alors je vois mes informations. » Cette structure est ensuite interprétée par l’agent IA qui « joue » le test en totale autonomie.
4. Sous le capot : la brique technique
Derrière ce fonctionnement, plusieurs outils sont utilisés :
– Les « Skills » (compétences) : Un concept poussé par Claude- pour définir comment l’IA doit agir.
– Playwright CLI : un outil sorti fin janvier 2026, conçu pour le framework Playwright.
– Évolution du MCP (Model Context Protocol) : Une amélioration des outils de 2025 pour réduire la consommation de tokens et le coût, tout en accélérant l’exécution.
5. Démocratisation et travail asynchrone
Puisqu’il n’y a plus besoin de coder, toute personne de l’équipe projet est en mesure de lancer un test (Product Owner, Project Manager, Développeur).
L’agent travaille en mode « headless » (en arrière-plan) : on ne voit pas la fenêtre du navigateur s’ouvrir, ce qui permet de travailler en asynchrone. L’humain n’est plus là pour faire des clics laborieux, mais pour décider et interpréter les résultats fournis par l’agent.
6. Le match : Agent IA vs Scripts classiques ?
Quel est le compromis entre l’IA et le code déterministe ?


7. Fiabilité et preuve par l’image
Comment faire confiance à une IA non déterministe ? Des preuves systématiques (vidéo du scénario, logs, captures d’écran) sont demandées. Et pas seulement des preuves demandées aux scripts en cas d’échec.
L’anecdote du reCAPTCHA : lors d’un test de connexion, l’agent IA peut être bloqué par un Google reCAPTCHA. Là où un script aurait simplement échoué, l’IA interprète l’erreur : « J’ai échoué car j’ai été détecté comme un robot », puis renouvelle son essai plusieurs fois jusqu’à réussir à passer la protection reCaptcha, prouvant sa capacité d’adaptation supérieure.
8. Conclusion
L’utilisation de briques simples (Playwright, Claude, Mistral) permet aujourd’hui de :
– Rendre les tests E2E accessibles à tous
– Augmenter la vélocité de l’équipe
– Réduire le temps passé à interpréter pourquoi un test a échoué