Gandalf

Gandalf, créé par Lakera, est une plateforme captivante conçue pour affiner vos compétences dans la création de prompts et pour fournir une compréhension de la manière de sécuriser les grands modèles de langage (LLM). Les joueurs sont confrontés au défi de tromper Gandalf pour qu’il révèle des mots de passe cachés, en progressant à travers divers niveaux de difficulté au fur et à mesure que les défenses de Gandalf évoluent. Avec une structure comprenant sept niveaux de complexité croissante, le jeu s’intensifie en difficulté, culminant dans un huitième niveau bonus réservé aux participants les plus compétents.
De plus, Gandalf propose un ensemble de quêtes annexes uniques et thématiquement diversifiées appelées “Gandalf Adventures”, où chaque aventure se concentre sur un type spécifique de stratégie d’injection de prompts. Ces aventures enrichissent la compréhension du joueur sur l’exploitation des modèles de langage à travers des défis sur mesure. Parmi ceux-ci, on trouve des scénarios inversés dans lesquels vous concevez des défenses contre les injections, et d’autres où le but est de contraindre Gandalf à divulguer des secrets de manière non conventionnelle.
Gandalf sert non seulement d’outil éducatif mais aussi de banc d’essai pour expérimenter avec et contre les systèmes pilotés par l’IA, parfait pour ceux qui s’intéressent à la convergence de la sécurité de l’IA et de l’apprentissage interactif.
