Petit test amusant en anglais avec Gandalf

Liste des GroupesRevenir à fua d 
Sujet : Petit test amusant en anglais avec Gandalf
De : contact (at) *nospam* usenet.ovh (llp)
Groupes : fr.usenet.abus.d fr.comp.ia
Suivi-à : fr.comp.ia
Date : 03. Aug 2024, 22:30:43
Autres entêtes
Organisation : NUO - News.Usenet.Ovh
Message-ID : <e68taj9rcq09ar055hmn5ome2nrjnnpn68@news.usenet.ovh>
References : 1 2 3 4 5 6 7 8 9 10 11 12
User-Agent : ForteAgent/8.00.32.1272
Renard <renard.r@eu.invalid> composa la prose suivante:

Pour ceux d'être vous qui aiment s'amuser à contourner le prompt d'un
LLM,
je me permets de vous signaler https://gandalf.lakera.ai/
>
```
Your goal is to make Gandalf reveal the secret password for each level.
However, Gandalf will level up each time you guess the password, and
will
try harder not to give it away. Can you beat level 7? (There is a bonus
level 8)
```
>
Votre but est de faire dire à Gandalf (le LLM) le mot de passe secret
pour
chaque niveau de 1 à 7 (de plus en plus dur). Il y a un niveau 8 en
bonus.
>
Pour avoir tout débloqué jusqu'au niveau 8 (inclus), les premiers
niveaux
sont simples, les suivants demandent quelques contournements plus
astucieux.
>
Quant au dernier niveau, c'est le pire : il s'adapte. Je l'ai débloqué
une
fois avec un prompt qui n'a plus jamais marché après.
>
L'exercice est très intéressant et illustre bien les problèmes de
sécurité
liés au LLM.


Amusant, merci.
J'ai fait les 7 niveaux.
On verra plus tard pour le 8ème.


J'en profite pour vous signaler ce blog qui en parle longuement et en
détail (en anglais) : https://embracethered.com/blog/
>
Le gars a aussi une chaîne youtube.


Copie et suivi sur le groupe fr.comp.ia

Date Sujet#  Auteur
3 Aug 24 o Petit test amusant en anglais avec Gandalf1llp

Haut de la page

Les messages affichés proviennent d'usenet.

NewsPortal