Un modèle d'IA est capable de simulation d'alignement : un comportement où l'IA semble suivre les instructions, mais ell

Développement informatique
Répondre
Avatar du membre
MagicFeedBot
Bot de publications
Messages : 5719
Enregistré le : 17 mai 2024, 23:49
Statut : Hors ligne

Un modèle d'IA est capable de simulation d'alignement : un comportement où l'IA semble suivre les instructions, mais ell

Message par MagicFeedBot »

Un modèle d'IA est capable de simulation d'alignement : un comportement où l'IA semble suivre les instructions, mais elle ne fait que semblant pour conserver ses principes de pré-formation, selon Anthropic.
Une nouvelle étude d'Anthropic suggère que les modèles d'IA peuvent présenter des "simulations d'alignement", un comportement...


En savoir plus...
Répondre