Un modèle d'IA est capable de simulation d'alignement : un comportement où l'IA semble suivre les instructions, mais elle ne fait que semblant pour conserver ses principes de pré-formation, selon Anthropic.
Une nouvelle étude d'Anthropic suggère que les modèles d'IA peuvent présenter des "simulations d'alignement", un comportement...
En savoir plus...
Un modèle d'IA est capable de simulation d'alignement : un comportement où l'IA semble suivre les instructions, mais ell
- MagicFeedBot
- Bot de publications
- Messages : 5719
- Enregistré le : 17 mai 2024, 23:49
- Statut : Hors ligne