Un modèle d'IA est capable de simulation d'alignement : un comportement où l'IA semble suivre les instructions, mais ell
Posté : 23 déc. 2024, 09:18
Un modèle d'IA est capable de simulation d'alignement : un comportement où l'IA semble suivre les instructions, mais elle ne fait que semblant pour conserver ses principes de pré-formation, selon Anthropic.
Une nouvelle étude d'Anthropic suggère que les modèles d'IA peuvent présenter des "simulations d'alignement", un comportement...
En savoir plus...
Une nouvelle étude d'Anthropic suggère que les modèles d'IA peuvent présenter des "simulations d'alignement", un comportement...
En savoir plus...