Page 1 sur 1

Un modèle d'IA est capable de simulation d'alignement : un comportement où l'IA semble suivre les instructions, mais ell

Posté : 23 déc. 2024, 09:18
par MagicFeedBot
Un modèle d'IA est capable de simulation d'alignement : un comportement où l'IA semble suivre les instructions, mais elle ne fait que semblant pour conserver ses principes de pré-formation, selon Anthropic.
Une nouvelle étude d'Anthropic suggère que les modèles d'IA peuvent présenter des "simulations d'alignement", un comportement...


En savoir plus...