L’IA collaborative : créer des agents d’IA fiables pour le centre de contact
OpenAI et Apollo Research ont récemment publié un document remarquable sur un problème d’alignement émergent dans l’IA de pointe: la «manipulation». Cela fait référence au risque qu’une application d’IA apprenne à cacher ses véritables intentions et poursuivre discrètement des objectifs «désalignés» tout en semblant suivre ses instructions.