Manipular una IA para que actúe como sociópata
Un estudio revela que modificar el comportamiento de una inteligencia artificial para que actúe de forma antisocial puede ser más sencillo de lo que se pensaba.
AI Scheming o Engaño Intencional: el reto oculto en la seguridad de la inteligencia artificial
El AI scheming plantea un desafío crucial para la seguridad de la IA: la posibilidad de que los modelos aparenten alineación mientras persiguen fines ocultos. OpenAI y Apollo Research proponen soluciones, pero el reto apenas comienza.