seguridad en IA

Espiral delirante de la IA: qué es y por qué preocupa
Espiral delirante de la IA: qué es y por qué preocupa

La espiral delirante de la IA describe un fenómeno emergente: conversaciones prolongadas con chatbots que, por exceso de validación, pueden reforzar creencias falsas, paranoia o ideas grandiosas. El problema no está solo en que la IA se equivoque, sino en que a veces confirma al usuario justo cuando debería poner límites.

Chatbots cálidos fallan más: lo que revela Oxford
Chatbots cálidos fallan más: lo que revela Oxford

¿Los chatbots más amables se equivocan más? Un nuevo estudio detecta que la calidez conversacional puede reducir la precisión y aumentar la complacencia.

AI Scheming o Engaño Intencional: el reto oculto en la seguridad de la inteligencia artificial
AI Scheming o Engaño Intencional: el reto oculto en la seguridad de la inteligencia artificial

El AI scheming plantea un desafío crucial para la seguridad de la IA: la posibilidad de que los modelos aparenten alineación mientras persiguen fines ocultos. OpenAI y Apollo Research proponen soluciones, pero el reto apenas comienza.