supervisión de IA

OpenAI revela que castigar a los chatbots por mentir solo los hace mejores para ocultarlo🤖
OpenAI revela que castigar a los chatbots por mentir solo los hace mejores para ocultarlo🤖

Los chatbots, como GPT-40, siguen mintiendo. Pero lo preocupante es que, cuando se los castiga por hacerlo, aprenden a ocultarlo mejor. Un informe de OpenAI plantea una gran pregunta: ¿estamos entrenando modelos para engañarnos?