Cómo los artículos generados con ChatGPT están afectando la integridad de Google Scholar

El creciente uso de inteligencia artificial generativa, como ChatGPT, para producir artículos académicos está generando preocupaciones significativas en la comunidad científica. Según un análisis basado en datos de Google Scholar, numerosos documentos que parecen estar creados parcial o totalmente con herramientas como ChatGPT están encontrando su lugar junto a investigaciones legítimas.

Estos artículos, aunque aparentan ser legítimos, contienen contenido cuestionable y, en muchos casos, manipulan la infraestructura de comunicación académica. Esto plantea riesgos no solo para la integridad de la ciencia, sino también para la confianza del público en las investigaciones académicas.

En este artículo, resumimos los hallazgos clave de un estudio que analiza el impacto de los artículos generados con ChatGPT en Google Scholar y discutimos las implicaciones para la comunicación académica y la confianza en la ciencia.

Prev 1 of 1 Next

🎙️ Podcast #143: ¿Pueden los Artículos Falsos Engañarnos en Google Scholar?

Prev 1 of 1 Next

Hallazgos clave del estudio

El estudio, basado en el análisis de artículos indexados en Google Scholar, revela una creciente presencia de publicaciones fabricadas con ChatGPT. Aquí están los resultados más relevantes:

1. Alta prevalencia de artículos generados con ChatGPT

139 artículos fabricados con GPT fueron identificados como resultados regulares en Google Scholar.
De estos, el 62% no declararon el uso de herramientas como ChatGPT, lo que plantea preocupaciones sobre la transparencia.
La mayoría de estos artículos fueron publicados en revistas no indexadas (64%), mientras que un menor porcentaje apareció en revistas indexadas y repositorios académicos.

Distribución por temas

Los artículos se centraron principalmente en áreas de alta relevancia social y política:

Computación: 32 artículos.
Medio ambiente: 27 artículos.
Salud: 20 artículos.
Otros temas: 60 artículos.

En particular, los temas relacionados con la salud y el medio ambiente (34% del total) fueron los más representados. Palabras clave comunes incluyeron «clima sostenible», «inteligencia artificial en salud» y «políticas globales».

2. Amplia diseminación de artículos en la infraestructura académica

Los artículos identificados no solo se encontraron en Google Scholar, sino también en múltiples plataformas como ResearchGate, ORCiD, IEEE y redes sociales como X/Twitter.
Riesgo de permanencia: Incluso si un artículo es eliminado de su fuente original, su difusión en repositorios y plataformas paralelas hace que sea difícil rastrearlo y eliminarlo por completo.

Ejemplo de dominios principales por tema:

Salud: ResearchGate (15), IEEE.org (4), Twitter.com (3).
Medio ambiente: ResearchGate (13), ORCiD (4), EasyChair (3).

3. Falta de filtros en Google Scholar

Google Scholar, a menudo considerado una fuente confiable de literatura académica, presenta un grave problema: no ofrece opciones de filtro para diferenciar entre materiales revisados por pares y literatura gris.

Esto permite que documentos generados con IA se mezclen con investigaciones legítimas, aumentando el riesgo de que el público acceda y confíe en contenido cuestionable.
Según el estudio, esta falta de transparencia agrava el problema del «evidence hacking» o manipulación maliciosa de la base de evidencia científica.

Riesgos asociados a los artículos fabricados con ChatGPT

1. Compromiso de la integridad científica

La presencia de estos artículos puede:

Socavar la confianza en la ciencia.
Manipular las decisiones políticas y públicas al presentar investigaciones falsas como evidencia legítima.
Crear un efecto dominó en la comunidad académica, afectando revisiones sistemáticas y metaanálisis.

2. Riesgos sociales y políticos

Temas como el cambio climático y la salud pública ya son propensos a desinformación. La inclusión de estudios falsos amplifica estas divisiones al:

Dar soporte a narrativas conspirativas.
Confundir al público y a los legisladores sobre qué investigaciones son fiables.

3. Persistencia del contenido malicioso

Incluso si un artículo es retractado, su replicación en múltiples plataformas dificulta su eliminación total, perpetuando su impacto negativo.

Recomendaciones del estudio

Para mitigar el impacto de los artículos generados con IA en la comunicación académica, el estudio sugiere un enfoque multifacético:

1. Mejoras técnicas en Google Scholar

Opciones de filtro: Implementar filtros para limitar los resultados a revistas revisadas por pares o publicaciones indexadas.
Etiquetas claras: Identificar artículos generados con IA o que contengan texto fabricado.
Evaluación automatizada: Utilizar herramientas avanzadas para identificar texto sospechoso generado por GPT.

2. Regulación y estándares claros

Desarrollar estándares transparentes para la inclusión de documentos en Google Scholar y otras plataformas académicas.
Fomentar el desarrollo de motores de búsqueda académicos alternativos sin fines comerciales que prioricen el interés público.

3. Educación y concienciación

Capacitar a los comunicadores de ciencia, periodistas y responsables políticos para identificar artículos fraudulentos.
Promover la alfabetización en el uso de herramientas de búsqueda académica.

FAQ – Preguntas frecuentes sobre artículos generados con ChatGPT

1. ¿Cómo identificar un artículo académico fabricado con ChatGPT?

Busca frases típicas de respuestas de IA como «según mi última actualización de conocimientos». Revisa también si el artículo declara el uso de herramientas de IA.

2. ¿Qué es el «evidence hacking»?

Es la manipulación estratégica de la evidencia científica para influir en la opinión pública o en decisiones políticas mediante la creación o diseminación de investigaciones fraudulentas.

3. ¿Qué papel juega Google Scholar en este problema?

Google Scholar permite que tanto artículos revisados por pares como literatura gris se mezclen en sus resultados, lo que facilita la difusión de artículos fabricados con GPT.

4. ¿Cómo puedo evitar confiar en artículos fraudulentos?

Consulta siempre las fuentes y verifica si el artículo ha sido publicado en una revista confiable y revisada por pares.

5. ¿Qué se puede hacer para proteger la integridad científica?

Se necesitan medidas técnicas, educativas y regulatorias para prevenir la inclusión de artículos generados con IA en plataformas académicas.

El creciente uso de herramientas como ChatGPT para crear artículos académicos está generando serios problemas para la comunicación científica y la confianza pública en la ciencia. La falta de transparencia en plataformas como Google Scholar agrava esta situación, haciendo urgente la implementación de soluciones técnicas y regulatorias para mitigar los riesgos asociados.

📌 Para más información sobre tecnología e integridad científica, visita fernandojuca.com y suscríbete al canal de YouTube Fernando Juca Maldonado. 🚀

Fuente: GPT-fabricated scientific papers on Google Scholar: Key features, spread, and implications for preempting evidence manipulation | HKS Misinformation Review

Post Views: 376