Cómo diseñar exámenes resistentes a la IA
Los exámenes resistentes a la IA se han vuelto una necesidad real para docentes universitarios y de otros niveles educativos. Herramientas como ChatGPT, Gemini, Copilot y otros asistentes generativos pueden responder en segundos preguntas teóricas simples, definiciones, listas de características o explicaciones generales. Por eso, el problema no se resuelve únicamente prohibiendo la inteligencia artificial, sino mejorando el diseño de las preguntas. Un examen verdaderamente útil debe evaluar análisis, aplicación práctica, interpretación de datos, toma de decisiones y justificación. Esta idea coincide con el planteamiento central del videotutorial: si la evaluación se basa solo en preguntas de copiar y pegar, cualquier IA podrá resolverla con facilidad.
La pregunta incómoda: ¿existe un examen 100% anti-IA?
No. Un examen completamente imposible de resolver con ayuda de inteligencia artificial no existe, especialmente si se aplica en modalidad virtual, fuera de un entorno controlado o con acceso libre a dispositivos. La IA puede ayudar a redactar respuestas, explicar conceptos, resolver ejercicios, interpretar imágenes en algunos casos y sugerir argumentos. Por eso, el enfoque más realista no es buscar una evaluación “blindada”, sino una evaluación más resistente al uso automático de IA.
La diferencia es importante. Un examen vulnerable puede ser resuelto copiando la pregunta y pegándola en una herramienta. Un examen resistente exige interpretar un contexto, usar información trabajada en clase, analizar datos específicos, justificar decisiones o detectar errores. La IA puede seguir ayudando, pero ya no basta con una respuesta genérica.
El debate no es menor. En educación superior, el uso de IA generativa por parte de estudiantes se ha expandido rápidamente. Una encuesta citada por The Guardian en 2025 informó que el 92% de estudiantes universitarios en Reino Unido declaraba usar herramientas de IA generativa, frente al 66% registrado en 2024. El mismo reporte advertía que las universidades debían revisar sus métodos de evaluación y formar mejor a docentes y estudiantes en el uso responsable de estas herramientas.
El problema de las preguntas de memorización
Las preguntas de memorización son las más vulnerables. Enunciados como “defina”, “enumere”, “mencione”, “qué es” o “cuáles son las características de” suelen producir respuestas rápidas, correctas en apariencia y fáciles de generar por una IA.
Ejemplo vulnerable:
¿Qué es el comercio electrónico?
Esta pregunta puede responderse en segundos con cualquier herramienta de IA, buscador o material básico de clase. No exige reflexión, aplicación ni criterio propio. En cambio, una pregunta mejor diseñada sería:
Explique cómo el comercio electrónico puede mejorar las ventas de una pequeña empresa local y justifique su respuesta con un ejemplo contextualizado.
La diferencia es clara. La primera pregunta evalúa memoria conceptual. La segunda exige comprensión, aplicación y justificación. La IA podría generar una respuesta, pero el estudiante tendría que adaptar, contextualizar y demostrar criterio.
De la memoria a la aplicación
No se trata de eliminar toda pregunta conceptual. En muchos cursos es necesario comprobar que el estudiante comprende definiciones básicas. Sin embargo, si todo el examen se basa en memoria, la evaluación queda debilitada frente a la IA.
Una mejor estrategia consiste en transformar preguntas teóricas en preguntas de aplicación:
| Pregunta vulnerable | Pregunta más resistente |
|---|---|
| Defina segmentación de mercado. | Una pyme de Machala vende productos agrícolas y tiene bajo presupuesto publicitario. ¿Qué estrategia de segmentación sería más adecuada y por qué? |
| Enumere ventajas del comercio electrónico. | Analice dos ventajas del comercio electrónico para un negocio local y explique cuál tendría mayor impacto a corto plazo. |
| ¿Qué es liquidez financiera? | Analice este balance simplificado y determine si la empresa presenta problemas de liquidez. Justifique. |
| Mencione características de una rúbrica. | Revise esta rúbrica y señale qué criterio debería mejorarse para evaluar mejor el desempeño del estudiante. |
Esta transformación obliga a que el estudiante use el conocimiento en una situación determinada. Esa es la base de una evaluación más sólida.
Usar preguntas contextualizadas
Una pregunta contextualizada presenta una situación concreta que el estudiante debe interpretar. Puede incluir una empresa, una ciudad, un caso institucional, un perfil de cliente, un problema profesional o una situación de aula. El objetivo es que la respuesta no sea una definición universal, sino una decisión aplicada al contexto.
Ejemplo:
Una pyme en Machala vende productos agrícolas y cuenta con poco presupuesto para publicidad digital. ¿Qué estrategia de segmentación sería más adecuada para iniciar una campaña en redes sociales? Justifique su respuesta considerando el tipo de producto, el público objetivo y los recursos disponibles.
Esta pregunta es más fuerte porque obliga a leer el escenario, reconocer restricciones y tomar una decisión. La IA puede ayudar, pero el estudiante debe ajustar la respuesta al contexto. Mientras más específico sea el caso, menos útil será una respuesta genérica.
Trabajar con casos reales o verosímiles
Los casos reales funcionan muy bien en educación universitaria porque conectan la evaluación con problemas profesionales. Un caso puede ser breve, no necesita ocupar páginas completas. Puede bastar con un balance, una captura de pantalla, una tabla de ventas, un comentario de cliente, un reporte de inventario o una situación empresarial.
Ejemplo en contabilidad:
A partir del siguiente balance simplificado, determine si la empresa presenta problemas de liquidez. Justifique su respuesta usando al menos dos indicadores financieros.
Esta pregunta exige interpretar datos, aplicar conceptos y argumentar. No basta con copiar una definición de liquidez. El estudiante debe demostrar que entiende cómo usar el concepto.
En el videotutorial se plantea este tipo de transformación como una estrategia clave: pasar de “defina liquidez financiera” a “analice un balance y determine si existe un problema de liquidez”.
Usar datos variables en Moodle
Una de las estrategias más potentes en Moodle consiste en crear versiones de una misma pregunta con datos variables. Esto permite que cada estudiante trabaje con valores distintos, aunque la estructura del ejercicio sea similar. Moodle permite agregar preguntas aleatorias desde el banco de preguntas; su documentación oficial indica que, si existen preguntas en el banco, pueden agregarse preguntas aleatorias al cuestionario, lo cual hace menos probable que los estudiantes reciban las mismas preguntas al mismo tiempo.
Ejemplo:
- Estudiante A: ventas de $5.000, costos de $3.200, utilidad de $1.800.
- Estudiante B: ventas de $8.500, costos de $5.900, utilidad de $2.600.
- Estudiante C: ventas de $9.200, costos de $6.400, utilidad de $2.800.
La pregunta puede ser la misma en estructura, pero la respuesta cambia. Esto reduce la copia directa y obliga a resolver el ejercicio. En áreas como matemáticas, contabilidad, estadística, finanzas, marketing y administración, esta estrategia puede ser muy efectiva.
Crear preguntas secuenciales
Las preguntas secuenciales obligan al estudiante a seguir un proceso de razonamiento. En lugar de hacer una pregunta aislada, se plantea una cadena: primero se presenta el caso, luego se pide análisis, después una decisión y finalmente una justificación.
Ejemplo:
Caso: Una tienda online tiene alto tráfico, pero baja conversión.
Pregunta 1: Identifique dos posibles causas del problema.
Pregunta 2: Seleccione la causa más probable según los datos proporcionados.
Pregunta 3: Proponga una acción correctiva.
Pregunta 4: Justifique por qué esa acción podría mejorar la conversión.
Este formato es más difícil de resolver con una respuesta automática porque cada parte depende de la anterior. Además, permite evaluar no solo la respuesta final, sino el proceso de pensamiento.
Pedir justificación breve y directa
Una estrategia muy simple consiste en pedir justificación. Incluso en preguntas de opción múltiple, puede agregarse una instrucción como:
Seleccione la respuesta correcta y justifique en máximo cuatro líneas por qué eligió esa opción.
Esto cambia el nivel de exigencia. El estudiante no solo marca una alternativa, sino que debe demostrar comprensión. Además, permite detectar respuestas seleccionadas al azar o copiadas sin criterio.
La justificación no debe ser demasiado larga. Si se pide una explicación extensa, puede aumentar el uso de IA. En cambio, una justificación breve, concreta y vinculada al caso puede ser más útil para evaluar comprensión real.
Conectar el examen con lo trabajado en clase
Una de las estrategias más efectivas es usar material visto en clase. La IA no estuvo en la sesión, no conoce los ejemplos específicos, las discusiones del grupo, las actividades realizadas ni los casos analizados por el docente. Por eso, mientras más conectado esté el examen con el trabajo real del aula, menos útil será copiar la pregunta en una herramienta externa.
Ejemplo:
Según el caso analizado en clase sobre omnicanalidad, ¿qué estrategia fue clave para mejorar la experiencia del cliente y por qué?
Esta pregunta exige recuperar una experiencia compartida. Si el estudiante no participó o no revisó el material de clase, tendrá más dificultad para responder con precisión. La IA puede construir una respuesta general sobre omnicanalidad, pero no sabrá qué caso se trabajó ni qué discusión se desarrolló.
Ajustar el tiempo de forma coherente
El tiempo también influye en la seguridad de un examen. Si se da demasiado tiempo para preguntas simples, aumenta la posibilidad de consultar herramientas externas. Sin embargo, si se da muy poco tiempo, la evaluación puede volverse injusta y generar ansiedad innecesaria.
El objetivo no es presionar de forma excesiva, sino asignar un tiempo coherente con el nivel cognitivo de la pregunta. Una pregunta de memoria requiere menos tiempo. Una pregunta de análisis de caso requiere más. Una pregunta con datos, gráficos o tablas necesita un margen razonable para interpretar.
| Tipo de pregunta | Tiempo sugerido |
|---|---|
| Conceptual breve | Bajo |
| Aplicación simple | Medio |
| Análisis de caso | Medio-alto |
| Interpretación de tabla o gráfico | Medio-alto |
| Cálculo con justificación | Medio |
| Pregunta secuencial | Alto |
El tiempo debe permitir pensar, pero no dejar tanto margen que el estudiante pueda buscar, copiar, reformular y revisar todas las respuestas fuera del examen.
Usar un buen banco de preguntas
Un banco de preguntas amplio es esencial para reducir la copia. Si todos los estudiantes reciben las mismas 10 preguntas en el mismo orden, compartir respuestas es mucho más fácil. En cambio, si el docente tiene 80 preguntas y configura el examen para que cada estudiante reciba 15 aleatorias, el cuestionario se vuelve más difícil de copiar.
Moodle permite trabajar con bancos de preguntas y selección aleatoria. La documentación de Moodle explica que se pueden agregar preguntas aleatorias desde el banco y que, si se incluyen varias preguntas aleatorias, se seleccionarán preguntas diferentes para cada estudiante; además, la misma pregunta no aparecerá dos veces en un cuestionario.
Una buena práctica es organizar el banco por categorías:
| Categoría | Ejemplo |
|---|---|
| Conceptos básicos | definiciones aplicadas |
| Casos prácticos | situaciones empresariales |
| Cálculo | ejercicios con datos variables |
| Análisis | interpretación de escenarios |
| Gráficos | lectura de tablas o dashboards |
| Errores deliberados | detección y corrección |
Así se puede garantizar que cada examen tenga equilibrio entre temas y niveles de dificultad.
Usar imágenes, tablas y gráficos
Las preguntas multimodales son más resistentes que las preguntas puramente textuales. Pueden incluir capturas de pantalla, balances, dashboards, tablas, infografías, reportes, gráficos estadísticos o fragmentos de documentos.
Ejemplo:
Observe el dashboard en Excel y determine qué región presenta mejor rendimiento comercial. Justifique su respuesta con base en los indicadores visibles.
Este tipo de pregunta exige observación e interpretación. Además, puede evaluar habilidades más cercanas al desempeño profesional. En carreras como administración, contabilidad, marketing, educación, salud o ingeniería, las preguntas con datos visuales pueden elevar considerablemente la calidad de la evaluación.
Incluir errores deliberados
Una estrategia avanzada consiste en presentar una respuesta incorrecta y pedir al estudiante que identifique el error. Esto evalúa criterio, no solo memoria.
Ejemplo en APA 7:
Un estudiante afirma que la siguiente referencia está correctamente elaborada según APA 7. Identifique el error y explique cómo corregirlo.
Ejemplo en contabilidad:
Un estudiante calculó el índice de liquidez de la siguiente forma. Revise el procedimiento, detecte el error y proponga la corrección.
Ejemplo en Moodle:
Un docente configuró una tarea grupal sin agrupamiento. Explique qué problema podría generar y cómo debería corregirse.
Este formato es muy potente porque obliga a evaluar, comparar y justificar. La IA puede ayudar, pero el estudiante debe comprender el error dentro del contexto.
Diseñar preguntas con restricciones específicas
Otra forma de hacer preguntas más resistentes es incluir restricciones. Por ejemplo:
- responda en máximo 80 palabras;
- use el caso trabajado en clase;
- justifique con dos indicadores;
- incluya una decisión y una razón;
- no defina el concepto, aplíquelo;
- compare dos alternativas y elija una;
- identifique un error y proponga corrección.
Las restricciones reducen respuestas genéricas. También ayudan a que el docente evalúe mejor, porque delimitan qué se espera del estudiante.
No evaluar solo el producto final
La IA facilita producir respuestas finales. Por eso, cuando sea posible, conviene evaluar también el proceso. En Moodle o en actividades complementarias, se puede pedir que el estudiante explique cómo llegó a la respuesta, qué criterio usó, qué datos descartó o por qué eligió una alternativa.
Ejemplo:
Explique en tres pasos cómo llegó a su decisión.
Este tipo de instrucción no impide el uso de IA, pero dificulta una respuesta automática sin comprensión. Además, permite detectar razonamientos inconsistentes.
Combinar evaluación técnica y evaluación pedagógica
Las configuraciones técnicas de Moodle ayudan: banco de preguntas, aleatoriedad, límite de tiempo, navegación secuencial, respuestas mezcladas y revisión restringida. Sin embargo, esas configuraciones no resuelven el problema si las preguntas siguen siendo memorísticas.
Por eso, se necesita una combinación:
| Capa | Estrategia |
|---|---|
| Técnica | aleatoriedad, banco de preguntas, tiempo, intentos, navegación |
| Pedagógica | casos, datos, justificación, análisis, interpretación |
| Contextual | ejemplos de clase, situaciones locales, debates del curso |
| Ética | reglas claras sobre uso permitido o prohibido de IA |
La evaluación resistente a la IA no depende solo de Moodle. Depende del diseño didáctico.
Tabla de transformación de preguntas
| Pregunta tradicional | Problema | Versión resistente a IA |
|---|---|---|
| ¿Qué es segmentación de mercado? | Se responde con definición genérica | Una pyme local vende productos agrícolas. ¿Qué segmento debería priorizar y por qué? |
| Enumere ventajas del ecommerce. | Evalúa memoria | Seleccione dos ventajas aplicables a una tienda física que quiere vender online y justifique cuál impactaría primero. |
| Defina liquidez financiera. | Respuesta automática | Analice el balance presentado y determine si existe riesgo de liquidez. |
| ¿Qué es una rúbrica? | Definición simple | Revise esta rúbrica y proponga una mejora para evaluar con mayor precisión. |
| Mencione tipos de canales digitales. | Lista fácil de generar | Elija dos canales adecuados para una campaña con bajo presupuesto y justifique su elección. |
Este tipo de transformación puede aplicarse prácticamente en cualquier asignatura.
Recomendaciones por área académica
| Área | Estrategia recomendable |
|---|---|
| Administración | casos empresariales, toma de decisiones, escenarios locales |
| Contabilidad | balances, registros, errores deliberados, análisis financiero |
| Marketing | segmentación, campañas, métricas, interpretación de resultados |
| Matemáticas | datos variables, procesos, justificación de procedimientos |
| Educación | análisis de casos de aula, diseño de actividades, evaluación de estrategias |
| Tecnología | capturas, configuraciones, resolución de problemas, diagnóstico |
| Salud | casos clínicos simulados, interpretación de signos, toma de decisiones ética |
| Derecho | casos breves, argumentación, identificación de normas aplicables |
El principio es el mismo: evaluar la aplicación del conocimiento en contextos donde una respuesta genérica sea insuficiente.
Preguntas frecuentes sobre exámenes resistentes a la IA
¿Existe un examen completamente anti-IA?
No. Ningún examen virtual o no supervisado puede garantizar que el estudiante no use IA. Lo que sí puede hacerse es diseñar preguntas más resistentes, contextualizadas y orientadas al razonamiento.
¿Qué tipo de preguntas son más vulnerables a ChatGPT?
Las preguntas de memorización, definición, enumeración y explicación general. Por ejemplo: “qué es”, “defina”, “mencione características” o “enumere ventajas”.
¿Qué preguntas son más difíciles de responder copiando y pegando en IA?
Las preguntas basadas en casos, datos variables, material visto en clase, gráficos, tablas, errores deliberados, decisiones justificadas y procesos secuenciales.
¿Moodle ayuda a reducir la copia con IA?
Sí. Moodle permite usar banco de preguntas, preguntas aleatorias, orden aleatorio y otras configuraciones que reducen la posibilidad de que todos los estudiantes reciban el mismo examen.
¿Conviene prohibir totalmente el uso de IA en evaluaciones?
Depende del objetivo de aprendizaje. En algunos exámenes puede estar prohibida; en otros puede permitirse de forma regulada. Lo importante es comunicar reglas claras y diseñar actividades coherentes con esa decisión.
¿Pedir justificación ayuda a reducir respuestas copiadas?
Sí. Una justificación breve obliga al estudiante a explicar su decisión y permite detectar si comprende realmente la respuesta seleccionada.
¿Las preguntas con imágenes son más resistentes a la IA?
Generalmente sí, porque exigen observación e interpretación de información visual o datos específicos. Sin embargo, deben diseñarse bien y no limitarse a preguntar algo obvio.
Recuerde que…
Cómo diseñar exámenes resistentes a la IA no significa buscar una evaluación imposible de vulnerar. Significa reconocer que la inteligencia artificial cambió las condiciones de la evaluación y que las preguntas memorísticas ya no son suficientes. El reto docente es diseñar evaluaciones que valoren análisis, contexto, criterio, interpretación y justificación. La IA no elimina la evaluación universitaria, pero obliga a mejorarla. Un buen examen no solo pregunta qué sabe el estudiante; también muestra qué puede hacer con ese conocimiento en una situación concreta.
Pueden leer más contenido en fernandojuca.com así como videotutoriales y podcast en youtube.com/fernandojucamaldonado.

