Caso de uso: corregir 30 exámenes de Lengua en una tarde

Marta es profesora de Lengua Castellana en un instituto público. Cuatro grupos de ESO, una jefatura de departamento que pesa, una hija de seis años. Lleva quince años en la docencia y conoce todas las versiones de la corrección: el bolígrafo rojo, las hojas grapadas con comentarios al margen, las hojas de cálculo de notas, la plantilla CSV de Séneca.

Esta es la historia de una tarde concreta de un miércoles cualquiera de febrero. La cuento porque es el tipo de día que muchos docentes reconocerán, con sus pequeños obstáculos y sus pequeños alivios. Sin nombres de productos hasta el final, porque lo importante es la dinámica.

La situación de partida

Llega a casa a las 14:45. Ha comido en el coche, tiene una hora antes de recoger a su hija del colegio. Sobre la mesa del salón, treinta exámenes del bloque de literatura medieval del 3.º ESO, recogidos esa mañana. La fecha tope para tener las notas en el cuaderno es el lunes. Tiene reunión de evaluación el martes.

Hace cuentas mentales: 30 exámenes, ocho preguntas cada uno, comentarios escritos a media página por examen, registro de notas por criterio en una rúbrica de cinco categorías. Si lo hace a su ritmo habitual —once o doce minutos por examen para hacerlo bien—, son seis horas. Cuatro tardes de tres niños en casa o un sábado entero. Conoce el cálculo, lo ha hecho cien veces.

Esta vez, sin embargo, va a probar otra cosa.

14:50 — Preparación: la rúbrica como ancla

Lo primero que hace no es ponerse a corregir. Es abrir su cuaderno y revisar la rúbrica que va a aplicar. La tiene del año anterior pero ha cambiado tres preguntas del examen, así que reajusta dos descriptores. Le lleva diez minutos. No es tiempo perdido: es la inversión más alta que va a hacer en toda la tarde.

La rúbrica final tiene cinco criterios:

Comprensión del texto medieval (identificar contexto, autor, género).
Análisis de recursos literarios (símil, metáfora, paralelismo, anáfora).
Producción de texto crítico (estructura, argumentación, citación).
Expresión escrita (corrección ortográfica, riqueza léxica).
Conexión con conocimientos previos (transversalidad, intertextualidad).

Cada uno con cinco niveles (IN/SU/BI/NT/SB) y descriptores observables. La rúbrica entera ocupa una página A4. Marta sabe por experiencia que ese folio bien escrito le va a evitar veinte microdecisiones por examen.

Pila de exámenes con un sello de verificación verde encima del último folio

15:00 — Captura: el escaneo masivo

Ahora, hace fotos de los treinta exámenes. No los escanea en el escáner del centro porque no tiene tiempo. Usa el móvil, en la mesa del salón, con buena luz natural. Va separándolos en pilas de diez para no perderse. En diez minutos tiene treinta exámenes digitalizados, ordenados por nombre del alumnado.

Las fotos no son perfectas. Algunas tienen un dedo en la esquina, dos están un poco torcidas, una tiene la sombra de la lámpara. No importa: la tecnología actual procesa eso sin problema. El año pasado, Marta habría perdido veinte minutos con el escáner y luego otros veinte con el OCR. Hoy, simplemente saca fotos.

15:15 — Corrección automática: la primera lectura

Sube los treinta exámenes a la herramienta de corrección que está probando. Le pasa la rúbrica que acaba de actualizar. Pulsa "iniciar".

Mientras la IA procesa, va a la cocina y se sirve un café. Cuando vuelve, ocho minutos después, los treinta exámenes están corregidos. Cada uno tiene una propuesta de nivel para cada criterio, con la frase concreta del examen citada como evidencia.

Marta no acepta nada todavía. Lo que tiene delante es un borrador, igual que si un becario muy rápido y muy literal le hubiese hecho una primera pasada. Ahora viene la parte que ella sí tiene que hacer.

15:25 — Revisión rápida: pasada por todos

Abre el primer examen. Mira la nota propuesta para cada criterio y la evidencia que la respalda. Para el primer criterio (comprensión del texto medieval), la IA ha citado correctamente un fragmento donde el alumno reconoce el género del texto: nivel BI. Marta está de acuerdo, lo confirma con un clic.

Para el segundo criterio (recursos literarios), la IA ha marcado SU porque el alumno ha identificado el símil pero ha confundido la metáfora con una personificación. Marta lee la respuesta del alumno, ve que efectivamente se ha equivocado pero el análisis del símil es muy bueno. Sube el nivel a BI porque considera que el conocimiento parcial pesa más que el error puntual. La herramienta registra el cambio.

Y así con el resto. Su ritmo se estabiliza en 40-60 segundos por examen para los casos en los que está de acuerdo con la propuesta y 2-3 minutos para los que requieren ajustes. De los treinta exámenes, 24 los confirma o ajusta levemente, 6 los marca para revisión profunda.

A las 16:10 ha terminado la pasada inicial. Cuarenta y cinco minutos, treinta exámenes, todos con notas asignadas y evidencias revisadas.

16:10 — Pausa: la hija

Cierra el portátil. Va a buscar a su hija. La merienda, el parque, los deberes. La cabeza le hace ruido un par de veces pero no insiste: sabe que volverá a la corrección a las 19:00 cuando su hija se acueste, y que en lugar de tener cuatro horas de trabajo pendiente solo tiene una hora bien definida para los seis casos especiales.

Esta es la diferencia que ya nota. Otros años, esa tarde con la hija habría estado contaminada por el peso de los exámenes esperando. Hoy no. La corrección está al 80% terminada y lo sabe.

19:30 — Atención focal: los casos que importan

Vuelta al salón. Los seis exámenes marcados para revisión profunda son los que requieren su criterio de verdad. Tres son casos en los que la nota propuesta le pareció baja para lo que ella sabe del alumno; uno es un examen muy original que la IA puntuó conservadoramente; dos son exámenes con respuestas inusuales que merecen lectura completa.

Para esos seis, Marta hace lo que siempre ha hecho: leer el examen entero, decidir nota, escribir feedback personalizado. No usa la propuesta de la IA como referencia, la ignora y vuelve al examen original. Cada uno le lleva entre 8 y 12 minutos. En total, una hora para los seis.

La que más tiempo le lleva es una alumna que escribió un análisis crítico brillante pero con errores ortográficos importantes. La rúbrica le da SU global por la ortografía. Marta decide que el conjunto merece NT y escribe en el feedback escrito el porqué: "Tu análisis es de los mejores que he leído este trimestre. La nota global está bajada por errores ortográficos que tienes que corregir antes del próximo examen, pero quiero que sepas que tu pensamiento crítico está al nivel de 4.º o 1.º de Bachillerato. Sigue así".

Ese tipo de comentario es lo que solo Marta puede hacer. Es lo que justifica que la profesión exista y que no se pueda automatizar. Y ahora tiene tiempo y energía para hacerlo.

20:30 — Volcado: del cuaderno a la plataforma

Las notas finales —30 exámenes, 5 criterios cada uno— están en la herramienta de corrección. Marta las exporta a su cuaderno digital con un clic. El cuaderno calcula automáticamente la nota numérica final de cada alumno según los pesos que ya tenía configurados.

Repasa el listado completo en pantalla. Todo coherente, sin sorpresas. Selecciona "exportar a Séneca", confirma la convocatoria, descarga el ZIP CSV con la codificación correcta. Sube el fichero a Séneca. Las notas oficiales quedan registradas.

A las 20:40 cierra el portátil. Ha terminado.

El balance

Tres horas y media de trabajo total —incluyendo la pausa con la hija—, treinta exámenes corregidos con criterio, comentarios personalizados a quien lo necesitaba, notas en el cuaderno, fichero subido a Séneca. La tarde de un miércoles. Con tiempo para la cena con su pareja y para leer un rato antes de dormir.

El año pasado, este mismo trabajo habría sido el sábado entero, con la familia esperando en el salón a que terminase, la sensación de haberse perdido el día y el cansancio acumulado del lunes siguiente.

Marta no piensa que la IA haya sustituido su trabajo. Piensa que ha sustituido la parte mecánica de su trabajo —la transcripción, el conteo, la primera lectura— y le ha devuelto las horas para hacer la parte que importa. La conversación con su hija, las dos horas de revisión profunda con feedback personalizado, el correo el viernes a la tutora de la alumna brillante para sugerir que se la incluya en el grupo de profundización.

Esa redistribución es lo que cambia. No es que se trabaje menos: es que se trabaja en lo que solo el docente puede hacer.

Nota: la herramienta que Marta está probando se llama Magistral. La hemos dejado para el final porque la historia es lo importante, no el producto. Si te interesa probarla cuando se abra el acceso, únete a la lista de espera.

La situación de partida#

14:50 — Preparación: la rúbrica como ancla#

15:00 — Captura: el escaneo masivo#

15:15 — Corrección automática: la primera lectura#

15:25 — Revisión rápida: pasada por todos#

16:10 — Pausa: la hija#

19:30 — Atención focal: los casos que importan#

20:30 — Volcado: del cuaderno a la plataforma#

El balance#

Empieza a corregir 90% más rápido

Sigue leyendo

NEAE y adaptaciones curriculares: guía práctica para el aula ordinaria

Cómo calcular la nota por criterios en LOMLOE (ponderaciones, media y redondeo)

¿Lo ha escrito tu alumno o una IA? Cómo detectar ChatGPT en trabajos sin paranoia