Computerbildschirm mit Code und Zeichen im Vordergrund
KI in der Bildung

Klausuren mit KI korrigieren, ohne Ihr fachliches Urteil aufzugeben

Ein praktischer Leitfaden, um KI als Korrekturassistenz einzusetzen, ohne die professionelle Kontrolle über die Bewertung Ihrer Schüler·innen zu verlieren.

Vor drei Jahren klang „mit künstlicher Intelligenz korrigieren" noch nach ferner Zukunft. Heute probieren das viele Lehrkräfte an einem Sonntagnachmittag mit irgendeinem Chatbot aus, lesen die Ergebnisse und bleiben mit zwei widersprüchlichen Eindrücken zurück: Erleichterung, weil das Werkzeug erstaunlich gut trifft, und Unbehagen über alles, was außerhalb der Analyse blieb.

Dieser zweite Eindruck ist der entscheidende. Er trennt Lehrkräfte, die KI als nützliches Werkzeug einsetzen, von denen, die sich davontragen lassen und nach einigen Wochen feststellen, dass ihre Bewertungskriterien sich in dem aufgelöst haben, was das Modell für relevant hielt.

Dieser Artikel ist eine Anleitung, wie sich das vermeiden lässt. Wie Sie KI nutzen, um schneller zu korrigieren, ohne die professionelle Kontrolle darüber zu verlieren, was Sie tatsächlich bewerten.

Was KI gut kann und was nicht

Bevor Sie Ihren Arbeitsablauf ändern, lohnt es sich, die Stärken und Schwächen klar zu sehen.

KI ist gut, wenn es eine klare Referenz zum Messen gibt. Wenn Sie ihr ein Bewertungsraster mit konkreten Kriterien, definierten Stufen und Deskriptoren übergeben, erkennt sie ziemlich zuverlässig, welche Stufe jede Antwort am besten beschreibt. Sie ist auch schnell bei mechanischen Aufgaben: erkennen, ob eine Antwort in Naturwissenschaften die richtige Formel enthält, Rechtschreibfehler zählen, Daten oder Namen mit einer Lösung abgleichen.

KI ist mittelmäßig, wenn man ihr überlässt, selbst zu entscheiden, was gut ist. Ohne Bewertungsraster erzeugt „benote diese Klausur" plausible, aber undurchsichtige Noten: Sie wissen nicht, warum ein Punkt abgezogen wurde, oder ob derselbe Punkt einem anderen Schüler·in aus demselben Grund abgezogen worden wäre. Das ist der Unterschied zwischen einer Assistenz und einer Black Box.

Und KI ist schlecht — oder zumindest gefährlich —, wenn man sie bittet, Absicht oder Kontext ohne ausreichende Information zu deuten. Der Absatz, in dem ein·e Schüler·in schreibt „ich glaube, das ist genau das Gegenteil von dem, was im Lehrbuch steht", kann brillantes kritisches Denken oder ein totales Missverständnis sein. Ohne den oder die Schüler·in zu kennen, ohne den Klassenraumkontext, kann das kein Modell unterscheiden.

Der teuerste Fehler ist nicht, dass die KI eine Antwort falsch bewertet. Sondern dass sie sie aus dem falschen Grund richtig bewertet — und Sie es nicht merken.

Das Prinzip, das alles ordnet: Die KI schlägt vor, Sie bestätigen

Wenn Sie nur eine Idee aus diesem Artikel mitnehmen, dann diese. Die KI muss immer im Entwurfsmodus arbeiten. Sie überprüfen, passen an, bestätigen. Der Unterschied zu einem manuellen Prozess liegt nicht darin, wer die endgültige Entscheidung trifft — das sind weiterhin Sie —, sondern darin, wie viel kognitive Routinearbeit Sie ausgelagert haben, bevor Sie zu dieser Entscheidung gelangt sind.

So gedacht, übernimmt die KI das, was früher Korrektor·innen in Verlagen taten: das Offensichtliche entdecken, das Zweifelhafte markieren, die Durchsicht beschleunigen und Ihnen den Teil überlassen, der Urteilskraft erfordert. Der Unterschied: Diese Assistenz ist jetzt jederzeit verfügbar, für 30 Klausuren gleichzeitig, in unter fünf Minuten.

Das Problem entsteht, wenn die Logik kippt. Wenn Sie ein KI-Ergebnis erhalten und es nur überfliegen, bevor Sie die Noten ins Notenbuch übertragen, haben Sie aufgehört zu bewerten. Sie haben eine Bewertung beaufsichtigt, die jemand anderes vorgenommen hat. Und „jemand anderes" hat hier keinen Klassenraumkontext, kennt Ihre Schüler·innen nicht, weiß nicht, was Sie letzte Woche behandelt haben, und trägt für nichts Verantwortung.

Schematische Darstellung eines Dokuments mit Häkchen und Schaltkreisverbindungen

Drei praktische Regeln, die die häufigsten Fehler vermeiden

1. Definieren Sie das Bewertungsraster, bevor Sie auf die KI schauen

Diese Regel klingt offensichtlich und wird am häufigsten verletzt. Die Versuchung ist, dem Modell eine Klausur zu geben und „eine vernünftige Note" zu erbitten. Was herauskommt, ist plausibel und manchmal sogar nützlich, aber es ist keine kriterienorientierte Bewertung: Es ist eine generierte Meinung.

Definieren Sie zuerst die Kriterien. Wenn Sie mit nationalen oder regionalen Lehrplänen arbeiten, haben Sie Ankerpunkte: die offiziellen Bewertungskriterien des Curriculums und die operationalen Deskriptoren Ihres Stoffverteilungsplans. Bauen Sie das Bewertungsraster aus diesen Elementen. Erst dann übergeben Sie Klausur und Raster dem Modell, mit Anweisungen, welche Kompetenzstufe jeder Antwort zuzuordnen ist.

Der Wandel ist enorm. Statt „benote diesen Text" fragen Sie „gib für jedes dieser fünf Kriterien die Kompetenzstufe an und zitiere den Satz aus der Klausur, der das rechtfertigt". Was Sie zurückbekommen, ist keine Note mehr — es ist ein Bewertungsvorschlag, den Sie Zeile für Zeile prüfen können.

2. Schauen Sie immer auf den Beleg, nicht nur auf die Note

Jedes seriöse KI-Korrekturwerkzeug sollte Ihnen neben jedem bewerteten Kriterium den konkreten Satz aus der Klausur zeigen, auf den es seine Bewertung stützt. Wenn Sie nur eine Endzahl sehen, korrigieren Sie nicht: Sie vertrauen.

Wenn der Beleg vor Ihnen liegt, werden Probleme in Sekunden sichtbar. Die KI hat das Kriterium „Argumentation" hoch bewertet, aber der zitierte Satz ist trivial. Die KI hat eine korrekte Verbform als falsch markiert. Solche Fehler existieren, sie sind häufig, und sie sind korrigierbar, wenn Sie sie sehen. Sie sind unerkennbar, wenn Sie nur die Note ansehen.

3. Bei jeder zweifelhaften Note zurück zur Originalklausur

Wenn Ihnen eine Note seltsam vorkommt — zu hoch, zu niedrig, unstimmig mit dem, was Sie über den oder die Schüler·in wissen —, rechtfertigen Sie sie nicht mit einer mentalen Abkürzung („die KI wird etwas gesehen haben, das ich nicht sehe"). Gehen Sie zur Klausur zurück. Lesen Sie sie ganz. Entscheiden Sie selbst.

Dieser Satz ist nicht defensiv — er ist operativ. Er erspart Ihnen die enormen Kosten, zwei Monate später bei einem Notenwiderspruch zu entdecken, dass die KI eine·n Schüler·in systematisch für etwas bestraft hat, das Sie nie bestrafen wollten.

Der Geschwindigkeitsfaktor verändert die Rechnung, nicht das Kriterium

Ehrlich gesagt: Der Hauptreiz der KI ist Zeit. Eine Klasse mit 30 Klausuren, die früher ein Wochenende brauchte, kann jetzt an einem Nachmittag fertig sein. Das ist real, das ist wertvoll, und es ist wahrscheinlich der Grund, warum Sie das hier lesen.

Aber diese zurückgewonnene Zeit muss irgendwohin, und sie sollte zu den Teilen der Bewertung fließen, die nicht delegierbar sind: das Gespräch mit dem oder der Schüler·in, der oder die schwächelt, das schriftliche Feedback an jene mit Wachstumspotenzial, die Reflexion darüber, welche Teile der Unterrichtseinheit schlechter ausgefallen sind, um die nächste Stunde anzupassen.

Wenn die durch KI gesparte Zeit nur in mehr Freistunden umschlägt und die pädagogische Qualität gleich bleibt, haben Sie eine persönliche Optimierung erreicht. Das ist gut, und niemand wird Ihnen das vorhalten. Aber das echte Potenzial liegt darin, diese Zeit auf das umzulenken, was die KI nicht kann.

Eine konkrete Routine, die funktioniert

Hier ist eine realistische Routine für die Korrektur einer Klasse mit 25-30 Klausuren mit KI-Unterstützung. Wir beschreiben sie ohne Werkzeugnamen, weil das Prinzip software-unabhängig ist.

Schritt Ungefähre Zeit Was tun
1. Vorbereitung 10-15 Min. Das anzuwendende Bewertungsraster bestätigen. Falls nicht aufgeschrieben, jetzt aufschreiben.
2. Erfassung 5-10 Min. Alle Klausuren scannen oder fotografieren.
3. KI-Korrektur 5-15 Min. Die automatische Korrektur gegen das Raster laufen lassen.
4. Schnelldurchsicht 20-30 Min. Jede Klausur durchgehen, Note + zitierte Belege anschauen. Bestätigen oder anpassen.
5. Fokussierte Aufmerksamkeit 30-60 Min. Bei den 4-5 zweifelhaften oder bedeutsamen Fällen verweilen. Persönliches Feedback schreiben.
6. Übertragung 5 Min. Noten ins Notenbuch übertragen oder in die Schulplattform exportieren.

Insgesamt: zweieinhalb Stunden für das, was früher ein ganzes Wochenende belegte. Wichtig ist nicht, dass es schneller ist — sondern dass sich die Verteilung verschiebt. Sie verbringen nicht mehr 90 % der Zeit mit mechanischer Arbeit und 10 % mit echter Pädagogik. Sie verbringen 30 % mit Aufsicht und 70 % mit Reflexion und Feedback.

Was Sie verlieren (und warum es sich manchmal lohnt)

Es wäre unaufrichtig, so zu tun, als gäbe es keinen Preis. Wenn Sie das erste Lesen der Klausur an die KI delegieren, verlieren Sie dieses erste Lesen. Beim manuellen Korrigieren baute Ihr Kopf eine intuitive Karte der Klasse auf: wo sie scheitern, was sie missverstanden haben, was ihnen gefiel. Diese Karte entstand ungewollt, im Akt des Korrigierens.

Mit KI-Unterstützung erscheint diese Karte nicht von allein. Sie muss aktiv aufgebaut werden. Ein paar Strategien helfen: alle korrigierten Klausuren in einem Zug lesen (nicht einzeln zwischen anderen Aufgaben), in den letzten fünf Minuten notieren, welche Muster Sie sehen, oder die KI selbst um eine zusammenfassende Übersicht der häufigsten Fehler im Kurs bitten.

Die Karte geht nicht verloren, aber sie erfordert Absicht. Sie entsteht nicht mehr durch Trägheit.

Das Urteil bleibt Ihres

Die Frage, die nach jeder KI-gestützten Korrektur lohnt, ist nicht „ist die Note richtig?", sondern „ist das die Note, die ich gegeben hätte, wenn ich weiß, was ich über den oder die Schüler·in und die Klasse weiß?". Wenn die Antwort ja lautet, funktioniert das System. Wenn nein, anpassen und wiederholen.

KI ersetzt nicht das Urteil der Lehrkraft. Sie ersetzt die Erschöpfung, die das Urteil der Lehrkraft aushöhlt. Richtig eingesetzt, lässt sie Sie am Montagmorgen mit klarem Kopf ankommen, bereit zu tun, was nur Sie tun können: unterrichten.

Korrigieren Sie 90 % schneller

Tragen Sie sich auf die Warteliste ein und sichern Sie sich einen frühen Zugang.

Auf Warteliste

Das Magistral-Team

Wir entwickeln die KI, die Lehrkräften die Zeit zurückgibt, die ihnen die Korrektur gestohlen hat.