Texas: KI-Technik soll Tests an Schulen kontrollieren und viel Geld sparen

11.04.2024 15:42 Uhr Martin Holland

Zwei Roboterhände auf einer ergonomischen Tastatur — (Bild: maxuser/Shutterstock.com)

Was Schüler und Schülerinnen in Texas können, wird einmal jährlich landesweit geprüft. In diesem Jahr sollen Menschen nur noch einen Teil der Antworten lesen.

Im US-Bundesstaat Texas soll ein KI-System einen Großteil der standardisierten Tests bewerten, mit denen jedes Jahr der Bildungsstand der unteren Klassenstufen überprüft wird. Das berichtet The Texas Tribune und ergänzt, dass mit dem Vorgehen pro Jahr 15 bis 20 Millionen US-Dollar eingespart werden sollen. Mit dem Geld würden normalerweise Menschen bezahlt, die für die Bewertung der Antworten befristet eingestellt werden. Im vergangenen Jahr seien dafür 6000 Personen bezahlt worden, in diesem Jahr sollen es weniger als 2000 sein. An dem Vorgehen gibt es Kritik, aber die Verantwortlichen wollen daran festhalten, obwohl bei einem ersten Einsatz im Dezember drastisch mehr Arbeiten mit null Punkten bewertet wurden, als im Vorjahr.

Stichprobenartige Nachkontrolle vorgesehen

Mit den State of Texas Assessments of Academic Readiness (STAAR) wird über eine Reihe standardisierter Tests das Bildungsniveau der Schüler und Schülerinnen in den Klassenstufen 3 bis 8 überprüft. Wie The Texas Tribune erklärt [1], wurde dabei zuletzt der Anteil von Multiple-Choice-Fragen zugunsten solcher mit offenen Antwortmöglichkeiten verringert. Dadurch sei aber auch der Korrekturaufwand enorm gestiegen. Das jetzt zum Einsatz kommende KI-System – das mit ChatGPT verglichen wird – wurde demnach mit 3000 Antworten trainiert, die vorher alle doppelt überprüft wurden. Es soll alle Antworten prüfen, ein Viertel soll dann noch einmal nachkontrolliert werden. Außerdem werden beispielsweise Antworten mit fremdsprachlichen Wörtern automatisch an Menschen weitergegeben.

Wie die Zeitung noch erklärt, kam das System bereits im Dezember in einigen Schulbezirken zum Einsatz. Aufgefallen sei dort, dass die Zahl der Arbeiten "drastisch gestiegen" sei, für die nur null Punkte vergeben wurden. Noch bis 2022 wäre das nur für Fälle vorgesehen gewesen, in denen gar keine Arbeit abgeben wurde. Inzwischen würden die Richtlinien vorschreiben, dass die schlechteste Punktzahl auch für Antworten "ohne kohärente Struktur oder Argumentationskette" zu vergeben sind. Gegenwärtig könne man nicht sagen, ob der Anstieg an den Testfragen oder an dem KI-System liege. Wer mit dem Testergebnis nicht einverstanden ist, kann für 50 US-Dollar eine Überprüfung einfordern, sollte die Nota danach besser sein, gibt es das Geld zurück.

Mit den STAAR wird etwa überprüft, wie gut die Schüler und Schülerinnen lesen und rechnen können. Sind die Ergebnisse zu schlecht, können Behörden Maßnahmen anordnen. Schlimmstenfalls können sogar ganze Schule geschlossen werden, heißt es bei der Zeitung. An dem Rückgriff auf KI-Technik zur Überprüfung der Antworten gibt es durchaus Kritik. So wird darauf hingewiesen, dass man in den Schulbezirken keine Informationen zur Technik des Systems habe. Eine ehemalige Lehrerin gibt sich derweil überzeugt, dass Lehrkräfte und Eltern dem System nicht vertrauen werden, unabhängig davon, ob es letztlich funktioniert oder nicht. Andere weisen darauf hin [2], dass die Schulverantwortlichen hier auf Technik zurückgreift, die Schülern und Schülerinnen teilweise verboten werden.

(mho [3])

URL dieses Artikels:
https://www.heise.de/-9682002

Links in diesem Artikel:
[1] https://www.texastribune.org/2024/04/09/staar-artificial-intelligence-computer-grading-texas/
[2] https://www.theverge.com/2024/4/10/24126206/texas-staar-exam-graders-ai-automated-scoring-engine
[3] mailto:mho@heise.de