Reicht der SON-R Test

zur Einsortierung des Kindes in einen abgestuften Bildungsgang (Förderschwerpunkte Lernen/GE)?

1 Die Vorgaben des Erlasses zu den Kriterien bei Feststellung der nicht lernzielgleichen Förderschwerpunkte

Intelligenz ist ein hochkomplexes Konstrukt.

Einen der ersten standardisierten Tests zur Intelligenzmessung entwickelte Alfred Binet. 1905, endgültig 1911, wurde eine vom französischen Unterrichtsministerium verlangte Prüfungsmethode zur Überführung von Kindern in die Sonderschule geschaffen. Intelligenz ist nicht ein abstrakt messbarer Wert (wie z.B. Gewicht, BMI,Größe) sondern ein Konstrukt, bei dem sich die Fähigkeiten nur im Vergleich zur einer Durchschnittsgruppe berechnen.

Intelligenzmessung ist demnach ein theoretisches Konzept, das versucht, verschiedene kognitive Fähigkeitsbereiche des Menschen nach einer festgelegten Methode zu messen. Die Bereiche sind in der Regel unterteilt in das schlussfolgernde Denken, visuell-räumliche Verarbeitung, Sprachfähigkeit, Arbeitsgedächtnis, Verarbeitungsgeschwindigkeit. Diese Bereiche werden durch eine Vielzahl von Subtests, in denen eine Reihe von Fragen zu beantworten sind, erfasst. Aus der Vielzahl der sog. Items ergibt sich je nach Bereich eine Punktzahl-Berechnung, die dann zu einem Gesamtergebnis berechnet wird. Daraus ergibt sich zwangsläufig eine erhöhte Wahrscheinlichkeit für Fehldiagnosen bei der Intelligenzmessung. Daher muss sich die testende Person (in Schule sind das die Sonderpädagog*innen) ihrer Verantwortung bewusst sein und sowohl das Testverfahren sorgfältig auswählen als auch die Durchführung sowie das Ergebnis differenziert interpretieren. Doch nach wie vor erleben wir, dass mit einem oberflächlich ausgeführten SON-R Test ohne weitere Interpretation der Testergebnisse die Entscheidung über den Bildungsgang gefällt wird und damit in der Konsequenz auch darüber, ob das Kind im schulrechtlichen Sinne als geistig behindert gilt.

Der Intelligenzquotient und seine Bedeutung für die Einordung in den Bildungsgang

Das Schulgesetz nennt beim Förderschwerpunkt Lernen (eigener Bildungsgang!) die Zielgruppe der „Kinder und Jugendlichen mit einer erheblichen und lang andauernden Lernbeeinträchtigung“.
Der Förderschwerpunkt Geistige Entwicklung (eigener Bildungsgang!) zielt auf „Kinder und Jugendliche mit geistiger Behinderung“ (vgl. § 50 Abs. 2 u.3 HSchG)

In der Medizin/Psychologie spricht man heute nicht mehr von Lernbeeinträchtigungen bzw. geistiger Behinderung. Mit der ICD-11 liegt ein überarbeitetes Instrument zur Klassifikation der Krankheiten vor, bei der die Intelligenz zwar weiterhin in Bereiche kategorisiert wird, diese nun aber nicht mehr durch die numerischen Quotienten ausweist, sondern sich an der Standardwert-Skala mit dem Mittelwert von 100 orientiert:

„Eine leichtgradige Störung der Intelligenzentwicklung ist ein Zustand, der während der Entwicklungsperiode auftritt und durch deutlich unterdurchschnittliche intellektuelle Fähigkeiten und adaptives Verhalten gekennzeichnet ist, die etwa zwei bis drei Standardabweichungen unter dem Mittelwert liegen (etwa 0,1 bis 2,3 Perzentile), basierend auf angemessen normierten, individuell durchgeführten standardisierten Tests oder auf vergleichbaren Verhaltensindikatoren, wenn standardisierte Tests nicht verfügbar sind. Die Betroffenen haben oft Schwierigkeiten beim Erwerb und Verstehen komplexer sprachlicher Konzepte und akademischer Fähigkeiten.“ (ICD-11 6A00.0)

Das oben genannte Perzentile entspricht in der Umrechnung einem IQ zwischen 84 und 70, dieser ist schulrechtlich ein Hinweis auf den Förderschwerpunkt Lernen.

„Eine mittelgradige Störung der Intelligenzentwicklung ist ein Zustand, der während der Entwicklungsperiode entsteht und durch deutlich unterdurchschnittliche intellektuelle Leistungen und adaptive Verhaltensweisen gekennzeichnet ist, die etwa drei bis vier Standardabweichungen unter dem Mittelwert liegen (etwa 0,003 bis 0,1 Perzentil), basierend auf angemessen normierten, individuell durchgeführten standardisierten Tests oder auf vergleichbaren Verhaltensindikatoren, wenn standardisierte Tests nicht verfügbar sind. Die Sprache und die Fähigkeit zum Erwerb akademischer Fähigkeiten von Personen mit einer mittelgradigen Störung der intellektuellen Entwicklung sind unterschiedlich, beschränken sich jedoch im Allgemeinen auf Grundfertigkeiten.“ (ICD-11, 6A00.1)

Dieses Perzentile entspricht bei der Standardwert-Skala dem Ergebnis von 69-54. Ab einem IQ von unter 70 besteht laut Erlass des HKM der Verdacht auf das Vorliegen einer geistigen Behinderung im schulrechtlichen Sinn. Die Schulbehörde prüft dann die Einstufung des Kindes in den Förderschwerpunkt Geistige Entwicklung.

Die ICD-11 definiert die „Störungen der Intelligenzentwicklung“ grundsätzlich als „Gruppe ätiologisch unterschiedlicher Zustände, die durch deutlich unterdurchschnittliche intellektuelle Leistungen und adaptives Verhalten gekennzeichnet sind, die etwa zwei oder mehr Standardabweichungen unter dem Mittelwert liegen (etwa weniger als das 2,3. Perzentil)“. Die Aussagen basieren „auf angemessenen normierten, individuell durchgeführten standardisierten Tests. Stehen keine entsprechend normierten und standardisierten Tests zur Verfügung, muss sich die Diagnose von Störungen der Intelligenzentwicklung stärker auf das klinische Urteil stützen, das auf einer angemessenen Bewertung vergleichbarer Verhaltensindikatoren beruht.“ (ICD-11 6A00)

Diese Definition sowie das benannte Doppelkriterium findet sich im neuen Erlass des HKM zur differenzialdiagnostischen Abgrenzung der Bildungsgänge und Förderschwerpunkte wieder.

Der Erlass des HKM vom 13. Oktober 2021 (III.A.1 – 170.000.084-00894, ABl. 11/21)

Mit dem neuen Erlass ist der mehrdimensionale IQ-Test bei der Überprüfung der sonderpädagogischen Förderschwerpunkte Lernen (LER) und Geistige Entwicklung (GE) als erster Teil des verpflichtend zu prüfenden Doppelkriteriums vorgeschrieben. Ziel ist es, die Notwendigkeit der Herabsetzung des Bildungsgangs, die mit der Feststellung dieser Förderschwerpunkte verbunden ist, differenzialdiagnostisch begründen zu können. Der Verwaltungserlass dient im Sinne der Selbstbindung der Schulverwaltung dazu, für das Kind die jeweils bestmögliche Bildung zu garantieren und gleichzeitig sicherzustellen, dass Kinder nicht unbegründet oder gar willkürlich in einem unteren Bildungsgang festgehalten werden, und ihnen damit der Zugang zu einem allgemein anerkannten Schulabschluss vorn vorneherein verwehrt wird.

Doch gerade die vorhandenen standardisierten Testverfahren zur Messung der Intelligenz bedürfen eines sorgsamen und verantwortungsvollen Umgangs durch die Sonderpädagogik.

„Anwendung eines Intelligenztests benötigt eine sorgfältige Vorbereitung, testdiagnostische Kenntnisse und vor allem Kenntnisse über die Intelligenztheorien, auf die der Test aufbaut. Nur so ist gewährleistet, dass Fehlinterpretationen vermieden werden. Doch bereits bei der Testdurchführung könnte diesen Ansprüchen die Realität des Schulalltags entgegenstehen.“ (Torsten Joél, Das Dilemma der Intelligenzdiagnostik in der Sonderpädagogik, in: Zeitschrift für Heilpädagogik 68/2017, S. 12-21.)

Die IQ-Testungen haben konkrete (auch negative) Auswirkungen auf die Bildungskarriere eines Kindes. Die Fachkraft, die den Test durchführt, muss eine entsprechende Fortbildung und Praxiserfahrung darin haben, um nicht nur am Ende ein Ziffernergebnis darzustellen, sondern die Testung mit Blick auf die Behinderung des Kindes richtig durchführen sowie das vorliegende kognitive Leistungspotenzial des Kindes zudem erkennen zu können. Wir erleben hier leider immer noch Sonderpädagog*innen, die sich dieser Verantwortung nicht hinreichend bewusst sind und gern auf simplifizierte Verfahren (wie z.B. den SON-R Test) zurückgreifen, um mit einem sich daraus ergebenden fragwürdigen Gesamtergebnis die von ihnen selbst gewünschte Herabsetzung des Bildungsgangs legitimieren zu können. Wird sein eigentliches Leistungspotenzial aber nicht erkannt, hat das konkrete negative Auswirkungen für das Kind. Für die sonderpädagogische Diagnostik bei beiden Förderschwerpunkten (LER, GE) explizit mehrdimensionale Testverfahren durchzuführen. Für den Förderschwerpunkt LER schreibt der Erlass sehr konkret vor:

Das Profil der Intelligenzentwicklung beschreibt aussagekräftig
• die fluide Intelligenz sowie
• weitere Faktoren der Intelligenz, wie Arbeitsgedächtnis, Verarbeitungsgeschwindigkeit, kristalline Intelligenz, sprachgebundene Intelligenz.

Das heißt, bei möglicher Feststellung von „Lernbehinderung“ muss ein mehrdimensionales Verfahren durchgeführt werden, das alle relevanten Bereiche abprüft.

Beim Förderschwerpunkt GE ist ebenfalls

„die individuelle Lernausgangslage der Intelligenzentwicklung“ zu erfassen. „Die Darstellung der Lernausgangslage umfasst eine aussagekräftige Beschreibung der Intelligenzentwicklung (Kriterium 1): Der kognitive Entwicklungsstand wird beschrieben. Das Intelligenzprofil aus einem standardisierten mehrdimensionalen Intelligenztest ist beschrieben.“ (vgl. Erlass)

Ein wirklich aussagekräftiges Ergebnis ergibt sich auch hier nur durch die Anwendung eines mehrdimensionalen Verfahrens, das die oben benannten Bereiche (fluide Intelligenz sowie Arbeitsgedächtnis, Verarbeitungsgeschwindigkeit, kristalline Intelligenz, sprachgebundene Intelligenz) auch abdeckt.

2 Zur Validität bei Durchführung des Verfahrens

Alle IQ-Testverfahren müssen gemäß den Vorgaben im Leitfaden für die jeweilige Testbatterie standardisiert durchgeführt werden. Das lässt wenig Spielraum in Bezug auf infrage kommende Nachteilsausgleiche bei vorliegender Behinderung. Es ist aber möglich, die Testung zur besseren Konzentrationsfähigkeit des Kindes an einigen Stellen für Pausen zu unterbrechen oder die Testung auf mehrere Tage anzusetzen. Auch das Wiederholen der Fragen ist in der Regel möglich.

„Nach dem Studium der Sonderpädagogik sollte jeder Sonderpädagoge in der Lage sein, jeden normierten Test durchführen und interpretieren zu können. Doch geht dies an der Realität vorbei. Gerade die komplexen Testverfahren WISC-IV (Petermann & Petermann, 2011), WPPSI-III (Petermann, 2009), IDS (Grob, Meyer & Hagmann von Arx, 2009) oder die inzwischen verbreitete KABC-II (Kaufman & Kaufman, 2015) benötigen sehr viel Vorbereitung, da eine Vielzahl von Regeln beachtet werden muss. Werden z. B. lediglich zwei, drei oder vier Tests jährlich durchgeführt, ist es unrealistisch zu erwarten, dass man sich an mehrere hundert Regeln bei einer Anwendung alle vier Monate im Jahr erinnert. … Ein Blick auf die Anzahl der Regeln der KABC-II soll dies belegen: Es sind ca. 580 Regeln und verpflichtende Hinweise, die bei der Durchführung beachtet werden müssen. In diese 580 Regeln sind nicht einbezogen „grundsätzliche Vorgehensweisen“ (Kaufman & Kaufman, S. 249 ff.) während der Testsituation sowie allgemeine Hinweise oder Wiederholungen. In diese Zählung der zu beachtenden Regeln sind Anweisungen an die Kinder; ebenfalls nicht aufgeführt und auch nicht alle Regeln, die im Kapitel 4 die Protokollierung, Bewertung und das Ausfüllen des Testbogens beschreiben“ (T. Joél, S. 13)

Joél beschreibt weiterhin, dass das Verfahren zur Intelligenz-Testung aus den drei Schritten Durchführung, Auswertung und Interpretation besteht (S. 19). An allen Stellen dieser Abfolge ist die Durchführung fehleranfällig. Die möglichen Fehler beruhen insbesondere auf der Fachexpertise/Erfahrung der testenden Person, auf der Schaffung einer guten Testsituation sowie auf auf den sozio-kulturellen Voraussetzungen, die das zu testende Kind mitbringt. Darüber muss sich die testende Person im Klaren sein und spätestens bei der Auswertung der Testergebnisse muss sie alle Faktoren berücksichtigen, die sich aufgrund anderer Ursachen negativ aufs Ergebnis auswirken könnten.

3 Eine Auswahl der in Hessen üblichen Testverfahren

Die non-verbalen SON-R Tests (2-8/6-40)

Der SON-R 6–40 ist sprachfrei und besteht aus den 4 Subtests:

  1. Analogien: Erkennen des Prinzip von geometrischen Formen (abstraktes und schlussfolgerndes Denken)
  2. Mosaike: Nachbauen von vorgegebenen Mustern aus Mosaiksteinen (räumliche Analyse- und Synthese)
  3. Kategorien: Beschreiben des gemeinsamen Merkmals in jeweils 3 Bildern (Erkennen von Ordnungsprinzipien)
  4. Zeichenmuster: Vervollständigen von vorgegebenen regelhaften Mustern (räumliches Denken, visuomotorische Fähigkeiten, Handlungsplanung)
    Alle Subtests werden zu einem Gesamt-IQ zusammengefasst. Eine Mehrdimensionalität ist nicht vorhanden.

Der SON-R 2-8 besteht aus sechs Subtests, die in zwei Skalen aufgeteilt werden:

  1. Denkskala (fluide Intelligenz): Kategorien (15 Items), Analogien (17 Items), Situationen (13 Items)
  2. Handlungsskala (räumliches Vorstellungsvermögen): Puzzles (14 Items), Zeichenmuster (16 Items), Mosaike (15 Items)
    Der SON-R 2-8 wird gelegentlich als „mehrdimensional“ bezeichnet, weil er in die zwei (= mehrere!) Skalen unterteilt. Ihm fehlen jedoch die oben bereits angeführten und im klassischen Intelligenzmodell festgeschriebenen Bereiche Kristalline Intelligenz (Gc), Auditive Verarbeitung (Ga), Kurzzeitgedächtnis (Gsm), Langzeitgedächtnis (Glr), Verarbeitungsgeschwindigkeit (Gs), Quantitatives Wissen (Gq). Diese sind aber erforderlich, um ein ganzheitliches Bild vom kognitiven Leistungspotenzial abzugeben und die Stärken und Schwächen des Kindes einschätzen zu können. Die schwache Leistung in einem Bereich ist im Rahmen der schulischen Leistungen evtl. über Stärken in anderen Bereichen kompensierbar. Außerdem kann die verantwortungsbewusste Sonderpädagogik nur über die sorgsame Interpretation der Einzelergebnisse in den verschiedenen Bereichen zu einer gezielten Förderempfehlung gelangen.

Eine umfassende Beurteilung des kognitiven Entwicklungsstandes ist allein anhand der beiden sprachfreien Intelligenztests nicht möglich, da ihnen die übrigen Bereiche fehlen.

„Gerade im pädagogischen Bereich wäre eine mögliche Ableitung von individuellen Stärken und Schwächen neben dem Vergleich mit einer Altersgruppe wünschenswert. Eher eindimensionale Intelligenztests wie u.a. der SON-R 6-40 sind über die Ermittlung eines Gesamtergebnisses hinaus dazu nicht geeignet.“ (T. Joél, S. 18)

Bei der Durchführung des SON-R 2-8 können die Instruktionen sowohl verbal als auch nonverbal gegeben werden. Nach jedem Item gibt die testende Person Feedback, wodurch eine natürliche Situation zwischen ihr und Kind entsteht. Wenn Kinder keine Sprache verstehen und/oder nicht sprachlich reagieren können, kann nur mit dem SON-R getestet werden. Das Ergebnis kann dann aber möglicherweise nur eingeschränkt verwendet werden. Es muss dann auch sehr genau geprüft werden, ob und wie die vorhandenen Defizite in Sprache, Kommunikation, Emotionalität sich auf die allgemeine Intelligenz auswirken. Der SON-R Test eignet sich nicht als Routineverfahren, das man generell für Kinder mit vermuteter geistiger Behinderung anwenden könnte.

Einschränkungen beim SON-R 2-8 (vgl. u.a. Renner/Scholz, 2018):

• Obwohl das Verfahren als SON-R 2-8 bezeichnet wird, liegen Normen nur für den Altersbereich von 2 bis 7 Jahren (also vor dem 8. Geburtstag) vor.
• Wichtige Intelligenzfaktoren sind nicht repräsentiert (z. B. Kristalline Intelligenz, Kurzzeitgedächtnis, Langzeitgedächtnis, Auditive Verarbeitung, Verarbeitungsgeschwindigkeit). Daher muss der SON-R 2-8 mit anderen diagnostischen Verfahren kombiniert werden, wenn eine umfassende Beurteilung der kognitiven Entwicklung erfolgen soll.
• Bei Kindern mit Körperbehinderungen, insbesondere deutlichen Einschränkungen in der Handmotorik, müssen mögliche Beeinträchtigungen der Testfairness bedacht werden. Bei Kindern mit handmotorischen Beeinträchtigungen wird die standardmäßige Durchführung nicht gelingen. Die für die meisten Kinder ausreichende Zeitgrenze kann bei deutlichen feinmotorischen Beeinträchtigungen doch zu knapp bemessen sein. Die Beanspruchung im feinmotorischen Bereich kann die Aufmerksamkeit und Ausdauer der untersuchten Kinder belasten.
• Für Kinder mit Wahrnehmungsproblemen ist der Test nur eingeschränkt einsetzbar: Die Lösung der Aufgaben erfordert differenzierte visuelle Wahrnehmung, also Figur-Grund-Wahrnehmung, Erkennen von Einzelheiten, Synthese zu einem Gesamteindruck, Raum-Lage.Wahrnehmung etc.
• Für Kinder mit Sehbehinderungen ist der SON-R 2-8 nicht geeignet.
• WICHTIGER HINWEIS: Ein durchschnittlicher IQ im SON-R 2-8 allein kann Beeinträchtigungen in schulrelevanten kognitiven Fähigkeiten nicht ausschließen. Auch bei einem unterdurchschnittlichen Ergebnis im SON-R 2-8 können in nicht erfassten Leistungsbereichen für die Fragestellung relevante kognitive Stärken vorliegen

KABC-II

Die K-ABC (Melchers & Preuss, 1991) war einer der wenigen Tests, der vor allem auf Grund seiner intuitiven und sprachlich wenig einschränkenden Vermittlung oft komplett mit intelligenzgeminderten Kindern durchgeführt werden konnte. Die KABC-II hat die positive Möglichkeit der freien Erläuterung beibehalten, die Subtests bleiben auch überwiegend intuitiv nachvollziehbar für die Kinder. (T. Joél, S. 17)

In einem Fall lehnte die testende Sonderpädagogin die Bitte der Mutter, statt des SON-R die KABC-II Testung durchzuführen, mit dem vermeintlichen Argument ab, der Test sei zu schwer fürs Kind. Solche Aussagen entsprechen nicht den Tatsachen.

Ja, die KABC-II ist geeignet für den Einsatz für Kinder mit sonderpädagogischem Unterstützungsbedarf. Es gibt kaum einen Test, der so vielschichtige Hinweise gibt, so ausgezeichnet konzeptioniert wurde, der alle Altersbereiche abdeckt, der weitgehend intuitiv von den Kindern verstanden wird, der sogar in Teilen nonverbal durchgeführt werden könnte, der den Kindern auch noch Spaß macht und der die Besonderheiten von Kindern mit Unterstützungsbedarfen angemessen berücksichtigt. (T. Joél, S. 19)

Für eine valide und standardisierte Testdurchführung muss die testende Person allerdings sowohl über ausreichende Fachexpertise also auch über die nötige Erfahrung sowie regelmäßig Praxis verfügen. Und hierin liegt das bekannte Dilemma: Viele Sonderpädagog*innen greifen dann doch lieber auf den für sie einfachen SON-R-Test zurück und nehmen die Nachteils fürs Kind billigend in Kauf, ohne die Eltern darüber aufzuklären.

WISC-V

Mit der WISC-V liegt ein sehr differenziertes Intelligenzdiagnostikum mit 15 Untertests vor, auf deren Basis sich folgende fünf Kennwerte bilden lassen:
• Arbeitsgedächtnis
• Sprachverständnis
• Verarbeitungsgeschwindigkeit
• visuell-räumliches Denken
• Fluides Schlussfolgern
• Gesamt-IQ Wert
Diese Differenzierung ermöglicht eine fundierte Einschätzung des Entwicklungsstandes. Weitere Analysen können auf der Untertestebene vorgenommen werden. So gelingt mit der Profilanalyse eine gezielte Aussage über Stärken und Schwächen eines Kindes. Zusätzlich liefern Prozessanalysen wertvolle Hinweise für eine fundierte Förderung. (Hogrefe Verlag)

Der WISC-V Test ist damit ein komplexes und aufwendiges Verfahren, so dass die Objektivität in besonderer Weise von der Qualifikation der Testleiterin bzw. des Testleiters abhängt. Bei korrekter Durchführung bietet er dafür eine hohe Auswertungsobjektivität und liefert gute Ergebnisse in den Einzelbereichen, die eine differenzierte Beurteilung der Stärken und Schwächen und damit verbundene konkrete individuelle Förderempfehlungen ermöglichen.

Renner/Schröder (2018) schätzen die Anwendung bei Kindern mit Behinderungen folgendermaßen ein:

Die teilweise komplexen verbalen Instruktionen setzen entsprechende Kenntnisse der deutschen Sprache voraus. Liegen diese nicht vor, können die Testergebnisse in vielen Untertests negativ beeinflusst werden. Dies ist nicht beschränkt auf den Index Sprachverständnis.

Für Kinder mit Sprachschwierigkeiten gibt es allerdings die sprachfreie Variante: Wechsler Non Verbal (WNV).

Die Untertests der WISC-V setzen teilweise Zugangsfertigkeiten voraus, die bei Kinder mit körperlichen und motorischen Beeinträchtigungen und/oder Sinnesbeeinträchtigungen die Testdurchführung erschweren und die Testfairness gefährden. … Leider gibt das Manual nur wenige und nicht sehr detaillierte Hinweise zur Testdurchführung bei Kindern mit Behinderungen und keine standardisierten Instruktionen für Testadaptationen. (Renner/Schröder 2018)

4 Die Grenzen der standardisierten Verfahren

Bei einigen Behinderungsformen sind standardisierte Testverfahren nicht möglich:

„Ausnahmen betreffen Kinder, die aufgrund der Schwere ihrer Beeinträchtigung belegbar nicht in der Lage sind, auch Untertests standardisierter Testverfahren zu bearbeiten. In diesem Fall ist der kognitive Entwicklungsstand durch informelle Verfahren zu beschreiben.“ (Erlass GE)

Für blinde Kinder und Jugendliche gibt es keine standardisierten Testverfahren, da alle Tests zu einem wesentlichen Teil auf der visuellen Wahrnehmung basieren. So können z.B. Kinder und Jugendliche mit einer ausgeprägten Autismus-Spektrums-Störung in der Regel speziell für sie geschaffene Lernangebote an- und aufnehmen, diese aber in Ermangelung ihrer kommunikativen Interaktionsmöglichkeiten nicht bzw. nicht zum erforderlichen Zeitpunkt abrufen. Auch bei schweren geistigen bzw. Mehrfachbehinderungen ist die standardisierte Durchführung nicht möglich.

Dr. A. Rothmayr und D. Jockusch haben 2020 eine Arbeitshilfe erstellt. Die beiden Autorinnen möchten mit ihren Ausführungen dazu beitragen, dass „nicht oder kaum sprechende Kinder/Jugendliche nicht alleine deshalb unterschätzt werden, weil ihnen die lautsprachlichen Fähigkeiten fehlen, ihre intellektuellen Kompetenzen zu zeigen.“ Sie ziehen „Teile standardisierter Tests heran, die eine Aussagekraft bezüglich der intellektuellen Kompetenzen besitzen. Unser Augenmerk liegt in dieser Arbeitshilfe auf den Kompetenzbereichen Mathematik, Deutsch (Schriftspracherwerb) und Kommunikation, sowie dem Lern- und Arbeitsverhalten.“ (https://www.heinrich-hoffmann-schule.de/images/Landesnetzwerk_Arbeitshilfe_zur_UK_und_GE_Feststellungsdiagnostik.pdf, S. 3)

5 Intelligenzwert nur im Vergleich zur „Durchschnittsgruppe“

Die Intelligenzmessung nutzt statistische Verfahren, um die Situation des Individuums im Vergleich zur Intelligenzverteilung in der Gesamtbevölkerung einzuschätzen. Daher ist ein IQ-Wert niemals so eindeutig, wie die als Ergebnis eines Tests „errechnete“ Zahl es vielleicht erwarten ließe. Der Wert zeigt eher an, in welche Richtung und wie stark die die Intelligenz der geprüften Person vom Durchschnitt aller gleichaltrigen Personen abweicht. Schon der Begriff „Konfidenzintervall“ drückt zudem aus, dass man in Wirklichkeit über Bandbreiten spricht, innerhalb derer die „echte“ Intelligenz der getesteten Person mit hoher Wahrscheinlichkeit liegt.

Die immanente Ungenauigkeit wird desto relevanter, je kleiner die statistische Grundlage ist. Bei der Abgrenzung einer „geistigen Behinderung“ sprechen wir von einem Anteil je Jahrgang von ca. 2,2% mit einem IQ ≤ 70 und nur von ca. 1% der Personen je Jahrgang, die außerdem nicht das Mindestmaß an sozial-adaptiven Kompetenzen besitzen. Wenn ein standardisierter Test also mit 1000 zufällig ausgewählten Testpersonen normiert wurde, dann wären in dieser Auswahl gerade einmal 10 „geistig behinderte“ Personen zu erwarten. Wenn die heute geteste Person ihre „Ausreißer“, in denen sie stark vom Durchschnitt der Gesamtbevölkerung abweicht, in ganz anderen Bereichen hat als die zehn „Zufälligen“ bei der Normierung, dann könnte sich daraus eine erhebliche Abweichung im Testergebnis ergeben – und die Aussagekraft des Testergebnisses ist daher fraglich.

Daher müssen das Gesamtergebnis und auch die Ergebnisse der einzelnen Subtests von der testleitenden Person auf ihre Stimmigkeit innerhalb des Testsystems („Reliabilität“) überprüft werden. Vor allem bei Testpersonen mit besonders ungewöhnlicher Verteilung der individuellen Fähigkeiten kann es sein, dass die Feststellung eines Gesamtergebnisses gar nicht mehr sinnvoll möglich ist, weil die Einzelergebnisse nicht in die erwarteten Muster passen. Gerade bei sehr niedrigen Werten muss auch geprüft werden, ob ganz andere Einflussfaktoren die Testperson davon abgehalten haben, ihre eigentlich vorhandenenen besseren Fähigkeiten umzusetzen. Bei vielen Tests ist bekannt, dass sie bei bestimmten Eigenschaften der Testperson (etwa Einschränkungen der Feinmotorik oder der Sehfähigkeit, fremde Muttersprache, andere kulturelle Prägung) zu abweichenden Testergebnissen führen. Nicht immer waren diese besonderen Eigenschaften schon vor Durchführung des Tests in vollem Umfang bekannt. Dann müsste das Testergebnis als unbrauchbar eingestuft werden, eventuell kann noch ein anderer Test unter Berücksichtigung der spezifischen individuellen Einschränkungen durchgeführt werden.

Grundsätzlich kann der IQ-Test alleine nicht die Feststellung einer geistigen Behindung begründen. Besonders niedrige IQs oder IQs auf der Basis sehr uneinheitlicher Einzelergebnisse sollten wegen der beschriebenen Unsicherheiten der statistischen Verfahren nicht ohne weitere Überprüfung als „gegeben“ weiterverwendet werden.