Intelligenztest


Welche Figur der unteren Reihe setzt die obere Reihe sinnvoll fort? Ein typisches Beispiel eines Matrizentests

Ein Intelligenztest ist ein Instrument der psychologischen Diagnostik zur Messung der Intelligenz einer Person. Da Intelligenz und ihre Bereiche unterschiedlich definiert werden können, gibt es sehr verschiedenartige Intelligenztests. Dabei geht man davon aus, dass Leistungsunterschiede in Intelligenztests auch Unterschiede der kognitiven Leistungsfähigkeit im täglichen Leben abbilden. Psychologische Tests werden als Hilfsmittel zum Finden einer optimalen Entscheidung im Rahmen verschiedener diagnostischer Fragestellungen eingesetzt. Die Erfassung der Intelligenz kann zum Beispiel für die Vorhersage von Berufserfolg oder Berufseignung (Personalauswahl oder Berufsberatung) oder für Empfehlungen einer Schulausbildung oder einer Studienwahl hilfreich sein. Auch verschiedene klinische Fragestellungen (Vorliegen von Erkrankungen wie Demenz oder Intelligenzminderungen oder die Anwendung beruflicher Rehabilitationsmaßnahmen) können die Erfassung der Intelligenz notwendig machen.

Am bekanntesten ist immer noch das Ergebnis einiger dieser Tests, der Intelligenzquotient (IQ). Umgangssprachlich werden Intelligenztests manchmal auch IQ-Tests genannt. Wegen der Gefahr der Verabsolutierung des IQ als Etikett einer Person (wie Körpergröße oder Gewicht – also unabhängig von einer konkreten Fragestellung) verwendet man diese Größe in der Fachsprache nicht mehr und greift auch auf andere Normskalen zur Beschreibung von Intelligenz-Leistungen zurück (z. B. Standardwerte SW).

Allgemeines

Intelligenz ist ein nicht direkt messbares soziales Konstrukt.[1] Anders als zum Beispiel die Körpergröße lässt sich der IQ nie mit 100-prozentiger Sicherheit feststellen. Die Bestimmung des IQ mittels Intelligenztests ist immer mit einem bestimmten zufälligen Messfehler behaftet.[2] Es existiert kein Intelligenztest, der alle Teilbereiche der Intelligenz umfasst. Laut dem Bundesministerium für Bildung und Forschung umfassen die verschiedenen Tests „je nach zugrunde liegender Theorie und je nach Aufgabenzusammenstellung, mehr oder weniger verschiedene Bereiche der Intelligenz. Bei manchen Tests ist das Abschneiden […] zum Beispiel eher vom Vorwissen abhängig, bei anderen ist dieses eher bildungsunabhängig. Manche Tests erfassen nur eine Teilfähigkeit der Intelligenz (z. B. das abstraktlogische Denken), andere erfassen eine Vielzahl verschiedener Fähigkeiten […]. Dennoch wird das Ergebnis bei fast allen Tests als IQ ausgedrückt. Oberflächlich besehen könnte man daher denken, es handele sich um dieselben erfassten Fähigkeiten. Doch Vorsicht: IQ ist nicht gleich IQ, und es gibt auch nicht den IQ-Test![3]

Man kann das Intelligenzkonstrukt, auf dem klassische Intelligenztests beruhen, laut Jens Asendorpf folgendermaßen charakterisieren: „Intelligenz ist, was Intelligenztests messen, die so konstruiert wurden, dass sie das Bildungsniveau möglichst gut vorhersagen, oder kurz: Intelligenztests messen die Befähigung zu hoher Bildung.“[4]

Andere wesentliche Persönlichkeitsdimensionen wie etwa die Emotionale Intelligenz werden durch den IQ-Test nicht erfasst.

Normskalen für die Intelligenzmessung

Intelligenztests werden so gestaltet, dass sie eine Normalverteilung generieren. Dazu bemerkt Rosemann: Die Normalverteilung der Intelligenz ist ein idealtypisches Modell, das der Realität aufgepfropft ist, ein unbewiesener Grundsatz der Testkonstrukteure. D. h., Tests werden so konstruiert, dass die empirischen Verteilungswerte der idealtypischen Normalverteilung entsprechen. Dies ist eine mathematische Forderung an die Testkonstruktion, die dadurch erfüllt wird, dass Aufgaben, die zu einem nichtnormalverteilten Ergebnis führen, bei der Testentwicklung ausgeklammert werden. Jeder Test, der eine andere Verteilung der Ergebnisse erbringt, gilt als schlecht konstruiert; er wird als schlechter Intelligenztest über Bord geworfen.[5]

Der Intelligenzquotient (IQ) wird als Abweichungsquotient der Rohwerte zum Mittelwert in Einheiten der Standardabweichung von 15 mit einem Mittelwert von 100 angegeben.

$ Abweichungs-IQ=100+15\cdot {\frac {(x-\mu )}{\sigma }} $ (HAWIE und HAWIK Hamburg-Wechsler-Intelligenztest)

Eine andere gebräuchliche Größe sind die Standardwerte (SW), die manchmal mit dem IQ verwechselt werden. Hier ist der Mittelwert ebenfalls 100, die Standardabweichung aber 10.

$ SW=100+10\cdot {\frac {(x-\mu )}{\sigma }} $ (IST Intelligenz-Struktur-Test nach Rudolf Amthauer)

Beim Vergleich der Werte verschiedener Intelligenztests ist zu beachten, dass unterschiedliche Leistungsanforderungen (Validitätsbereiche) die Aussagefähigkeit der Tests ebenso bestimmen wie die Verwendung unterschiedlicher Normierungsstichproben (z. B. unterschiedliche Repräsentativität für die Gesamtbevölkerung), auf die sich der gemessene Wert für Intelligenz bezieht.

Arten von Intelligenztests

Intelligenztests sind jeweils auf eine Intelligenztheorie bezogen, die bei der Interpretation eines Ergebnisses beachtet werden muss. Entsprechend gibt es Tests zur Erfassung einer (einzigen) allgemeinen Intelligenz oder von Komponenten (Faktoren, Dimensionen) der Intelligenz.

Der Binet-Simon-Test

Alfred Binet und Théodore Simon entwickelten 1905 den ersten brauchbaren Intelligenztest, dessen Grundideen sich in allen modernen Tests wiederfinden. Der Binet-Simon-Test bestand aus einer Reihe von einzelnen, aber verschiedenartigen Aufgaben (Subtests). Die Zahl der gelösten Aufgaben wurde zu einem Punktwert addiert. Die Aufgaben selbst stellen zum Teil einfache Fragen und Probleme des Alltags dar. Teils handelt es sich um logische oder mathematische Aufgaben (zum Beispiel das Ergänzen von Zahlenreihen). Bereits die ersten Tests umfassten auch das Messen der Gedächtnisspanne. Um den Test auszuführen, war es notwendig, die sprachlichen Anweisungen zu verstehen. Daraus ergab sich die berechtigte methodische Kritik, dass Personen, die diese Anweisung nicht oder nur ungenügend verstehen, schon aus diesem Grund bei einem Intelligenztest schlechter abschneiden.

Allgemeine Intelligenz

Bezieht sich auf das Generalfaktormodell von Charles Spearman und wird beispielsweise durch den Zahlen-Verbindungs-Test (ZVT) von Erwin Roth oder die Matrizentests von John C. Raven erfasst.

Kristallisierte (kristalline) und fluide Intelligenz

Diese Gegenüberstellung geht auf den britisch-amerikanischen Psychologen R. B. Cattell zurück und bedeutet die Unterscheidung von Problemlösefähigkeit (Fähigkeit, Problemstellungen zu lösen und sich an neue Problemstellungen anzupassen) – als fluide Intelligenz und Wissen (die früher erworbenen Wissensbestände und Lernprozesse als bildungsabhängige Komponente) – als kristallisierte Intelligenz (Original: crystallized).[6] Weist eine Person unterschiedliche Ausprägungen in beiden Bereichen auf, können sowohl in der Klinischen Psychologie (z. B. Abbaudiagnostik) als auch in der Entwicklungspsychologie (z. B.: Liegt ein fähigkeitsentsprechender Bildungsstand vor?) wichtige Schlüsse gezogen werden. Diese Fähigkeiten werden insbesondere in den von Alan S. Kaufman entwickelten Tests gemessen. Es ermöglicht eine Differenzierung von den Fertigkeiten, erworbenes Wissen und die grundlegenden, fluiden Fähigkeiten in Problemlösungen einzusetzen. Der bekannte Test für Kinder von zweieinhalb bis zu zwölfeinhalb Jahren ist die Kaufman Assessment Battery for Children (K-ABC). Hier ist eine Unterscheidung zwischen fluider Intelligenz, kristallisierter Intelligenz und Fertigkeiten (wie Buchstabieren oder erworbenem Umweltwissen) möglich. Der K-ABC enthält auch eine Skala für nicht sprachgebundene Untertests, die einen Wert bieten, wenn sprachliche Fähigkeiten beeinträchtigt sind. Für Jugendliche und Erwachsene steht seit 1997 der Kaufman-Test zur Intelligenzmessung für Jugendliche und Erwachsene (K-TIM) zur Verfügung.

Ravens Progressive Matrizen

1938 entwickelte John C. Raven ein kulturunabhängiges, sprachfreies Verfahren, genannt Progressive Matrizen,[7] das Verzerrungen für Testpersonen aus fremden Kulturen ausschließen sollte. Jedoch hat sich diese Hoffnung auf völlig kulturunabhängige Tests nicht erfüllt, da die Kritiker von IQ-Tests gute Gründe dafür anführten, dass sich kulturell unterschiedliche Denkstile und kulturelle Erfahrungen nicht auf nur sprachliche Unterschiede reduzieren lassen. Es stellte sich heraus, dass ein Rest an „Kultur-Konfundierung“ auch bei weitgehend sprachfreien Tests erhalten bleibt.[8]

Verbale und praktische (Handlungs-) Intelligenz

Diese Unterteilung beruht auf dem Intelligenzkonzept von David Wechsler, der Intelligenz als „die zusammengesetzte oder globale Fähigkeit des Individuums (bezeichnet,) zielgerichtet zu handeln, rational zu denken und sich wirkungsvoll mit seiner Umwelt auseinanderzusetzen“.[9] Die von Wechsler in der ursprünglichen Version vorgenommene Unterteilung der Intelligenz in Verbal- und Handlungsintelligenz ist dabei lediglich eine der vielen möglichen Gliederungen dieses komplexen Konstrukts. Sie hat keine theoretisch geleitete Grundlage, sondern ist vielmehr pragmatisch motiviert; alternative Konzeptionen sind mithin keineswegs ausgeschlossen.[10]

Wechslers in den 1950er-Jahren entwickelte Testreihe prüft in elf Teiltests Allgemeinwissen, Wortschatz, rechnerisches Denken, audio-visuelle Aufnahmefähigkeit und Abstraktionsvermögen. Der vom Hamburger Psychologen Curt Bondy modifizierte Hamburg-Wechsler-Intelligenztest für Erwachsene (WIE, früher HAWIE) ist heute ein gebräuchlicher Test für Probanden zwischen 16 und 74 Jahren. Analog dazu gibt es einen Test für Kinder zwischen 6 und 16 Jahren (WISC, früher HAWIK). Eine weitere Revision von 1983 wird durch ein angehängtes „-R“ gekennzeichnet. Der Kindertest liegt inzwischen in einer weiter überarbeiteten Version (WISC-IV, letzte Auflage 2010) vor. Die Wechsler Preschool and Primary Scale of Intelligence (WPPSI-III, letzte Auflage 2011), früher unter der Bezeichnung Hannover-Wechsler Intelligenztest für das Vorschulalter (HAWIVA) erhältlich, ermöglicht darüber hinaus die Testung von Kindern zwischen 3 Jahren und 7 Jahren, 2 Monaten.

Anders als in den aktuellen Versionen der Tests (WIE – Wechsler Intelligenztest für Erwachsene; WISC-IV – Wechsler Intelligence Scale for Children, deutsche Bearbeitung) bestand bislang eine strikte Trennung der Untertestaufgaben in einen sogenannten Verbal- vs. Handlungsteil. Für die WPPSI-III wurde diese Gliederung auch bei der Neubearbeitung beibehalten.[11] In den beiden neuesten Auflagen des WIE und der WISC hingegen wurde diese Zweiteilung zugunsten einer Differenzierung in vier sogenannte Indizes aufgegeben, die nunmehr die Leistungsfähigkeit in den vier Bereichen Sprachverständnis, Wahrnehmungsgebundenes logisches Denken, Arbeitsgedächtnis und Verarbeitungsgeschwindigkeit beschreiben.

Im Rahmen der WISC-IV gelten folgende Zuordnungen:

  • Sprachverständnis
    • Gemeinsamkeiten finden
    • Wortschatztest
    • Allgemeines Verständnis
    • optional Allgemeines Wissen
  • Wahrnehmungsgebundenes logisches Denken
    • Mosaiktest
    • Bildkonzepte
    • Matrizentest
    • optional Bilderergänzen
  • Arbeitsgedächtnis
    • Zahlen nachsprechen
    • Buchstaben-Zahlen-Folgen
    • optional Rechnerisches Denken
  • Verarbeitungsgeschwindigkeit
    • Zahlen-Symbol-Test
    • Symbolsuche
    • optional Durchstreichtest

Mehrfaktorenkonzepte

beruhen z. B. auf Modellen von Louis Leon Thurstone oder Adolf Otto Jäger. Beispiele:

  • I-S-T 2000R Intelligenz-Struktur-Test (dieser Test verwendet anstatt des IQ den Standardwert SW!)
    • verbale Kompetenz (Satzergänzung, Analogien, Gemeinsamkeiten)
    • numerische Kompetenz (Rechenaufgaben, Zahlenreihen, Rechenzeichen)
    • figurale Kompetenz (Figurenauswahl, Würfelaufgaben, Matrizen)
    • Merkfähigkeit, Schlussfolgerndes Denken (Reasoning)
    • Erweiterungsmodul: fluide und kristallisierte Intelligenz (Generalfaktoren)
  • WIT-2 Wilde-Intelligenz-Test Version 2 [12]
    • Sprachliches Denken
    • Rechnerisches Denken
    • Räumliches Denken
    • Schlussfolgerndes Denken (Integral aus sprachlichem, rechnerischem und räumlichem Denken)
    • Merkfähigkeit
    • Arbeitseffizienz
    • Wissen Wirtschaft
    • Wissen Informationstechnologie

Informationspsychologie

Da es sich bei Intelligenztests um Leistungstests handelt, ist für die Bearbeitung der Tests in der Regel eine Zeitbegrenzung vorgegeben. Aus der Beobachtung, dass bereits das Aneinanderreihen einfacher Aufgaben (elementare kognitive Aufgaben), zum Beispiel die Aufgabe, zufällig auf einem Blatt angeordnete Zahlen mit möglichst großer Geschwindigkeit in aufsteigender Zahlenfolge zu verbinden, ein Maß der Intelligenz ergibt, entwickelten sich seit etwa 1970 neue theoretische und praktische Ansätze und Weiterentwicklungen, so aus der genannten Aufgabenstellung zum Beispiel der Zahlenverbindungstest (ZVT) von Oswald und Roth. Durch dieses Messen der kognitiven Informationsverarbeitungsgeschwindigkeit und der Gedächtnisspanne mit dem KAI-Test konnte nunmehr die Kurzspeicherkapazität berechnet werden, wodurch der IQ-Begriff durch die Informationspsychologie ergänzt und herausgefordert wurde.

Kurztests

Vor allem in klinischen Untersuchungen (bei Alzheimer zum Beispiel) ergibt sich die Notwendigkeit, das Intelligenzniveau des Patienten näherungsweise zu schätzen. Da ein Intelligenztest von ein oder zwei Stunden Dauer in solchen Fällen völlig unpraktikabel ist, strebt man im klinischen Bereich nach IQ-Kurztests. Ein solcher bewährter Kurztest ist der Mehrfachwahl-Wortschatz-Intelligenz-Test MWT von Siegfried Lehrl.

Intelligenztests und Bildungsevaluation

Nach den Ergebnissen von Rindermann (2006[13]) sollen auch die bei den PISA-Studien, bei TIMSS und bei IGLU eingesetzten Testverfahren als Intelligenztests zu verstehen sein – dies ist allerdings umstritten (Baumert u. a. 2007[14]). Die Validität und Verlässlichkeit der PISA-Tests als Maß des Allgemeinen Faktors der Intelligenz wird von der Studie als gleichwertig oder sogar höher als bei den oben angeführten Tests angesehen. Allerdings werden PISA-Tests nicht unter ausreichend abgesicherten Bedingungen durchgeführt, so dass die Ergebnisse in der Regel nicht für eine Intelligenzaussage zu den einzelnen Schülern verwendet werden können.

Nichtsprachliche Intelligenztests

Es gibt eine Reihe von Voraussetzungen, deren Nichtbeachtung zu intuitiv falschen Ergebnissen bei IQ-Tests führt. Sprachlastige IQ-Tests etwa setzen voraus, dass die Person die Sprache gut beherrscht, in der die Fragen vorgelegt werden: Kinder bestimmter Gruppen von Gastarbeitern und Immigranten schneiden dabei oft schlecht ab.[15]

Für diese Fälle gibt es sprachfreie IQ-Tests wie zum Beispiel SPM ({{Modul:Vorlage:lang}} Modul:Multilingual:149: attempt to index field 'data' (a nil value), vgl. Progressive Matrizen) und den Culture Fair Intelligence Test (CFIT) (oder im deutschen Sprachraum {{Modul:Vorlage:lang}} Modul:Multilingual:149: attempt to index field 'data' (a nil value) CFT). Der CFT kann auch von Menschen mit geringen kulturtechnischen Kompetenzen angewendet werden.[16] Die neueste Auflage des CFT-20 R enthält auch einen fakultativ (also wahlweise) einsetzbaren Wortschatztest und einen Zahlenfolgetest, welche die Fähigkeit zum logischen Schlussfolgern im sprachlichen und rechnerischen Bereich messen sollen. Der SON-R 5 1/2-17 und der Bochumer Matrizentest (BOMAT) sind ebenfalls Beispiele für sprachfreie Intelligenztests. Dennoch ist auch der Erfolg bei nichtsprachlichen Intelligenztests kulturabhängig.[17]

Konstruktion

Die Autoren von Intelligenztests konstruieren ihre Tests nach impliziten Annahmen bzw. in Anlehnung an bestehende Intelligenztheorien. Es kann davon ausgegangen werden, dass verschiedene Intelligenztests unterschiedliche Ausschnitte der Intelligenz erfassen.

Einige Verfahren verwenden sehr verschiedene Untertests/verschiedene Itemformen (IST2000, BIS), während andere sehr homogene, aber besonders repräsentative Itemformen verwenden ({{Modul:Vorlage:lang}} Modul:Multilingual:149: attempt to index field 'data' (a nil value), Matrizentests).

Einige Verfahren sind besonders für die Erfassung der allgemeinen Intelligenz konzipiert (Modell des Generalfaktors der Intelligenz), während andere (WIT, LPS) eher an der spezifischen Ausprägung der einzelnen Faktoren der Intelligenz interessiert sind.

Gütekriterien der Tests

Gängige Intelligenztests erreichen meist eine gute Reliabilität. Ebenso sind die Kriteriumsvalidität und die prädiktive Validität bezogen auf Schulnoten meist gut. Dies liegt daran, dass die Gültigkeit der Tests von vornherein danach konzipiert wird, welche Unterschiede zwischen Schülern höher- oder geringerwertiger Allgemeinbildung an verschiedenen Schultypen aufgefunden werden können. Langfristig bewährt hat sich ein Test demnach vor allem dann, wenn der Schulerfolg mit dem Abschneiden in IQ-Tests korreliert. Die darin liegende Unterstellung, es handele sich bei der Intelligenz um eine getrennt von Testkonstruktionen existierende und aufzufindende allgemeine Fähigkeit, die sich, so gesehen, letztlich am Schulerfolg zeigt, wird von den Testkonstrukteuren selbst problematisiert. Die Lösung der Frage, ob also Intelligenztests messen, was sie messen sollen, und wie gut, beantwortet damit zugleich die insoweit dann nicht weiter zur Debatte stehende Frage nach dem begrifflichen Inhalt von Intelligenz – eben im Sinne der Anerkennung von Intelligenztests.[18]

Die Vorhersagekraft von Intelligenztests ist oft nicht völlig unabhängig von der Höhe des Testwertes. Bei sehr niedrigen oder sehr hohen IQ-Werten ist die Vorhersagekraft (z. B. für Berufserfolg) meist etwas größer als im mittleren Bereich.

Der Einsatz von Intelligenztests bei der Bewerberauswahl, zum Beispiel im Rahmen eines Assessment-Centers, hat immer unter Aufsicht eines Diplom-Psychologen zu erfolgen, anderenfalls kann das Verfahren angefochten werden.

Normierung

Intelligenztests werden nach Altersgruppen und gegebenenfalls nach anderen Merkmalen wie Schulabschlüssen normiert. Manche Autoren sprechen von der sogenannten Eichstichprobe. Diese Normierung erfolgt meist getrennt für einzelne Länder (auch im deutschen Sprachraum). Länderübergreifende Vergleiche sind daher nur eingeschränkt möglich.

Der Flynn-Effekt bezeichnet die Tatsache, dass bis in die 1990er Jahre die Ergebnisse von IQ-Tests im Mittel höhere Werte erbrachten, die gemessene Intelligenz also offenbar zunahm. Mit Beginn der 1990er-Jahre stagnierte der IQ, und seit dem Ende der 1990er Jahre nimmt er sogar wieder ab.[19][20][21] Dadurch ist es notwendig, Intelligenztests regelmäßig neu zu eichen. Bis 1990 mussten sie schwerer, jetzt müssen sie wieder einfacher gemacht werden.

Bekannte Intelligenztests

  • Wechsler-Intelligenztest für Erwachsene (WIE)
  • Hamburg-Wechsler-Intelligenztest für Kinder und Jugendliche von 6–17 Jahre (WISC-IV, früher HAWIK IV)
  • Wechsler Preschool and Primary Scale of Intelligence – deutsche Version (WPPSI-III, früher HAWIVA)
  • Kaufman-Test (K-ABC und K-TIM)
  • Intelligenz-Struktur-Test (IST)
  • Berliner Intelligenzstrukturtest (BIS-4) und Berliner Intelligenzstrukturtest für Jugendliche: Begabungs- und Hochbegabungsdiagnostik (BIS-HB)
  • Snijders-Oomen Nonverbaler Intelligenztest (SON)
  • Kognitiver Fähigkeitstest (KFT)
  • Analytischer Intelligenztest (AIT); von R. Meili, veröffentlicht 1966
  • Leistungsprüfsystem (LPS); von W. Horn entwickelt, 1962 erschienen
  • Stanford-Intelligenz-Test; amerikanischer Test, für Deutschland von H. R. Lückert bearbeitet, 1957 erschienen
  • Progressive Matrizen von Raven

Kritik

Kinder, die bei Intelligenztests gut abschneiden, finden sich vor allem in den oberen Schichten.[22] Es wird diskutiert, ob dies daran liegt, dass traditionelle Intelligenztests gegenüber Kindern anderer Schichten unfair sind. Anastasi berichtet etwa, dass bei den traditionellen Intelligenztests Ober- und Mittelschichtskinder stets besser abschneiden als Arbeiter- und Unterschichtskinder. Jedoch gibt es auch Testverfahren, bei denen Unterschichtskinder anderen voraus sind. Dazu gehört etwa der Minnesota-Test für mechanisches Zusammenbauen (Minnesota Mechanical Assembly Test). Dieser Test ist besonders gut geeignet, um mechanische Fähigkeiten zu testen. Den Probanden wird ein T-Score zugeordnet. Je höher dieser ist, desto besser sind die Fähigkeiten. Die Mittelwerte dieses Tests weisen keine konsistente Beziehung zum Sozialstatus auf. Die besten Werte erreichen jedoch Unterschichtskinder. Als eine mögliche Ursache wird angesehen, dass Unterschichtssöhne mehr Erfahrung im Umgang mit mechanischen Objekten hinter sich haben und somit mit den Aufgaben dieses Tests vertrauter sind.[23]

Wegweisend ist hier die Studie von Janke und Havighurst, die bereits 1945 stattfand. Diese testeten Kinder und Jugendliche aus „einer typischen Stadt im mittleren Westen der USA“ mit verschiedenen Intelligenztests.[24] Bei den meisten Tests schnitten Unterschichtskinder deutlich schlechter ab als Kinder der Ober- oder Mittelschicht, nicht jedoch beim Minnesota Mechanical Assembly Test.[25]

Dies wird hier nicht für alle Tests in aller Ausführlichkeit dargestellt. Stattdessen werden hier nur die Ergebnisse zweier Tests dargestellt: und zwar die des Stanford-Binet-Test (ein Test, bei dem es sehr starke Schichtunterschiede gibt) und die des Minnesota Mechanical Assembly Testes. Folgendes Ergebnis zeigte sich bei 16-jährigen Schülern aus verschiedenen Herkunftsschichten:[26]

Sozialschicht der Eltern Ergebnis auf dem Stanford-Binet (IQ 100±15) Ergebnis auf dem Minnesota Mechanical Assembly Test (T-Wert, 50±10))
Alle Sozialschichten zusammen 108 dies deutet darauf hin, dass Leute mit sehr niedrigem IQ schon nicht mehr in der Stichprobe waren, siehe dazu unten 50
A&B (die höchsten beiden Herkunftsschichten) 128 46,8
C 112 51,6
D 104 48,8
E (niedrigste Herkunftsschicht) 98 53,0

Hier zeigte sich also, dass die Jugendlichen aus der höchsten Sozialschicht den höchsten IQ (gemessen durch den Stanford-Binet) hatten. Mit sinkender Sozialschicht nahm der IQ ab. In den beiden untersten Sozialschichten (D&E) waren zum Zeitpunkt der Testung einige Jugendliche bereits nicht mehr in der Schule.[26] Es wird vermutet, dass es sich bei diesen um Jugendliche mit besonders niedrigem IQ (gemessen auf dem Stanford-Binet) handelt, weil Highschool-Drop-Outs meistens einen niedrigen IQ haben. Die IQs in Gruppe D&E sind wahrscheinlich noch niedriger.[27] Der T-Score hingegen folgte nicht diesem Muster. Er war in der untersten Schicht am höchsten. Da der T-Score aller Sozialschichten beim Minnesota Mechanical Assembly Test 50 war (und dies dem erwarteten Wert entspricht), ist bei diesem Test nicht mit systematischen Verzerrungen zu rechnen.

Erstmals konnte in einer Studie ein Verfahren demonstriert werden, mit dem die Probanden deutlich besser im Test abschnitten als untrainierte Vergleichspersonen. Dabei ist es nicht Teil des Trainingsprogramms, die im IQ-Test verwendeten Aufgabentypen zu üben. Vielmehr wird das Arbeitsgedächtnis geschult, was offensichtlich einen positiven Effekt auch auf andere Aufgabentypen hat.[28][29]

Das Abnehmen eines Intelligenztests – wie anderer vergleichbarer Tests – stößt auf kulturelle Grenzen: In Gesellschaften, in denen solche wissenschaftlichen Fragenbatterien keinen erkennbaren Realitätsbezug haben, werden sie als „albern“ o. ä. eingestuft, also z. B. unernst, höflich („Was will der Frager wohl am liebsten hören?“) oder gar nicht mehr beantwortet. Dadurch verliert der IQ seine interkulturelle Vergleichbarkeit.

Die bei allen IQ-Tests unterstellte logische Operation zur Bestimmung von „Intelligenz“ entspricht der Logik von Kraft und Äußerung bei Hegel: Intelligenztestkonstrukteure unterstellen, dass sich eine allgemeine Fähigkeit zu intelligenten Leistungen in bestimmten messbaren Test-Leistungen äußere. Dies wird begründet durch eine tautologische Aufspaltung des umgangssprachlichen Begriffs Intelligenz in ein in sich selbst ruhendes Ursache-Wirkungsverhältnis:[30] Man verdoppelt intelligente Leistungen – aus dem Bedürfnis nach Messbarkeit heraus, verallgemeinert als abstrakte Intelligenzleistung – in deren Äußerung (bestimmte messbare Test-Leistungen) und das diesen Äußerungen angeblich zugrundeliegende Vermögen dazu – ausgedrückt im IQ-Wert.[31] Durch diese willkürliche Zerlegung von Intelligenz in „Fähigkeit und Äußerung derselben“ wird aus den vom Test behaupteten, sorgfältig ausgedachten Kriterien für das Konstrukt Intelligenz ein Messinstrument für die Intelligenz. Eine Kausalität konstituiert sich daher erst durch die gedankliche Trennung bzw. Verdoppelung. Insofern trifft die berühmte Aussage, Intelligenz sei, was der IQ-Test misst, auf jede Intelligenzmessung zu und lässt somit unter der Hand überhaupt erst Intelligenz als abstrakten Gegenstand wahr werden. Bestimmte intelligente Leistungen sind inhaltlich nicht abstrakt vergleichbar – es sei denn, der Wille zur Auffindung abstrakter Intelligenz bringt sie genau als das, was man aus bestimmten praktischen Interessen heraus messen will, theoretisch hervor (z. B. für die Feinsteuerung von Selektion).[32] Aus einer solchen Kritik folgt ebenso, dass die Art und Weise des Testens im Einzelnen nicht relevant sein kann. Der persönliche Geschmack des Testers und seine ideologische Praxis-Orientierung bestimmen die Technik der IQ-Wert-Messung („sprachfrei“, „mathematikfrei“, „milieuneutral“ usw.).[33]

Siehe auch

  • Turing-Test
  • Validität von Intelligenzmessungen

Literatur

  • Stephen Jay Gould: Der falsch vermessene Mensch. 3. Auflage. Suhrkamp, Frankfurt am Main 1999, ISBN 3-518-28183-6.
  • K. J. Groffmann: Die Entwicklung der Intelligenzmessung. In: R. Heiss (Hrsg.): Psychologische Diagnostik. C. J. Hogrefe, Göttingen 1964, S. 148–199. (= Handbuch der Psychologie; 6)
  • Peter Lauster: Teste Deine Intelligenz, Humboldt-Taschenbuchverlag Jacobi KG, München 1974, ISBN 3-581-66225-6
  • Nicholas John MacKintosh: IQ and Human Intelligence. Oxford University Press, Oxford 1998, ISBN 0-19-852368-8.
  • Franzis Preckel, Matthias Brüll: Intelligenztests. Reinhardt, München 2008, ISBN 978-3-8252-3027-2.
  • Keith E. Stanovich: What Intelligence Tests Miss: The Psychology of Rational Thought. Yale University Press, 2009, ISBN 0-300-12385-X.
  • Marc Wittmann, Andreas Eisenkolb, Christoph Perleth: Neue Intelligenztests. Ein umfassendes Test- und Übungsprogramm. Augustus Verlag, Augsburg 1997, ISBN 3-8043-3055-X.

Einzelnachweise

  1. David G. Myers: Psychology, 2008, Worth Publishers, S. 405–406
  2. Begabte Kinder finden und fördern – Ein Ratgeber für Elternhaus und Schule. Informationsbroschüre des Bundesministeriums für Bildung und Forschung, Oktober 2003; S. 36
  3. Begabte Kinder finden und fördern – Ein Ratgeber für Elternhaus und Schule. Informationsbroschüre des Bundesministeriums für Bildung und Forschung, Oktober 2003; S. 12–13
  4. Jens Asendorpf: Persönlichkeitspsychologie. Springer Medizin Verlag, Heidelberg 2009, S. 80–81
  5. Herrman Rosemann, 1979, Intelligenztheorien, Rowohlt Verlag, S. 53/54
  6. Myers, David G. (2005): Psychologie, Heidelberg, Springer
  7. Raven, J. C. (1938), Progressive Matrices, London: Lewis
  8. H.-M. Süß, (2003), „Culture fair“, In K. D. Kubinger & R. S. Jäger (Hrsg.), Stichwörter der Psychologischen Diagnostik, Weinheim, Beltz
  9. Wechsler, D. (1956), „Die Messung der Intelligenz Erwachsener“, Bern: Verlag Hans Huber, (S. 13)
  10. David Wechsler (deutsche Bearbeitung von Franz und Ulrike Petermann), WISC-IV – Manual 1., Frankfurt/Main: Pearson Assessment, 2010
  11. David Wechsler (deutsche Bearbeitung von Franz Petermann unter Mitarbeit von Monika Lipsius): WPPSI-III. (2., überarbeitete und erweiterte Aufl.) Frankfurt/Main: Pearson Assessment, 2011
  12. Martin Kersting: Wilde-Intelligenztest 2. Testmanual. Hogrefe, Göttingen 2008., http://kersting-internet.de/wit/main.html
  13. Heiner Rindermann: Was messen internationale Schulleistungsstudien? Schulleistungen, Schülerfähigkeiten, kognitive Fähigkeiten, Wissen oder allgemeine Intelligenz? In: Psychologische Rundschau. Band 57, Nr. 2, 2006, ISSN 0033-3042, S. 69–86. PDF
  14. Jürgen Baumert, Martin Brunner, Oliver Lüdtke, Ulrich Trautwein: Was messen internationale Schulleistungsstudien? – Resultate kumulativer Wissenserwerbsprozesse. In: Psychologische Rundschau. Band 58, Nr. 2, 2007, ISSN 0033-3042, S. 118–128, doi:10.1026/0033-3042.58.2.118.
  15. Glenn Wilson, Diana Grylls: Wie klug ist mein Kind: Intelligenztest für Kinder. Bastei Lübbe, Bergisch Gladbach 1980, ISBN 3-404-01356-5, S. 21.
  16. www.legasthenietherapie-info.de
  17. S. O. Ortiz & A. M. Dynda: Use of intelligence tests with culturally and linguistically diverse populations. In: D. P. Flanagan & P. L. Harrison (Hrsg.): Contemporary intellectual assessment. 2. Auflage. Guilford Press, New York 2005, S. 545–556; siehe auch Ravens Progressive Matrizen
  18. Tieze/Tewes 1994, S. 57 ff.
  19. Wissenschaft.de vom 16. Mai 2005: Forscher schlagen Alarm: In den Industrieländern ist der IQ auf Talfahrt abgerufen am 8. Februar 2008
  20. Teasdale, T. W., & Owen, D. R. (2005): A long-term rise and recent decline in intelligence test performance: The Flynn Effect in reverse. Personality and Individual Differences, 39, 837–843
  21. Sundet, J. M., Barlaug, D. G., & Torjussen, T. M. (2004): The end of the Flynn effect? A study of secular trends in mean intelligence test scores of Norwegian conscripts during half a century. Intelligence, 32, 349–362
  22. Anastasi, Anne (1976): Differentielle Psychologie: Unterschiede im Verhalten von Individuen und Gruppen 2. Band. Weinheim, Basel: Beltz, ISBN 3-407-51102-7, S. 473
  23. Anastasi, Anne (1976): Differentielle Psychologie: Unterschiede im Verhalten von Individuen und Gruppen 2. Band. Weinheim, Basel: Beltz, ISBN 3-407-51102-7, S. 554
  24. Janke, Havighurst (1945): Relations between ability and social status in a midwestern community. In Dunlap (Hrsg.): The Journal of Educational Psychology, Volume XXXVI, S. 499
  25. Janke, Havighurst (1945): Relations between ability and social status in a midwestern community. In Dunlap (Hrsg.): The Journal of Educational Psychology, Volume XXXVI, S. 509
  26. 26,0 26,1 Janke, Havighurst (1945): Relations between ability and social status in a midwestern community. In Dunlap (Hrsg.): The Journal of Educational Psychology, Volume XXXVI, S. 503 und 504
  27. Janke, Havighurst (1945): Relations between ability and social status in a midwestern community. In Dunlap (Hrsg.): The Journal of Educational Psychology, Volume XXXVI, S. 503 und 507
  28. Verbesserung der IQ-Test Resultate durch Training des Arbeitsgedächtnisses
  29. Abstract der Publikation in PNAS
  30. G.W.F.Hegel, Logik II, Kraft und Äußerung, S.172–179
  31. Titze, Ingeborg und Tewes, Uwe: Messung der Intelligenz bei Kindern mit dem HAWIK-R. Bern, Göttingen, Toronto, Seattle 1984/1994, S. 13–21
  32. Huisken, Freerk: Die Wissenschaft von der Erziehung. Einführung in die Grundlügen der Pädagogik.Hamburg 1991, S. 107–120
  33. Heid, Helmut/ Fink, Gabi: Begabung. In: Benner, Dietrich/ Oelkers, Jürgen (Hrsg.): Historisches Wörterbuch der Pädagogik. Weinheim und Basel 2004, S. 146–152

News mit dem Thema Intelligenztest

Die News der letzten Tage