„Habe nun ach! Philosophie, Juristerei und Medizin, und leider auch Theologie! durchaus studiert mit heißem Bemühn. Da steh ich nun, ich armer Tor! und bin so klug als wie zuvor; heiße Magister, heiße Doktor gar, und ziehe schon an die zehen Jahr herauf, herab und quer und krumm meine Schüler an der Nase herum – und sehe, dass wir nichts wissen können!

Das will mir schier das Herz verbrennen!“ 

- Faust I, S. 354–365

Stephen Jay Gould: Der falsch vermessene Mensch

Stephen Jay Gould hat in seinem Buch die Geschichte der Intelligenzmessung der letzten knapp 200 Jahre beginnend mit der Kraniometrie (Schädelmessung) bis zu den heutigen IQ-Tests kritisch analysiert. Das hieß für ihn, sowohl alle Daten nachzurechnen, als auch die an ihnen getroffenen Schlüsse zu überprüfen.

Am Beginn der Suche nach den Ursachen von Intelligenzunterschieden stand die Kraniometrie. Dass Frauen, Arme und Schwarze dümmer sind, war die Anfang des 19. Jahrhunderts vorherrschende Meinung. Folgerichtig sollte die damals beliebte Kraniologie dieses Urteil bestätigen. Morton, ein bekannter Wissenschaftler seiner Zeit, füllte Senfkörner in Schädel, drückte diese kurz an und verglich das Volumen der Senfkörner später in einem Messglas, die Ergebnisse entsprachen seinen Erwartungen: Die Schädel von Männern, Reichen und Weißen waren größer. Später wurden von ihm Bleikügelchen anstelle der Senfkörner verwendet, die zuvor gemessenen Unterschiede verringerten sich. Selbst Morton fiel der Unterschied zwischen der Senfkörner- und der Bleikugelmethode auf, am prinzipiellen Unterschied zwischen den verschiedenen Gruppen zweifelte er jedoch nicht.

Gould hat plausible Erklärungen: Weil Morton selbst (unbewusst) diese Unterschiede erwartete, hat er (unbewusst) die Senfkörner in den Schädeln von Frauen und Schwarzen stärker angedrückt. Blei kann man nicht komprimieren, die Unterschiede verringerten sich auf das tatsächliche Maß. Und diese verbliebenen Unterschiede erklären sich leicht aufgrund der geringeren Körpergröße von Frauen, Armen und (ärmeren) Schwarzen. Die durchschnittliche Gehirngröße ist proportional zur Größe des Körpers. Gold stellt fest:

Bewusste Täuschung ist in der Wissenschaft vermutlich selten. Sie ist auch nicht besonders interessant, denn sie sagt wenig über den Charakter der wissenschaftlichen Tätigkeit aus. Lüger werden exkommuniziert, wenn man ihnen auf die Schliche kommt; die Wissenschaftler erklären, ihre Zuft habe sich selbst gereinigt und wenden sich wieder ihrer Arbeit zu, die Mythologie bleibt ungeschoren und ist objektiv wieder gerechtfertigt. Die Allgegenwart unabsichtlichen Schummelns legt den allgemeinen Schluss nahe, dass die Wissenschaft in einem gesellschaftlichen Kontext steht. Denn wenn Wissenschaftler ehrlichen Herzens auf solche Selbsttäuschungen hereinfallen, dann sind vorgefasste Meinungen überall zu finden, selbst im elementaren Knochenmessen und Addieren.

Da die Kraniometrie die an sie gestellten Erwartungen, die intellektuellen Unterschiede zu erklären, nicht erfüllte, kamen andere Verfahren in Mode: Untersuchungen der Schädelform (einer der Hauptvertreter war Broca), der Lage des Hinterhauptlochs, die Rekapitulationstheorie. Letztere postuliert, dass die Ontogenese eine verkürzte Phylogenese ist, also dass die Individuen bei ihrer Entwicklung Stadien derjenigen Arten durchlaufen, aus denen sich ihre eigene Art evolutionär entwickelt hat. Also verglich man das Aussehen von Affen, Schwarzen und Weißen – und fand „natürlich“ heraus, dass die Schwarzen eine Zwischenform zwischen den Affen und den Weißen darstellen.

Später wurde die Neotonie modern. Diese stellt in gewissem Sinn das Gegenteil der Rek.theorie dar. Hauptidee ist, dass evolutionär später entstandene Arten im Jugendstadium ihrer Vorfahren stehenbleiben. Menschen (vor allem aber Weiße) sind danach quasi jugendlich bleibende Affen, die sich deshalb die für die Jugend typische Wissbegier ihr ganzes Leben lang erhalten. Nach dieser Theorie entwickeln sich Schwarze schneller und kommen näher an das Affenstadium heran. Diese Deutung hatte allerdings den kleinen Schönheitsfehler, dass Frauen generell kindlicher als Männer wirken, also evolutionär fortgeschrittener sein müssen. Nicht leicht hinzunehmen für die Wissenschaft gegen Ende des 19. Jahrhunderts.

Zu Beginn des 20. Jahrhunderts entwickelte Binet Tests, die zur Untersuchung der Schulfähigkeit offensichtlich zurückgebliebener Kinder Tests dienen sollten. Über Binet selbst schreibt Gould:

… lehnte es Binet ab, die Bedeutung der jedem Kind zugeschriebenen Zahl zu definieren und Mutmaßungen darüber anzustellen. Die Intelligenz, verkündete Binet, sei zu komplex, als dass man sie mit einer einzigen Zahl erfassen könne. Diese Zahl, später als Intelligenzquotient bezeichnet, sei nur eine grobe empirische Anleitung, für einen begrenzten praktischen Zweck konstruiert.

Die Skala gestattet es eigentlich nicht, die Intelligenz zu messen, weil intellektuelle Eigenschaften nicht übereinandergelegt werden können und daher nicht wie ebene Flächen messbar sind.

Wenn man sich an Binets Grundsätze gehalten hätte und seine Tests durchgängig so benutzt worden wären, wie er sich das gedacht hatte, wäre uns in unserem Jahrhundert ein großer Fall von Missbrauch der Wissenschaft erspart geblieben.

Der verbleibende und größte Teil des Buchs ist dann der historischen Entwicklung der Intelligenztests bis in die heutige Zeit gewidmet und Goulds Analyse der verschiedenen Modifikationen und Interpretationen dieser Tests. Im Ersten Weltkrieg fanden in den USA die ersten Massentests statt, Fast 2 Millionen Soldaten wurden getestet. Einwanderer und Schwarze schnitten signifikant schlechter ab. Wie schon zuvor und auch heute noch wurden die gemessenen Unterschiede auf angeborene und rassische Unterschiede zurückgeführt. Gould beschreibt viele Details der damaligen Tests und die Umstände unter denen die Tests durchgeführt wurden. Es wird deutlich, dass die Tests gar keine anderen Ergebnisse erbringen konnten, auf gar keinen Fall kulturunabhängig waren. Eine der Schlüsselaussagen des Buchs, die an Beispielen mehrfach gezeigt wird:

Die politische Hauptwirkung von Erblichkeitstheorien ergibt sich nicht aus der Annahme der Vererblichkeit von Testergebnissen, sondern aus einer logisch unzulässigen Verlängerung. Untersuchungen über die Erblichkeit des IQ mit traditionellen Methoden wie dem Vergleich der Punktzahlen von Verwandten oder der Gegenüberstellung der Zahlen adoptierter Kinder mit denen ihrer natürlichen Eltern und ihrer Adopziveltern beziehen sich alle auf den Erblichkeitstyp innerhalb einer Gruppe – das heißt sie gestatten eine Einschätzung der Erblichkeit innerhalb einer einzelnen, kohärenten Population (zum Beispiel der weißen Amerikaner). Der übliche Trugschluss besteht in der Annahme, dass die Erblichkeit, wenn sie einen bestimmten Prozentsatz der Schwankungsbreite bei Individuen einer Gruppe erklärt, auch einen ähnlichen Prozentsatz des Unterschieds des durchschnittlichen IQ zwischen verschiedenen Gruppen erklären muss – also zum Beispiel zwischen Schwarzen und Weißen.

Zur Veranschaulichung genügt ein hypothetisches und unangefochtenes Beispiel. Die Erblichkeit der Körpergröße ist höher als bei jedem anderen Wert, der je für die IQ ermittelt wurde. Man nehme zwei getrennte Gruppe von Männern. Die erste mit einer Durchschnittsstatur von 175 cm lebe in einer wohlhabenden amerikanischen Kleinstadt. Die zweite mit einer Durchschnittsstatur von 165 cm hungert in einem Dorf der Dritten Welt. An jedem dieser beiden Orte beträgt die Erblichkeit ungefähr 95 Prozent – was lediglich bedeutet, dass relativ große Väter eher große Söhne und relativ kleine Väter eher kleinwüchsige Söhne haben. Diese hohe Erblichkeit innerhalb der Gruppen spricht weder für noch gegen die Möglichkeit, dass die durchschnittliche Körpergröße der Dörfler aus der Dritten Welt bei besserer Ernährung in der nächsten Generation über die der wohlhabenden Amerikaner steigen könnte.

Dann analysiert Gould die Idee eines allgemeinen Intelligenzfaktors g. Dazu muss man wissen, dass sich die Tests aus verschiedenen Einzelaufgaben zusammensetzen, die verschiedene Fähigkeiten testen sollen: Verbale, mathematische und visuelle Intelligenz, Merkfähigkeit u.v.a.m. Zwischen allen diesen Teilergebnissen und dem additiven Endwert kann man Korrelationen berechnen. Mit dieser „Faktorenanalyse“ haben sich verschiedene Wissenschaftler beschäftigt, als Erster hat Spearman daraus den bereits erwähnten allgemeinen Intelligenzfaktor extrahiert.

Auch ohne viel von Mathematik zu verstehen, leuchtet ein, dass bei einer additiven Verknüpfung der stets positiven Einzelwerte diese positiv mit dem Endwert korrelieren müssen und es eine insgesamt positive Korrelation zu einem stark mit diesem Endwert korrelierenden Wert geben muss, der die Richtung und Länge der größten Hauptachse im Merkmalsraum angibt. Positive Korrelation heißt in diesem Fall zum Beispiel: Wer hohe Werte in den Teilbereichen hat, wird auch einen hohen Endwert erzielen.

Unmittelbar einleuchtend ist auch, dass nach Abzug dieser größten Korrelation, zueinander unterschiedliche Gebiete prüfende Einzeltests negativ korreliert sein müssen. Also bei jeweils gleichem IQ müssen z.B. Personen mit hoher mathematischer Intelligenz eine kleinere verbale Intelligenz besitzen – sonst hätten sie nicht einen gleich hohen IQ wie Leute mit hoher verbaler, aber niedriger mathematischer Intelligenz. Gould kritisiert die „Verdinglichung“ des allgemeinen Intelligenzfaktors, man kann nicht aus der Berechnung eines Korrelationsfaktors darauf schließen, dass es zu dieser Zahl ein gegenständliches Äquivalent im Gehirn geben muss. (Genau diesen Schluss zieht z.B. Volkmar Weiß in „Die IQ-Falle“.)

Interessant ist, dass es auf der Grundlage derselben Daten (der untersuchten IQ-Tests) eine vollkommen andere Interpretation der Ergebnisse gibt. Man kann nämlich die Einzeltests auch auf Korrelationen untereinander untersuchen, ohne zuvor eine Gesamtkorrelation abzuziehen. Man wird dann Cluster finden, für die es zueinander orthogonale Achsen im Merkmalsraum gibt. Je nach der Anzahl der vorgegebenen Cluster ergeben sich unterschiedliche Ergebnisse. Intuitiv ist zum Beispiel einleuchtend, dass Personen, die ein gutes Sprachverständnis besitzen, in allenTeilaufgaben, die verbale Intelligenz testen, gute Ergebnisse erzielen. D.h. die Korrelation aller Aufgaben dieses Typs wird sehr hoch sein, viel höher zum Beispiel als zu mathematischen Aufgaben. Je nach Ansatz wurden hier zwischen 7 und 200 (sic!) verschiedene Komponenten gefunden. Auch das ist ein starkes Indiz, das dagegen spricht, dass es zu den (beliebig gruppierbaren) Testergebnissen physische (und genetische) Entsprechungen im Gehirn geben muss.

Gegen Ende des Buchs dann eine sehr schöne Argumentation, warum Gould mehr Wert auf eine milieuabhängige „Vererbung“ der Intelligenz legt als auf eine genetische und den biologischen Determinismus der Vererbungstheoretiker sowohl für falsch als auch für schädlich hält:

Die Kulturentwicklung kann so rasch fortschreiten, weil sie im Gegensatz zur biologischen Evolution im „Lamarckschen“ Sinne funktioniert – durch das „Vererben“ erworbener Eigenschaften. Was eine Generation gelernt hat, kann sie durch Schrift, Anweisung, Prägung, Ritual, Tradition und eine Fülle anderer Methoden weitergeben, die die Menschen zur Gewährleistung der Kontinuität der Kultur entwickelt haben. Die Darwinsche Evolution dagegen ist ein indirekter Prozess: Die genetische Variation muss zunächst verfügbar sein, um ein vorteilhaftes Merkmal zu entwickeln, und die natürliche Auslese muss es dann bewahren. Da die genetische Variation nur zufällig zustandekommt und nicht vorzugsweise in Richtung auf vorteilhafte Merkmale geht, verläuft der Darwinsche Prozess nur langsam.

Die klassischen Argumentationen des biologischen Determinismus versagen, weil alle Merkmale, auf die sie sich zur Unterscheidung von Gruppen berufen, gewöhnlich Produkte der Kulturentwicklung sind. Die Deterministen suchen nach Beweisen in anatomischen Merkmalen, die durch die biologische und nicht durch die kulturelle Evolution entstanden sind. … Das Schädelvolumen war für Morton und Broca so wenig interessant wie Längenunterschiede des dritten Zehs; es ging ihnen nur um die geistigen Merkmale, die angeblich an Unterschiede der durchschnittlichen Hirngröße bei verschiedenen Menschengruppen geknüpft sind.

Die Grundaussage des Buchs lässt sich wie folgt verdichten: Man kann die durchschnittliche Intelligenz einer Gruppe, eines Volkes oder der gesamten Menschheit schneller als durch „Eugenik“ steigern, in dem man allen Menschen gute Lebens- und Bildungsmöglichkeiten verschafft. Besonders wichtig ist das in der Kindheit und Jugend, denn auch wenn es eine genetische Obergrenze für die Möglichkeiten des Einzelnen gibt, wird diese für eine große Zahl von ihnen heute durch schlechte Bedingungen nicht annähernd erreicht.

Gastbeitrag von: Dr. Ralf Poschmann

zum vorherigen Blogeintrag                                                                               zum nächsten Blogeintrag 

 

Liste aller Rezensionen

Kommentar schreiben

Kommentare: 0

Impressum | Datenschutz | Cookie-Richtlinie | Sitemap
Diese Website darf gerne zitiert werden, für die Weiterverwendung ganzer Texte bitte ich jedoch um kurze Rücksprache.