Methodik
Wie aus einem Wert
eine Messung wird.
Jede Zahl auf einer LabTest-IQ-Ergebnisseite stammt aus einer veröffentlichten Formel. Diese Seite ist der Beleg: die Mathematik hinter dem Test, mit ausformulierten Konstanten und Approximationen.
Das Instrument
Dreißig handgeschriebene Aufgaben, gleichmäßig auf vier Reasoning-Domänen verteilt: Mustererkennung, numerisches Denken, verbale Analogie und räumliche Transformation. Jede Aufgabe wird auf Klarheit, eindeutige Richtigkeit und das Fehlen kultureller oder sprachlicher Verzerrer geprüft. Räumliche und Musteraufgaben sind sprachneutral; verbale Aufgaben bleiben auf Englisch, um die Kalibrierung zu erhalten.
Schwierigkeitskalibrierung
Aufgaben werden bei der Erstellung einer von drei Schwierigkeitsstufen (1, 2, 3) zugeordnet und anhand beobachteter Genauigkeitsverteilungen überarbeitet. Aufgaben der Stufe 3 werden von weniger als 35 % korrekt beantwortet; Stufe-1-Aufgaben von über 75 %. Die Schwierigkeit bestimmt das Gewicht einer richtigen Antwort im Rohwert.
Rohwert → IQ
Der Rohwert wird über eine stückweise-lineare Funktion, verankert am theoretischen Maximum des Itempools, auf die standardisierte IQ-Skala abgebildet. Das Mapping ist in lib/scoring.ts veröffentlicht. Wir nutzen eine stückweise-lineare Kurve statt eines Polynom-Fits, damit die lokale Steigung der Schwierigkeitszusammensetzung zwischen zwei Ankerpunkten entspricht — das hält die Umrechnung lesbar und robust gegenüber kleinen Bankänderungen.
Die standardisierte Skala
IQ-Werte werden auf der Wechsler-Skala gemeldet: Mittelwert 100, Standardabweichung 15. Dieselbe Skala wird in der klinischen Psychologie seit Wechsler (1939) verwendet. Damit wird ein LabTest-IQ-Wert direkt mit Ergebnissen validierter Instrumente vergleichbar — eine klinische Bewertung erfordert weiterhin Fachpersonal.
Perzentil
Dein Perzentil ist die kumulative Verteilungsfunktion der Standardnormalverteilung an deinem z-Wert: Perzentil = Φ((IQ − 100) / 15) × 100. Ein IQ von 115 (z = 1) entspricht dem 84,13. Perzentil; ein IQ von 130 (z = 2) dem 97,72. Wir berechnen Φ mit der Abramowitz-&-Stegun-(1965)-erf-Approximation 7.1.26, genau auf 1,5 × 10⁻⁷.
Bänder
Bänder sind konventionelle Bereiche aus der klinischen Berichterstattung: Durchschnittlich (85–115), Überdurchschnittlich (115–130), Hoch (130–140), Sehr Hoch (140–150), Außergewöhnlich (≥ 150). Sie fassen zusammen; sie diagnostizieren nicht.
Domänen-Normen
Subscores je Kategorie entstehen durch z-Standardisierung der Domain-Genauigkeit gegenüber der aktiven Kohorte: domain_iq = 100 + 15 × ((acc − cohort_mean) / cohort_sd). Kohortenstatistiken erscheinen erst, wenn mindestens 30 Attempts zur Domäne beitragen.
Beispielrechnung
Ein Nutzer beantwortet 22 von 30 Aufgaben über gemischte Schwierigkeiten korrekt, Rohwert 54 von 75. Das stückweise-lineare Mapping ergibt IQ = 120. z = (120 − 100) / 15 = 1,333. Φ(1,333) = 0,9088, also Perzentil = 90,88. Band: Überdurchschnittlich. Liegt sein domain-normierter Pattern-z bei 1,8, beträgt der Pattern-Sub-IQ 127 (96. Perzentil innerhalb der Domäne).
Was dies nicht ist
LabTest IQ ist ein Screening-Instrument, keine klinische Bewertung. Diagnostische Intelligenzdiagnostik erfordert eine individuelle Durchführung durch eine lizenzierte Psychologin oder einen lizenzierten Psychologen mit validierten Instrumenten wie dem WAIS-IV.
Methodik-FAQ
Ist das klinisch valide?+
LabTest IQ ist auf dieselbe Skala (μ=100, σ=15) kalibriert wie klinische Instrumente, ist aber selbst nicht klinisch validiert. Behandle das Ergebnis als sorgfältige Schätzung, nicht als Diagnose.
Warum genau μ=100 und σ=15?+
Konvention nach Wechsler (1939). Diese Skala macht den Wert mit der gesamten klinischen Literatur interoperabel — jeder, der deine Zahl mit einem WAIS-IV-Ergebnis vergleicht, liest dieselben Einheiten.
Warum eine stückweise-lineare Kurve statt eines Polynom-Fits?+
Stückweise-linear hält die lokale Steigung an die lokale Schwierigkeit gebunden. Ein Polynom würde über den Pool hinweg verwischen und kleine Bankänderungen still verändern. Stückweise ist prüfbar; Polynom nicht.
Warum die erf-Approximation und keine Lookup-Tabelle?+
Abramowitz & Stegun 7.1.26 ist geschlossener Form, läuft in Mikrosekunden und ist auf 1,5 × 10⁻⁷ genau. Eine Tabelle ist nicht schneller und fügt ein Binärasset hinzu.
Kann ich den Test wiederholen?+
Ja. Wiederholte Exposition gegenüber demselben Itempool führt typischerweise zu höheren Werten bei späteren Versuchen. Wir verfolgen Formvarianten (A, B), um Überlappungen zu reduzieren.