Is this clinically valid?

LabTest IQ is calibrated against the same scale (μ=100, σ=15) used in clinical instruments, but it is not itself a clinically validated instrument. Treat the result as a careful screening estimate, not a diagnosis.

Why μ=100 and σ=15 specifically?

Convention from Wechsler (1939). Reporting on this scale makes the score interoperable with the entire clinical literature.

Why a piecewise-linear curve and not a polynomial fit?

Piecewise-linear keeps local slope tied to local item difficulty. A polynomial would smear across the bank and make small bank changes silently shift the whole curve.

Why the erf approximation and not a lookup table?

The Abramowitz & Stegun 7.1.26 approximation is closed-form, runs in microseconds, and is accurate to 1.5 × 10⁻⁷. A lookup table is no faster and adds a binary asset to ship.

Can I retake the test?

Yes. Note that repeated exposure to the same item bank typically inflates scores on later attempts. We track form variants (A, B) to reduce overlap.

Methodik

Wie aus einem Wert
eine Messung wird.

Jede Zahl auf einer LabTest-IQ-Ergebnisseite stammt aus einer veröffentlichten Formel. Diese Seite ist der Beleg: die Mathematik hinter dem Test, mit ausformulierten Konstanten und Approximationen.

Das Instrument

Dreißig handgeschriebene Aufgaben, gleichmäßig auf vier Reasoning-Domänen verteilt: Mustererkennung, numerisches Denken, verbale Analogie und räumliche Transformation. Jede Aufgabe wird auf Klarheit, eindeutige Richtigkeit und das Fehlen kultureller oder sprachlicher Verzerrer geprüft. Räumliche und Musteraufgaben sind sprachneutral; verbale Aufgaben bleiben auf Englisch, um die Kalibrierung zu erhalten.

Schwierigkeitskalibrierung

Aufgaben werden bei der Erstellung einer von drei Schwierigkeitsstufen (1, 2, 3) zugeordnet und anhand beobachteter Genauigkeitsverteilungen überarbeitet. Aufgaben der Stufe 3 werden von weniger als 35 % korrekt beantwortet; Stufe-1-Aufgaben von über 75 %. Die Schwierigkeit bestimmt das Gewicht einer richtigen Antwort im Rohwert.

Rohwert → IQ

Der Rohwert wird über eine stückweise-lineare Funktion, verankert am theoretischen Maximum des Itempools, auf die standardisierte IQ-Skala abgebildet. Das Mapping ist in lib/scoring.ts veröffentlicht. Wir nutzen eine stückweise-lineare Kurve statt eines Polynom-Fits, damit die lokale Steigung der Schwierigkeitszusammensetzung zwischen zwei Ankerpunkten entspricht — das hält die Umrechnung lesbar und robust gegenüber kleinen Bankänderungen.

Die standardisierte Skala

IQ-Werte werden auf der Wechsler-Skala gemeldet: Mittelwert 100, Standardabweichung 15. Dieselbe Skala wird in der klinischen Psychologie seit Wechsler (1939) verwendet. Damit wird ein LabTest-IQ-Wert direkt mit Ergebnissen validierter Instrumente vergleichbar — eine klinische Bewertung erfordert weiterhin Fachpersonal.

Perzentil

Dein Perzentil ist die kumulative Verteilungsfunktion der Standardnormalverteilung an deinem z-Wert: Perzentil = Φ((IQ − 100) / 15) × 100. Ein IQ von 115 (z = 1) entspricht dem 84,13. Perzentil; ein IQ von 130 (z = 2) dem 97,72. Wir berechnen Φ mit der Abramowitz-&-Stegun-(1965)-erf-Approximation 7.1.26, genau auf 1,5 × 10⁻⁷.

Bänder

Bänder sind konventionelle Bereiche aus der klinischen Berichterstattung: Durchschnittlich (85–115), Überdurchschnittlich (115–130), Hoch (130–140), Sehr Hoch (140–150), Außergewöhnlich (≥ 150). Sie fassen zusammen; sie diagnostizieren nicht.

Domänen-Normen

Subscores je Kategorie entstehen durch z-Standardisierung der Domain-Genauigkeit gegenüber der aktiven Kohorte: domain_iq = 100 + 15 × ((acc − cohort_mean) / cohort_sd). Kohortenstatistiken erscheinen erst, wenn mindestens 30 Attempts zur Domäne beitragen.

Beispielrechnung

Ein Nutzer beantwortet 22 von 30 Aufgaben über gemischte Schwierigkeiten korrekt, Rohwert 54 von 75. Das stückweise-lineare Mapping ergibt IQ = 120. z = (120 − 100) / 15 = 1,333. Φ(1,333) = 0,9088, also Perzentil = 90,88. Band: Überdurchschnittlich. Liegt sein domain-normierter Pattern-z bei 1,8, beträgt der Pattern-Sub-IQ 127 (96. Perzentil innerhalb der Domäne).

Was dies nicht ist

LabTest IQ ist ein Screening-Instrument, keine klinische Bewertung. Diagnostische Intelligenzdiagnostik erfordert eine individuelle Durchführung durch eine lizenzierte Psychologin oder einen lizenzierten Psychologen mit validierten Instrumenten wie dem WAIS-IV.

Methodik-FAQ

Ist das klinisch valide?+

LabTest IQ ist auf dieselbe Skala (μ=100, σ=15) kalibriert wie klinische Instrumente, ist aber selbst nicht klinisch validiert. Behandle das Ergebnis als sorgfältige Schätzung, nicht als Diagnose.

Warum genau μ=100 und σ=15?+

Konvention nach Wechsler (1939). Diese Skala macht den Wert mit der gesamten klinischen Literatur interoperabel — jeder, der deine Zahl mit einem WAIS-IV-Ergebnis vergleicht, liest dieselben Einheiten.

Warum eine stückweise-lineare Kurve statt eines Polynom-Fits?+

Stückweise-linear hält die lokale Steigung an die lokale Schwierigkeit gebunden. Ein Polynom würde über den Pool hinweg verwischen und kleine Bankänderungen still verändern. Stückweise ist prüfbar; Polynom nicht.

Warum die erf-Approximation und keine Lookup-Tabelle?+

Abramowitz & Stegun 7.1.26 ist geschlossener Form, läuft in Mikrosekunden und ist auf 1,5 × 10⁻⁷ genau. Eine Tabelle ist nicht schneller und fügt ein Binärasset hinzu.

Kann ich den Test wiederholen?+

Ja. Wiederholte Exposition gegenüber demselben Itempool führt typischerweise zu höheren Werten bei späteren Versuchen. Wir verfolgen Formvarianten (A, B), um Überlappungen zu reduzieren.

Bewertung starten Trainingsübungen →

Wie aus einem Werteine Messung wird.