Persönlichkeitsfragebögen faktenbasiert auswählen

Viele Personalmanager, Coaches und Berater nutzen Persönlichkeitsfragebogen. Glaubt man den Anbietern, so haben sich die Verfahren tausendfach bewährt – aber Werbeversprechen können keine Entscheidungsgrundlage sein. Ein Plädoyer für mehr Qualitätsbewusstsein.

Zirkustrick: vage Aussagen werden als einzigartige Beschreibung akzeptiert

Persönlichkeitsfragebogen sind verlockend. Nur ein paar Fragen beantworten lassen, auswerten und schon weiß ich, ob ein Bewerber oder Mitarbeiter passt. Und wenn der Fragebogen, der häufig auch als Persönlichkeitstest oder Potenzialanalyse bezeichnet wird, dann – laut Angaben des Anbieters – auch noch auf der neuesten Hirnforschung basiert und von namhaften Unternehmen weltweit eingesetzt wird, kann eigentlich nichts schief gehen. Sicherheitshalber macht man noch mal den Selbstversuch und das Ergebnis überzeugt. Selten hat man sich so gut getroffen gefühlt.

Doch genau hier liegt eines der größten Probleme bei der Beurteilung von Persönlichkeitsfragebogen. Denn bei der Gestaltung der Ergebnisberichte machen sich die Anbieter die Tatsache zunutze, dass es Aussagen gibt, die mehr oder minder auf alle Menschen zutreffen („Sie haben ein hohes Bedürfnis nach Anerkennung“) und Menschen generell häufig positive Illusionen über ihre Persönlichkeit haben („Sie sind ein unabhängiger Kopf, der die Aussagen von anderen nicht einfach ungeprüft übernimmt“). 

Verwendet man solche vagen, universellen und tendenziell positiven Aussagen, werden diese von den begutachteten Personen als eine Beschreibung ihrer individuellen, einzigartigen Persönlichkeit interpretiert und akzeptiert – auch wenn alle dasselbe Ergebnis bekommen. Das ist der wissenschaftlich gut untersuchte „Barnum-Effekt“, benannt nach dem berühmten amerikanischen Zirkusdirektor Phineas Taylor Barnum. 

Der „Qualitätsnachweis“ eines Verfahrens über das „subjektive Evidenzgefühl“ gelingt also immer, wenn man sich dieses Zirkustricks bedient. Mehr noch: Ernsthafte Verfahren, die auf solche universelle Aussagen verzichten, haben oft sogar einen grundsätzlichen Akzeptanznachteil, weil das Ergebnis konkreter ist und vielleicht sogar den eigenen Annahmen widerspricht.

Ein Persönlichkeitsfragebogen sollte belastbare Aussagen liefern

Verkaufsargument Nummer 1 vieler Fragebogen ist ihr enormer Erfolg. Da werden beeindruckende Firmennamen aufgelistet, einzelne begeisterte Anwender namentlich und wörtlich zitiert. Fragt man nach Qualitätsnachweisen, wird einfach behauptet, diese lägen selbstverständlich vor und fielen sehr überzeugend aus (wobei deutlich signalisiert wird, dass sich nur Kleingeister mit solchen Daten aufhalten). Oder es heißt: Die üblichen Qualitätsnachweise würden nur für herkömmliche Tests gelten und dürften nicht auf diese Fragebogen angewendet werden, weil das Verfahren ja nicht als Test eingesetzt würde, sondern nur zur Reflexion im Training oder Coaching diene. 

Diese Argumentation entbehrt jeglicher sachlichen Grundlage. Qualitätskriterien gelten ausnahmslos für jeden Persönlichkeitsfragebogen. Aussagen, die nicht zutreffend sind, nützen auch nicht zur Selbstreflexion und erst recht nicht fürs Training oder Coaching. Entweder liefert ein Persönlichkeitsfragebogen belastbare Aussagen oder nicht. Erbringt die Auswertung keine zutreffenden Aussagen, ist der Fragebogen sein Geld nicht wert und sollte selbst dann nicht eingesetzt werden, wenn er kostenlos wäre, da eine unzutreffende „Diagnose“ Schaden verursachen kann.

Hilfestellung bei der Qualitätsbeurteilung von Fragebogen

Gern wird auch auf die Lizensierung für das Verfahren als Qualitätsbeweis verwiesen: Anwender müssen eine – vom Verfahrensanbieter organisierte und in der Regel teure – Schulung durchlaufen und erhalten dann eine Lizenz, den Fragebogen anwenden zu dürfen. So strömt nicht nur Geld in die Kasse der Anbieter, die Anwender werden auch schnell zu einer eingeschworenen, homogenen Gruppe, die sich immun gegenüber Kritik zeigt. Schließlich attestiert die Lizenz dem Lizenznehmer auch eine besondere Menschenkenntnis und wertet ihn damit auf – ganz abgesehen davon, dass niemand, der viel Geld für seine Lizenz bezahlt hat, sich kritisch über das Verfahren äußern wird. 

Wer sich bei der Wahl eines Persönlichkeitsfragebogens also auf das Urteil der anderen (hohe Kundenzufriedenheit) oder auf sein subjektives Evidenzgefühl verlässt, kann schnell auf die Nase fallen, auch wenn das sehr verlockend ist. Denn leider ist die Prüfung von belastbaren Informationen zeitaufwändig und erfordert Expertise. 

Doch inzwischen gibt es Hilfestellung bei der Qualitätsbeurteilung von Tests und Fragebogen. So hat die Experten-Kommission, die die DIN 33430 – eine DIN-Norm für die interne und externe Personalauswahl – entwickelt hat, Mindestanforderungen für die Information über Tests und Fragebogen veröffentlicht. Aufbauend darauf hat das Diagnostik- und Testkuratorium (DTK) Beurteilungsrichtlinien für Tests und Fragebogen formuliert und festgelegt, welche Sachinformationen zu Persönlichkeitsfragebögen (sowie zu Tests) vorliegen müssen, damit sie überhaupt beurteilt werden können.

Qualitätsbeurteilung Schritt 1: Sachinformationen über den Fragebogen

Notwendig sind aussagekräftige Sachinformationen zur Konstruktion, Beschaffenheit und Bewährung des Tests oder Fragebogens:

  • Wie zuverlässig misst der Fragebogen?
  • Wie genau lassen sich relevante Ereignisse (z.B. Berufserfolg, berufliche Zufriedenheit) vorhersagen?
  • Wer ist die Referenzgruppe (Qualifikation, Alter und Geschlecht der Teilnehmer, Datum der Erhebung usw.), an der die Ergebnisse normiert wurden?

Die Basis für die Entwicklung und Pflege eines guten Persönlichkeitsfragebogens sind die in empirischen Studien gewonnenen Kennwerte. 

Der Autor hat die von der DIN-33430-Kommission festgelegten Sachinformationen in einer Checklistezusammengefasst, die offiziell als „Standard des Testkuratoriums der Föderation Deutscher Psychologenvereinigungen“ gilt (siehe Tabelle 1, die vollständige Checkliste steht hier zur Verfügung).
 

 

ja

nein

nicht zu bewerten

Anmerkungen

Quelle (Seite)

Die theoretischen Grundlagen des Verfahrens sind beschrieben.

         

In den Verfahrenshinweisen werden die Ergebnisse einer oder mehrerer empirischen/empirischer Untersuchung(en) berichtet.

         

Die herangezogenen Normwerte entsprechen der Referenzgruppe der Zielgruppe.

         

Die Angemessenheit der Normwerte wurde in den letzten acht Jahren überprüft.

         

Die Zuverlässigkeit wurde über die Retest-Methode bestimmt, oder die Retest-Reliabilität wurde durch einen geeigneten Untersuchungsplan geschätzt.

         

Aus den Verfahrenshinweisen wird deutlich, welche empirischen Nachweise der Inhalts- und/oder Kriteriums- und/oder Konstruktgültigkeit eine Anwendung des Verfahrens für den intendierten Anwendungszweck rechtfertigen.

         

Tabelle 1: Auszug aus der Checkliste zu Informationen, die zu einem Test oder Fragebogen vorliegen müssen

Oftmals liegen die für die Beurteilung eines Persönlichkeitsfragebogens notwendigen Informationen jedoch gar nicht vor. Manchmal verweigert der Anbieter auch den Zugang zu diesen Informationen, indem er zum Beispiel auf ein vermeintliches Betriebsgeheimnis verweist oder die Informationen nur den Teilnehmern kostenpflichtiger Seminare zugänglich macht. Notwendig ist jedoch ein freier und kostenloser Zugang zu den Informationen. Verweigert ein Anbieter die für die Qualitätsbeurteilung notwendigen Informationen, so ist dies ein überzeugendes Indiz für die mangelhafte Seriosität des Anbieters.

Qualitätsbeurteilung Schritt 2: Beurteilung der Sachinformationen über den Fragebogen

Liegen die Informationen vor, stellt sich die Frage, wie diese zu bewerten sind. Dafür wurde das Testbeurteilungssystem des Testkuratoriums (TBS-TK) konstruiert, das hier abrufbar ist. Relevante Aspekte der Qualitätsbeurteilung sind dabei:

  • die theoretischen Grundlagen der Verfahrenskonstruktion
  • die Objektivität
  • Normierung oder Eichung (und deren Zielgruppenorientierung)
  • die Reliabilität (Messgenauigkeit)
  • die Validität
  • sowie weitere Gütekriterien (wie Störanfälligkeit, Unverfälschbarkeit und Fairness).

Qualitätsbeurteilung ausgewählter Persönlichkeitsfragebogen

Das Diagnostik- und Testkuratorium (DTK) hat zahlreiche Experten gebeten, einige ausgewählte Tests und Fragebogen nach dem beschriebenen System zu beurteilen. Dabei wird grundsätzlich jedes Verfahren von zwei Experten beurteilt, die zunächst in Unkenntnis und unabhängig voneinander ihre Beurteilungen ausarbeiten und erst zusammenarbeiten, nachdem sie ihre unabhängigen Bewertungen abgegeben haben. 

Die von den beiden Experten gemeinsam erstellte Rezension wird vom DTK in anonymisierter Form an die Autoren des Verfahrens/Verfahrensanbieter geschickt. Diese erhalten Gelegenheit zu der Rezension Stellung zu beziehen und auf etwaige Fehler aufmerksam zu machen, so dass diese Fehler eliminiert werden können. Anschließend werden die Rezensionen publiziert. 

Alle nach dem neuen System erarbeiteten Beurteilungen können hier eingesehen werden. Neben einer Beschreibung und Kritik des Verfahrens vergeben die unabhängigen Experten für vier Qualitätskriterien auf einer vierstufigen Skala Noten für das Verfahren. Tabelle 2 zeigt beispielhaft die Ergebnisse für einige bislang rezensierten Persönlichkeitsfragebogen.
 

Testname Allg. 
Informationen
Objek-
tivität
Zuver-
lässigkeit
Validität
OPQ32 ++ ++ + +
BIP – 6F ++ ++ + +
FPI-R ++ ++ + +
NEO-PI-R ++ + + +
VVKI + - + -
Persolog - - + - -
GPOP* - - - - -

Tabelle 2: Qualitätsbeurteilungen nach dem TBS-TK System für ausgewählte Persönlichkeitsfragebogen

Skala: Das Verfahren erfüllt die Anforderungen: (++) voll, (+) weitgehend, (-) teilweise und (--) nicht. 

OPQ32 – Occupational Personality Questionnaire, BIP – 6F -Bochumer Inventar zur berufsbezogenen Persönlichkeitsbeschreibung – Sechs Faktoren, FPI-R – Freiburger Persönlichkeitsinventar, NEO-PI-R – Revised NEO Personality Inventory, VVKI – Verkaufs- und Vertriebs-Kompetenz-Inventar, Persolog – Persönlichkeits-Profil und GPOP – Golden Profiler of Personality.

* Nach der Publikation der Rezension zum GPOP erschien die zweite, überarbeitete und neu normierte Auflage.

Fazit: Fakten aus empirischen Studien sind notwendig

Informationen zu diesem Verfahren und muss diese bewerten. Dabei sollten allerdings nicht Informationen über die Marktdurchdringung und über glückliche Kunden sowie das subjektive Evidenzgefühl die Beurteilung bestimmen. Es geht um Zahlen, Daten und Fakten aus empirischen Studien, in denen sich das Verfahren bewährt hat.

Dabei verdeutlichen die nüchternen Zahlen aber auch, dass Persönlichkeitsfragebogen zwar wertvolle Instrumente der Personalarbeit sind, aber keinesfalls ein Allheilmittel. Sie müssen in ein Gesamtsystem von Beurteilungsinstrumenten integriert werden. Die Fakten verderben also – etwas salopp formuliert – den Spaß. 

Es ist viel einfacher, naiv den Quasitheorien der Anbieter zu vertrauen und als lizenzierter Experte Aussagen zu treffen, die aufgrund des Barnum-Effekts alle beeindrucken. Auch in Bezug auf Persönlichkeitsfragebogen gilt frei nach Bertrand Russell, dass die Dummen selbstsicher und die Gescheiten voller Zweifel sind.

Literatur

Dr. Martin Kersting, Professor für Psychologische Diagnostik an der Justus-Liebig-Universität Gießen. 
www.kersting-internet.de

Martin Kersting (2008). DIN Screen V2 Checkliste 1: Anforderungen an Verfahrenshinweise. Normative Aussagen (PDF). In Martin Kersting, Qualität in der Diagnostik und Personalauswahl – der DIN-Ansatz (S. 144-179). Göttingen: Hogrefe.

Leibniz-Zentrum für Psychologische Information und Dokumentation (ZPID). (Hrsg.). (2014). Testbeurteilungssystem des Diagnostik- und Testkuratoriums. Trier: Herausgeber.