Können Facebook-Profile die Persönlichkeit messen?
Diese Frage versucht eine interdisziplinäre Gruppe von Forschern der University of Pennsylvania zu beantworten. Derzeit verwenden Psychologen eine Vielzahl von Methoden, einschließlich selbstberichteter Umfragen und Fragebögen, um die Persönlichkeit zu bewerten.
In einer kürzlich durchgeführten Studie haben 75.000 Personen freiwillig einen gemeinsamen Fragebogen zur Persönlichkeit über eine Facebook-Anwendung ausgefüllt und ihre Facebook-Statusaktualisierungen für Forschungszwecke zur Verfügung gestellt. Die Forscher suchten dann nach allgemeinen Sprachmustern in der Sprache der Freiwilligen.
Die Studie wird in der Zeitschrift veröffentlicht PLUS EINS.
Die Ermittler erstellten Computermodelle, die das Alter, das Geschlecht und die Antworten der Personen auf die von ihnen verwendeten Persönlichkeitsfragebögen vorhersagen konnten.
Diese Vorhersagemodelle waren überraschend genau. Zum Beispiel waren die Forscher in 92 Prozent der Fälle korrekt, wenn sie das Geschlecht der Benutzer nur anhand der Sprache ihrer Statusaktualisierungen vorhersagten.
Der Erfolg dieses „offenen“ Ansatzes schlägt neue Wege vor, um Zusammenhänge zwischen Persönlichkeitsmerkmalen und Verhaltensweisen zu untersuchen und die Wirksamkeit psychologischer Interventionen zu messen.
Die Studie der Forscher stützt sich auf eine lange Geschichte der Untersuchung der Wörter, die Menschen verwenden, um ihre Gefühle und mentalen Zustände zu verstehen, verfolgte jedoch eher einen „offenen“ als einen „geschlossenen“ Ansatz zur Analyse der Daten im Kern.
"In einem" geschlossenen Vokabular "-Ansatz", sagte Postdoktorandin Margaret Kern, Ph.D., "könnten Psychologen eine Liste von Wörtern auswählen, von denen sie glauben, dass sie positive Emotionen signalisieren, wie" zufrieden "," enthusiastisch "oder" wunderbar "und dann Sehen Sie sich die Häufigkeit an, mit der eine Person diese Wörter verwendet, um zu messen, wie glücklich diese Person ist.
Geschlossene Vokabularansätze weisen jedoch mehrere Einschränkungen auf, einschließlich der Tatsache, dass sie nicht immer messen, was sie messen möchten. “
"Zum Beispiel", sagte Ungar, "könnte man feststellen, dass der Energiesektor mehr negative Emotionswörter verwendet, einfach weil sie das Wort" roh "mehr verwenden." Dies weist jedoch auf die Notwendigkeit hin, Mehrwortausdrücke zu verwenden, um die beabsichtigte Bedeutung zu verstehen.
"Rohöl" ist anders als "Rohöl", und ebenso ist "krank" anders als nur "krank". "
Eine weitere inhärente Einschränkung des geschlossenen Vokabularansatzes besteht darin, dass er auf einem vorgefassten, festen Satz von Wörtern beruht. Eine solche Studie könnte möglicherweise bestätigen, dass depressive Menschen zwar häufiger erwartete Wörter (wie „traurig“) verwenden, aber keine neuen Erkenntnisse gewinnen können (dass sie beispielsweise weniger über Sport oder soziale Aktivitäten sprechen als glückliche Menschen).
Frühere psychologische Sprachstudien haben sich notwendigerweise auf geschlossene Vokabularansätze gestützt, da ihre kleinen Stichprobengrößen offene Ansätze unpraktisch machten. Das Aufkommen massiver Sprachdatensätze, die von sozialen Medien bereitgestellt werden, ermöglicht nun qualitativ unterschiedliche Analysen.
„Die meisten Wörter kommen selten vor - jede Schriftprobe, einschließlich Facebook-Statusaktualisierungen, enthält nur einen kleinen Teil des durchschnittlichen Wortschatzes“, berichtet H. Andrew Schwartz, Postdoktorand in Computer- und Informationswissenschaft.
„Dies bedeutet, dass Sie für alle außer den gebräuchlichsten Wörtern Proben von vielen Menschen schreiben müssen, um Verbindungen zu psychologischen Merkmalen herzustellen. Traditionelle Studien haben interessante Zusammenhänge mit ausgewählten Wortkategorien wie „positive Emotionen“ oder „Funktionswörter“ gefunden.
Die Milliarden von Wortinstanzen, die in sozialen Medien verfügbar sind, ermöglichen es uns jedoch, Muster auf einer viel reicheren Ebene zu finden. “
Im Gegensatz dazu leitet der Ansatz des offenen Wortschatzes wichtige Wörter und Sätze aus der Stichprobe selbst ab. Mit mehr als 700 Millionen Wörtern, Phrasen und Themen, die aus der Stichprobe der Facebook-Statusnachrichten dieser Studie herausgearbeitet wurden, gab es genügend Daten, um die Hunderte gängiger Wörter und Phrasen zu überwinden und eine offene Sprache zu finden, die aussagekräftiger mit bestimmten Merkmalen korreliert.
Diese große Datenmenge war entscheidend für die spezifische Technik, die das Team verwendete, die als Differential Language Analysis (DLA) bezeichnet wird.
Die Forscher verwendeten DLA, um die Wörter und Ausdrücke zu isolieren, die sich um die verschiedenen Merkmale gruppierten, die in den Fragebögen der Freiwilligen selbst angegeben wurden: Alter, Geschlecht und Punktzahl für die Persönlichkeitsmerkmale der „Big Five“ - Extraversion, Verträglichkeit, Gewissenhaftigkeit, Neurotizismus und Offenheit.
Das Big Five-Modell wurde gewählt, da es eine gängige und gut untersuchte Methode zur Quantifizierung von Persönlichkeitsmerkmalen ist. Die Methode der Forscher könnte jedoch auf Modelle angewendet werden, die andere Merkmale messen, einschließlich Depression oder Glück.
Um ihre Ergebnisse zu visualisieren, erstellten die Forscher Wortwolken, die die Sprache zusammenfassten, die ein bestimmtes Merkmal statistisch vorhersagte, wobei die Korrelationsstärke eines Wortes in einem bestimmten Cluster durch seine Größe dargestellt wurde. Eine Wortwolke, die die von Extravertierten verwendete Sprache zeigt, enthält beispielsweise Wörter und Ausdrücke wie „Party“, „Great Night“ und „Hit Me Up“, während eine Wortwolke für Introvertierte viele Verweise auf japanische Medien und Emoticons enthält.
„Es mag offensichtlich erscheinen, dass eine super extravertierte Person viel über Partys spricht“, sagte Eichstaedt, „aber zusammengenommen bieten diese Wortwolken ein beispielloses Fenster in die psychologische Welt von Menschen mit einem bestimmten Merkmal. Viele Dinge scheinen nachträglich offensichtlich zu sein und jeder Punkt macht Sinn, aber hätten Sie an alle oder sogar an die meisten gedacht? “
Martin Seligman, Programmdirektor, erklärt: „Wenn ich mich frage, wie es ist, extrovertiert zu sein?“ „Wie ist es, ein junges Mädchen zu sein?“ „Wie ist es, schizophren oder neurotisch zu sein?“ Oder „Wie ist es, zu sein 70 Jahre alt? 'Diese Wortwolken kommen dem Kern der Sache viel näher als alle existierenden Fragebögen.'
Um zu testen, wie genau sie die Merkmale von Menschen durch ihren offenen Wortschatz erfassen, teilten die Forscher die Freiwilligen in zwei Gruppen auf und prüften, ob ein statistisches Modell, das aus einer Gruppe gewonnen wurde, verwendet werden konnte, um auf die Merkmale der anderen zu schließen. Für drei Viertel der Freiwilligen verwendeten die Forscher Techniken des maschinellen Lernens, um ein Modell der Wörter und Phrasen zu erstellen, die die Antworten auf den Fragebogen vorhersagen.
Anschließend verwendeten sie dieses Modell, um anhand ihrer Facebook-Beiträge Alter, Geschlecht und Persönlichkeit für das verbleibende Quartal vorherzusagen.
"Das Modell war zu 92 Prozent genau, um das Geschlecht eines Freiwilligen anhand seines Sprachgebrauchs vorherzusagen", sagte Schwartz. "Und wir konnten das Alter einer Person innerhalb von drei Jahren mehr als die Hälfte der Zeit vorhersagen."
"Unsere Persönlichkeitsprognosen sind von Natur aus weniger genau, aber fast so gut wie die Verwendung der Fragebogenergebnisse einer Person an einem Tag, um ihre Antworten auf denselben Fragebogen an einem anderen Tag vorherzusagen."
Da sich herausstellte, dass der Ansatz des offenen Vokabulars gleich oder prädiktiver ist als geschlossene Ansätze, verwendeten die Forscher die Wortwolken, um neue Einblicke in die Beziehungen zwischen Wörtern und Merkmalen zu generieren. Zum Beispiel verwendeten Teilnehmer, die auf der neurotischen Skala schlecht abschnitten (d. H. Diejenigen mit der emotionalsten Stabilität), eine größere Anzahl von Wörtern, die sich auf aktive, soziale Aktivitäten wie „Snowboarden“, „Treffen“ oder „Basketball“ bezogen.
"Dies garantiert nicht, dass Sie beim Sport weniger neurotisch werden. Es könnte sein, dass Neurotizismus dazu führt, dass Menschen Sport meiden “, sagte Ungar. "Aber es schlägt vor, dass wir die Möglichkeit untersuchen sollten, dass neurotische Individuen emotional stabiler werden, wenn sie mehr Sport treiben."
Durch die Erstellung eines Vorhersagemodells der Persönlichkeit, das auf der Sprache der sozialen Medien basiert, können Forscher solche Fragen jetzt leichter beantworten. Anstatt Millionen von Menschen zum Ausfüllen von Umfragen aufzufordern, können zukünftige Studien durchgeführt werden, indem Freiwillige ihre Facebook- oder Twitter-Feeds für anonymisierte Studien einreichen.
"Forscher haben diese Persönlichkeitsmerkmale über viele Jahrzehnte theoretisch untersucht", sagte Eichstaedt, "aber jetzt haben sie ein einfaches Fenster, wie sie das moderne Leben im Zeitalter von Facebook gestalten."
Quelle: Universität von Pennsylvania