Wie wir herausfinden, welche Tweets glaubwürdig sind

Forscher am Georgia Institute of Technology haben ein neues Sprachmodell entwickelt, das zeigt, welche Wörter und Phrasen die Glaubwürdigkeit der auf Twitter gemeldeten Weltereignisse positiv oder negativ beeinflussen.

Die Studie, in der 66 Millionen Tweets zu fast 1.400 realen Ereignissen gescannt wurden, legt nahe, dass die Worte von Millionen von Menschen in sozialen Medien erhebliche Informationen über die Glaubwürdigkeit eines Ereignisses liefern können, selbst wenn ein Ereignis noch läuft.

"In den letzten Jahren gab es viele Studien zur Glaubwürdigkeit von Social Media, aber es ist nur sehr wenig darüber bekannt, welche Arten von Wörtern oder Phrasen bei sich schnell entwickelnden Ereignissen Glaubwürdigkeitswahrnehmungen hervorrufen", sagte Tanushree Mitra, Georgia Tech Ph.D. Kandidat, der die Forschung leitete.

Das Team untersuchte Tweets zu Weltereignissen in den Jahren 2014 und 2015, darunter die Entstehung von Ebola in Westafrika, der Angriff von Charlie Hebdo in Paris und der Tod von Eric Garner in New York City.

Die Forscher baten die Leute, die Beiträge nach ihrer Glaubwürdigkeit zu beurteilen (von „sicher genau“ bis „sicher ungenau“). Dann gab das Team die Wörter in ein Modell ein, das sie in 15 verschiedene Sprachkategorien unterteilt. Die Klassifikationen umfassten positive und negative Emotionen, Absicherungen und Booster sowie Angstzustände.

Der Georgia Tech-Computer untersuchte dann die Wörter, um zu beurteilen, ob die Tweets glaubwürdig waren oder nicht. Es stimmte in etwa 68 Prozent der Fälle mit den Meinungen der Menschen überein, ein Prozentsatz, der deutlich über der zufälligen Basislinie von 25 Prozent lag.

"Tweets mit Booster-Wörtern wie" unbestreitbar "und positiven Emotionsbegriffen wie" eifrig "und" großartig "wurden als äußerst glaubwürdig angesehen", sagte Mitra. "Worte, die auf eine positive Stimmung hinweisen, sich aber über die Unpraktikabilität des Ereignisses lustig machen, wie" ha "," grinsen "oder" scherzen ", wurden als weniger glaubwürdig angesehen. Dies galt auch für Hedge-Wörter, einschließlich „bestimmter Stufe“ und „Verdächtiger“. “

Eine höhere Anzahl von Retweets war mit niedrigeren Glaubwürdigkeitswerten verbunden.Antworten und Retweets mit längeren Nachrichtenlängen wurden als glaubwürdiger angesehen.

"Es könnte sein, dass längere Nachrichtenlängen mehr Informationen oder Argumente liefern, sodass sie als vertrauenswürdiger angesehen werden", sagte sie. "Andererseits könnte eine höhere Anzahl von Retweets, die in Bezug auf die Glaubwürdigkeit niedriger bewertet wurden, einen Versuch darstellen, in Krisen- oder Unsicherheitszeiten kollektives Denken hervorzurufen."

Obwohl das Modell noch nicht bereitstellbar ist, sagen die Forscher, dass sie möglicherweise eine App entwickeln, mit der die wahrgenommene Vertrauenswürdigkeit eines Ereignisses berechnet werden kann, wenn es sich in sozialen Medien entfaltet.

"In Kombination mit anderen Signalen wie Ereignisthemen oder Strukturinformationen könnte unser sprachliches Ergebnis ein wichtiger Baustein eines automatisierten Systems sein", sagte Dr. Eric Gilbert, Mitras Berater und Assistenzprofessor an der School of Interactive Computing von Georgia Tech.

„Twitter ist Teil des Problems, unwahre Nachrichten online zu verbreiten. Es kann aber auch Teil der Lösung sein. “

Quelle: Georgia Institute of Technology

!-- GDPR -->