Masterarbeit

Titel: Navigating Ideological Impact: Exploring Negativity Bias on YouTube


Mein Abschlussprojekt an der Universität Konstanz gipfelte in der Erstellung einer Masterarbeit über die YouTube-Inhalte, die von US-Senatoren veröffentlicht werden. Diese Arbeit, die mit der Note 1,3 bewertet wurde, ermöglichte es mir, meine Expertise in Web Scraping, Natural Language Processing (NLP) und überwachten maschinellen Lernverfahren zu vertiefen. Mithilfe von R und Python sammelte, analysierte und visualisierte ich die Korrelation zwischen Sentiment und Zuschauerzahlen von YouTube-Videos. Die Thesis ist auf Anfrage verfügbar, und der Code für das Projekt ist in einem GitHub-Repository zu finden. Hier.

Zusammenfassung (Auf Englisch):
In modern politics, social media has become an indispensable tool for politicians to share their opinions and engage with their constituents. Across disciplines, there is a well-documented negativity bias in the human psyche, meaning that negative information is prioritized in our cognitive processes. In response to the negativity bias, this study delves into the underexplored terrain of YouTube to investigate how U.S. senators employ negativity to broaden their audience. With YouTube’s reputation as a space for diverse opinions, this research also scrutinizes the impact of ideological factors on video views. Employing an innovative approach, a comprehensive dataset of 44,100 video captions from current U.S. senators is collected and subjected to sentiment analysis using the RoBERTa neural language model. Through a linear mixed-effects model, the results suggest that senator videos containing more negative discourse increase viewership, a trend that persists even after controlling for individual characteristics. However, conclusive evidence regarding the definitive impact of ideological factors on baseline viewership remains elusive.


Obwohl der Code im GitHub-Repository zu finden ist, war der Weg von komplexen Herausforderungen und wertvollen Lernerfahrungen geprägt. Eine bemerkenswerte Leistung war die Entwicklung von R Markdown-Dateien, die verschiedene Schritte des Projekts detailliert beschreiben. Die erste Seite skizziert den Prozess der Sammlung von YouTube-Untertiteln für eine gegebene Liste von Videos. Ich entwickelte ein Skript, um einen Browser zu automatisieren, der systematisch eine Liste von URLs durchlief und verfügbare Untertitel herunterlud. Dieses Vorgehen führte zur Ansammlung von 44.100 Textdateien, die jeweils einem Video entsprechen. Das Überwinden von Hindernissen, wie dem Umgang mit Pop-ups und Werbung während des Web Scraping, stellte eine erhebliche Herausforderung dar. Eine besonders lohnende Errungenschaft war die erfolgreiche Implementierung einer Ad-Blocker-Funktionalität in meinen automatisierten Browser.

  1. Scraping Data with RSelenium (R): Link.
  2. Replication of Figures (R): Link.
  3. Replication of Tables (R): Link.