In den letzten Jahren[fn:1] konnten in diversen Ländern der Aufstieg populistischer Phänomene betrachtet werden:

  • die /AfD/ in Deutschland, die seit ihrer Gründung binnen X Jahren in sämtlichen deutschen Landtagen, dem Bundestag und dem europäischen Parlament vertreten ist,
  • der Wahlsieg Donald J. Trumps in den USA,
  • der Aufstieg der /Lega/ in Italien,

Ein Verlaufsmuster, das bei jedem einzelnen dieser Aufstiege beobachtet werden konnte, ist hierbei eine zirkelförmige Form von Aufschaukelung der zwischen dem sich steigernden Medienecho, der gesellschaftlichen Bekanntheit und schließlich der Meinung und Zustimmung zu den Phänomenen erhoben wird. In griffigen Thesen zusammengefasst, könnte man dies in drei möglichen Thesen:

  1. gesteigerte Präsenz in den Medien (zusätzlich unterstützt durch gezielte Provokationen für gesteigerte Aufmerksamkeit) führt zu größerer Bekanntheit und zu höheren Umfragewerten,
  2. größere Bekanntheit führt zu höheren Werten in Umfragen und zu gesteigerter Präsenz in den Medien,
  3. höhere Werte in Umfragen vergrößern die Präsenz in den Medien und steigern den Bekanntheitsgrad.

Zu dieser Liste an Thesen stellt sich nun direkt die Frage: Welche dieser Thesen ist die richtige? Anders gefragt, da ich hier einen Data Science Blog betreibe: Welche dieser Thesen lässt sich anhand von Daten am ehesten untermauern?

In der Folge erkläre ich detailliert meine Vorgehensweise, nehme hier aber bereits die Antwort vorweg: Während des Aufstiegs der AfD in den Jahren in den Jahren 2015 und 2016 beschreibt These 2) den Zeitablauf am Besten.

  • Der Aufstieg der AfD im Vorfeld der Bundestagswahl 2017 als Studienobjekt[fn:2]
## # A tibble: 7 x 6
##   pollster date       respondents party  percent votes
##   <chr>    <date>           <dbl> <chr>    <dbl> <dbl>
## 1 pooled   2019-11-23       3797. afd      14.0   533.
## 2 pooled   2019-11-23       3797. cdu      26.3   998.
## 3 pooled   2019-11-23       3797. fdp       8.44  320.
## 4 pooled   2019-11-23       3797. greens   21.0   797.
## 5 pooled   2019-11-23       3797. left      9.26  352.
## 6 pooled   2019-11-23       3797. others    6.15  234.
## 7 pooled   2019-11-23       3797. spd      14.8   563.

Als Datenquelle für die Analyse verwende ich drei verschiedene Datenquellen:

Im ersten Schritt fasse ich die Ergebnisse dieser drei Quellen zusammen und erhalte folgenden Verlauf:

afd_data <-
  full_join(afd_surveys, afd_articles_df, by = c("month" = "month")) %>%
  filter(month > "2010-01-01") %>%
  left_join(googletrends, by = c("month" = "month"))


ggplot(afd_data, aes(month)) + 
  geom_line(aes(y = aggregate_poll, colour = "red")) + 
  geom_line(aes(y = articles, colour = "green")) +
  geom_line(aes(y = googlelevel, colour = "black"))   

## Warning: Removed 1 rows containing missing values (geom_path).

## Warning: Removed 1 rows containing missing values (geom_path).