Statistik und Datenanalyse: Aufbau

6. Sitzung – Interaktionen

Benjamin Fretwurst
PDF-Version der Folien

Orga

Photo courtesy of Lisa Vogel

Vorbereitung Prüfungen

Nächsten Mittwoch! (1.11.)

… keine Präsenzsitzung. Die Lösung der Übung von heute gibt es im Podcast.

Die Bewerber:innen auf die Methodenprofessur (Nachfolge Werner Wirth) bewerben sich! Alle Studierende sind herzlich eingeladen.

Ihre Statistik-Tutorinnen

Allgemeine und Statistik- sowie R-Fragen bitte auch im OLAT-Forum

Katharina: katharina.basler@uzh.ch

Nadia: nadia.egloff@uzh.ch

Fragen im Forum

  • Anhand von Screenshots können wir Ihnen nicht wirklich helfen
  • Bei Fragen zu den Folien bitte die Sitzung und die Foliennummer angeben (zB Sitzung 6: 3.5)
  • Wenn Sie Probleme mit R haben, schicken Sie bitte Folgendes mit:
    • die .qmd-Datei in der die Probleme entstehen
    • wenn es Probleme mit dem Laden von Dateien gibt, Ihren ganzen Projektordner gezipt
    • die Fehlermeldung als Text und nicht als Screenshot

Lernziele

Interaktionen

  • Wirkungsunterschiede im Vergleich zwischen Gruppen
  • Slope Dummys (Metrische * Dummy)
  • Interaktion genereller (zwei Metrische)

1 Interaktion mit Slope-Dummy

Interaktionen mit Slope-Dummy

1.1 Interaktion mit Slope-Dummy (in Worten)

Regression mit Slope-Dummy

Y=b_1+b_2X_2+b_3D_3+b_4D_3X_2+e

  • im Modell gibt es eine metrische Variable, eine Dummy und eine Slope-Dummy
  • das b_1 gibt den Schnittpunkt mit der Y-Achse (X=0) der 0-Gruppe wieder
  • das b_2 gibt den Anstieg der 0-Gruppe wieder
  • das b_3 gibt den Unterschied des Schnittpunkts mit der Y-Achse der 1-Gruppe wieder
  • das b_4 gibt den Unterschied im Anstieg der 1-Gruppe wieder

1.2 Interaktion mit Slope-Dummy (Formeln)

Regression mit Slope-Dummy

Y = b_1 + b_2X_2 + b_3D_3 + b_4D_3X_2 + e

\begin{align*} Y & = b_1 + e & | X_2 = 0, D_3 = 0 \\ Y & = b_1 + b_3 + e & | X_2 = 0, D_3 = 1 \\ Y & = b_1 + b_2X_2 + e & | D_3 = 0 \\ Y & = b_1 + b_2X_2 + b_3 + b_4X_2 & | D_3 = 1 \\ \end{align*}

2 Beispiel zu Videospielen und Aggression

2.1 Die Daten “Video_Games.savs”

download.file("http://www.discoveringstatistics.com/docs/ds_data_files/SPSS%20Data%20Files/Video%20Games.sav", "data/Video_Games.sav", quiet = TRUE)

DATEN <- haven::read_spss("data/Video_Games.sav")

head(DATEN)
## # A tibble: 6 × 4
##      ID Aggression Vid_Games CaUnTs
##   <dbl>      <dbl>     <dbl>  <dbl>
## 1    69         13        16      0
## 2    55         38        12      0
## 3     7         30        32      0
## 4    96         23        10      1
## 5   130         25        11      1
## 6   124         46        29      1

2.2 Zusammenhang Videospiele und Aggression

DATEN <- DATEN  |>
  mutate(Anti_Sozial = case_match(CaUnTs,
    c(0:10) ~ 1,
    c(11:30) ~ 2,
    c(31:200) ~ 3, 
    .default = NA
  )) |>
  sjlabelled::var_labels(Anti_Sozial = "Antisoziales Verhalten")

DATEN |> sjmisc::frq(Anti_Sozial)
## Antisoziales Verhalten (Anti_Sozial) <numeric> 
## # total N=442 valid N=442 mean=1.89 sd=0.61
## 
## Value |   N | Raw % | Valid % | Cum. %
## --------------------------------------
##     1 | 108 | 24.43 |   24.43 |  24.43
##     2 | 273 | 61.76 |   61.76 |  86.20
##     3 |  61 | 13.80 |   13.80 | 100.00
##  <NA> |   0 |  0.00 |    <NA> |   <NA>
R-Code
# Speichere in dem Datensatz Video_Games_AS_gering man nur die Fälle mit mittlerer oder geringem Antisozialem Verhalten.
Video_Games_AS_gering <- DATEN  |>
  filter(CaUnTs < 31)

# Mache einen Scatterplot (geom_point) für Vid_Games und Agression, unterteilt nach Anti_Sozial und lege da mit geom_smooth jeweils eine Regressionsgerade rein.
Video_Games_AS_gering  |> 
  ggplot2::ggplot(aes(x = Vid_Games, y = Aggression, color = as.factor(Anti_Sozial))) +
  geom_point()+ 
  scale_color_manual(values=c(c(Farben[3], Farben[4]))) + 
  geom_smooth(method=lm, se=FALSE, fullrange=TRUE) + 
  theme_minimal()

Grafik Videogames

R-Chunk
DATEN <- DATEN  |>
  mutate(Anti_Soz_hoch = case_match(Anti_Sozial,
   3 ~ 1,
   .default = 0
  ), 
  Anti_Soz_mittel = case_match(Anti_Sozial, 
  2 ~ 1, 
  .default = 0))

DATEN  |> sjmisc::frq(Anti_Soz_hoch)
## Anti_Soz_hoch <numeric> 
## # total N=442 valid N=442 mean=0.14 sd=0.35
## 
## Value |   N | Raw % | Valid % | Cum. %
## --------------------------------------
##     0 | 381 | 86.20 |   86.20 |  86.20
##     1 |  61 | 13.80 |   13.80 | 100.00
##  <NA> |   0 |  0.00 |    <NA> |   <NA>

DATEN  |>
  ggplot2::ggplot(aes(x = Vid_Games, y = Aggression, color = as.factor(Anti_Soz_hoch))) +
  geom_point()+ 
  scale_color_manual(values=c(c(Farben[3], Farben[4]))) + 
  geom_smooth(method=lm, se=FALSE, fullrange=TRUE) + 
  theme_minimal()

Zusammenhang Videospiele zu Aggression für Menschen mit hohem vs. geringerem antisozialen Verhalten

2.3 Regression (unzentriert)

R-Chunk

Modell4 <- lm(Aggression ~ Vid_Games + Vid_Games * Anti_Soz_hoch, data = DATEN)

olsrr::ols_vif_tol(Modell4)
##                 Variables Tolerance      VIF
## 1               Vid_Games 0.8318770 1.202101
## 2           Anti_Soz_hoch 0.1049793 9.525692
## 3 Vid_Games:Anti_Soz_hoch 0.1024746 9.758512

sjPlot::tab_model(Modell4, 
                  show.ci = FALSE,
                  show.std = TRUE, # zeige die standardisierten Koeffizienten
                  show.est = TRUE, # zeige die unstandardisierten estimates
                  show.r2 = TRUE # zeige R^2
                  )
  Agression
Predictors Estimates std. Beta p std. p
(Intercept) 35.95 -0.00 <0.001 0.968
Video Games(Hours per
week)
0.10 0.11 0.238 0.008
Anti Soz hoch -3.28 0.37 0.501 <0.001
Vid_Games:Anti_Soz_hoch 0.77 0.15 <0.001 <0.001
Observations 442
R2 / R2 adjusted 0.183 / 0.177

2.4 Regression nach Zentrierung

R-Chunk
DATEN |>
  summarize(Aggressions_Mittel = mean(Aggression, na.rm = TRUE), .by = Anti_Soz_hoch) 
## # A tibble: 2 × 2
##   Anti_Soz_hoch Aggressions_Mittel
##           <dbl>              <dbl>
## 1             0               38.2
## 2             1               51.9

51.9 - 38.2
## [1] 13.7

DATEN_z <- DATEN %>% 
  mutate(Vid_Games = Vid_Games - mean(Vid_Games, na.rm = TRUE)) # zentriere Vid_Games (Mittelwert = 0)

Modell4 <- lm(Aggression ~ Vid_Games + Anti_Soz_hoch + Vid_Games * Anti_Soz_hoch, data = DATEN_z)

olsrr::ols_vif_tol(Modell4)
##                 Variables Tolerance      VIF
## 1               Vid_Games 0.8318770 1.202101
## 2           Anti_Soz_hoch 0.9993801 1.000620
## 3 Vid_Games:Anti_Soz_hoch 0.8314800 1.202675

sjPlot::tab_model(Modell4, 
                  show.ci = FALSE,
                  show.std = TRUE, # zeige die standardisierten Koeffizienten
                  show.est = TRUE, # zeige die unstandardisierten estimates
                  show.r2 = TRUE, # zeige R^2
                  show.fstat = TRUE
                  )
  Agression
Predictors Estimates std. Beta p std. p
(Intercept) 38.17 -0.00 <0.001 0.968
Video Games(Hours per
week)
0.10 0.11 0.238 0.008
Anti Soz hoch 13.52 0.37 <0.001 <0.001
Vid_Games:Anti_Soz_hoch 0.77 0.15 <0.001 <0.001
Observations 442
R2 / R2 adjusted 0.183 / 0.177

2.5 Kategoriale UV

R-Chunk
Modell5 <- lm(Aggression ~ Vid_Games + Anti_Soz_hoch + Anti_Soz_mittel +
                Vid_Games * Anti_Soz_hoch + Vid_Games * Anti_Soz_mittel,
              data = DATEN_z)

olsrr::ols_vif_tol(Modell5)
##                   Variables Tolerance      VIF
## 1                 Vid_Games 0.2266636 4.411824
## 2             Anti_Soz_hoch 0.7390622 1.353066
## 3           Anti_Soz_mittel 0.7373241 1.356256
## 4   Vid_Games:Anti_Soz_hoch 0.5739909 1.742188
## 5 Vid_Games:Anti_Soz_mittel 0.2730809 3.661919

sjPlot::tab_model(Modell5, 
                  show.std = TRUE, # zeige die standardisierten Koeffizienten
                  show.est = TRUE, # zeige die unstandardisierten estimates
                  show.ci = FALSE,
                  show.r2 = TRUE, # zeige R^2
                  show.fstat = TRUE,
                  string.est = "b",
                  string.std = "std. b"
                  )
  Agression
Predictors b std. b p std. p
(Intercept) 30.79 -0.00 <0.001 0.958
Video Games(Hours per
week)
0.05 0.10 0.766 0.015
Anti Soz hoch 20.90 0.57 <0.001 <0.001
Anti Soz mittel 10.29 0.40 <0.001 <0.001
Vid_Games:Anti_Soz_hoch 0.82 0.16 <0.001 <0.001
Vid_Games:Anti_Soz_mittel 0.03 0.01 0.865 0.865
Observations 442
R2 / R2 adjusted 0.299 / 0.291

3 Interaktion zweier metrischer Variablen

Interaktion zweier metrischer Variablen

Regression mit Interaktion (zentrierter X)

Y=b_1+b_2X_2+b_3X_3+b_4X_2X_3+e

  • im Modell sind die Haupteffekte und die Interaktion zweier metrischer
  • das b_1 ist der Schnittpunkt mit der Y-Achse (X=0) wieder
  • das b_2 ist der Anstieg von X_2
  • das b_3 ist der Anstieg von X_3
  • das b_4 ist die Interaktion
    • ist b_4>0 Verstärkung
    • ist b_4<0 Abschwächung
    • ist b_4=0 neutral

Interaktion zweier metrischer Variablen (in Worten)

R-Chunk
DATEN_z <- DATEN  |>
  mutate(across(everything(), ~.x - mean(.x, na.rm = TRUE))) # verändere alle numerischen Variablen, indem sie z-transformiert werden (scale)

Modell5 <- lm(Aggression ~ Vid_Games * CaUnTs,
              data = DATEN_z)

olsrr::ols_vif_tol(Modell5)
##          Variables Tolerance      VIF
## 1        Vid_Games 0.9930553 1.006993
## 2           CaUnTs 0.9974262 1.002580
## 3 Vid_Games:CaUnTs 0.9950094 1.005016

sjPlot::tab_model(Modell5, 
                  show.std = TRUE, # zeige die standardisierten Koeffizienten
                  show.est = TRUE, # zeige die unstandardisierten estimates
                  show.ci = FALSE,
                  show.r2 = TRUE, # zeige R^2
                  show.fstat = TRUE,
                  string.est = "b",
                  string.std = "std. b"
                  )
  Agression
Predictors b std. b p
(Intercept) -0.09 -0.01 0.854
Video Games(Hours per
week)
0.17 0.09 0.014
Callous Unemotional
Traits
0.76 0.58 <0.001
Vid_Games:CaUnTs 0.03 0.14 <0.001
Observations 442
R2 / R2 adjusted 0.377 / 0.373

Interaktionen zwischen metrischen Variablen zeigen an, inwiefern der Anstieg der einen UV mit dem grösser werden der anderen UV steigt. Also:

  • Die Nutzung von Videogames hat einen signifikanten, aber sehr geringen Einfluss auf Aggression.
  • Antisoziale Persönlichkeitsmerkmale korrelieren stark mit Aggression
  • Je höher die antisozialen Persönlichkeitsmerkmale, desto stärker wird der Zusammenhang zwischen der Nutzung von Video-Games und Aggression
  • und: Je mehr Videospiele jemand spielt, desto grösser wird der Zusammenhang zwischen Antisozialen Merkmalen und Aggression.

4 Übung 2

Ü2.1 Laden Sie die Daten

download.file("http://www.discoveringstatistics.com/docs/ds_data_files/SPSS%20Data%20Files/Video%20Games.sav", "data/Video_Games.sav", quiet = TRUE)

Video_Games <- haven::read_spss("data/Video_Games.sav")

head(Video_Games)
## # A tibble: 6 × 4
##      ID Aggression Vid_Games CaUnTs
##   <dbl>      <dbl>     <dbl>  <dbl>
## 1    69         13        16      0
## 2    55         38        12      0
## 3     7         30        32      0
## 4    96         23        10      1
## 5   130         25        11      1
## 6   124         46        29      1

Ü2.2 Vollziehen Sie nach

Schauen Sie sich folgenden R-Chunk an und versuchen ihn mit Hilfe von google und Paketvignetten zu verstehen

# Nehme die Variable für Antisoziales Verhalten (CaUnTs) und bilde eine Gruppenvariable (Anti_Sozial) daraus und drei Dummyvariablen (Anti_Soz_gering bis Anti_Soz_hoch).

Video_Games <- Video_Games  |>
  mutate(Anti_Sozial = case_match(CaUnTs,
    c(0:10) ~ 1,
    c(11:30) ~ 2,
    c(31:200) ~ 3, 
    .default = NA
  )) |>
  sjlabelled::var_labels(Anti_Sozial = "Antisoziales Verhalten")

Video_Games |> sjmisc::frq(Anti_Sozial)
## Antisoziales Verhalten (Anti_Sozial) <numeric> 
## # total N=442 valid N=442 mean=1.89 sd=0.61
## 
## Value |   N | Raw % | Valid % | Cum. %
## --------------------------------------
##     1 | 108 | 24.43 |   24.43 |  24.43
##     2 | 273 | 61.76 |   61.76 |  86.20
##     3 |  61 | 13.80 |   13.80 | 100.00
##  <NA> |   0 |  0.00 |    <NA> |   <NA>

Ü2.3 Kommentieren Sie, was in den Befehlszeilen gemacht wird

Schreiben Sie Kommentare, die erklären, was die Befehle und Funktionen tun.

R-Code
Video_Games <- Video_Games  |>
  mutate(Anti_Soz_hoch = case_match(Anti_Sozial,
   3 ~ 1,
   .default = 0
  ), 
  Anti_Soz_mittel = case_match(Anti_Sozial, 
  2 ~ 1, 
  .default = 0))

Video_Games  |>
  ggplot2::ggplot(aes(x = Vid_Games, y = Aggression, color = as.factor(Anti_Soz_hoch))) +
  geom_point() + 
  scale_color_manual(values=c(c(Farben[3], Farben[4]))) + 
  geom_smooth(method=lm, se=FALSE, fullrange=TRUE) + 
  theme_minimal()

Zusammenhang Videospiele zu Aggression für Menschen mit hohem vs. geringerem antisozialen Verhalten

Ü2.4 Interpretieren Sie die Regression in Ihren Worten

  1. Was bedeutet lm()?
  2. Was wird in das “Modell4” geschrieben?
  3. Was steht links und was rechts von der Tilde (~)?
  4. Interpretieren Sie den Regressionsoutput!
  5. Wie kann es sein, dass das b für “Anti_Soz_hoch” stark negativ ist und das BETA positiv? (bei Ambitionen auf Note 6)
  6. Was sagen Ihnen die Toleranz- und die VIF-Werte?
R-Code
Modell4 <- lm(Aggression ~ Vid_Games + Vid_Games * Anti_Soz_hoch, data = Video_Games)

olsrr::ols_vif_tol(Modell4)
##                 Variables Tolerance      VIF
## 1               Vid_Games 0.8318770 1.202101
## 2           Anti_Soz_hoch 0.1049793 9.525692
## 3 Vid_Games:Anti_Soz_hoch 0.1024746 9.758512

lm.beta::lm.beta(Modell4)
## 
## Call:
## lm(formula = Aggression ~ Vid_Games + Vid_Games * Anti_Soz_hoch, 
##     data = Video_Games)
## 
## Standardized Coefficients::
##             (Intercept)               Vid_Games           Anti_Soz_hoch 
##                      NA              0.05598842             -0.08975792 
## Vid_Games:Anti_Soz_hoch 
##              0.49630075

summary(Modell4)
## 
## Call:
## lm(formula = Aggression ~ Vid_Games + Vid_Games * Anti_Soz_hoch, 
##     data = Video_Games)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -29.385  -7.844   0.071   7.615  42.197 
## 
## Coefficients:
##                         Estimate Std. Error t value Pr(>|t|)    
## (Intercept)             35.95283    1.95910  18.352  < 2e-16 ***
## Vid_Games                0.10132    0.08572   1.182 0.237824    
## Anti_Soz_hoch           -3.27507    4.86502  -0.673 0.501183    
## Vid_Games:Anti_Soz_hoch  0.76906    0.20912   3.678 0.000265 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 11.43 on 438 degrees of freedom
## Multiple R-squared:  0.1826, Adjusted R-squared:  0.177 
## F-statistic: 32.61 on 3 and 438 DF,  p-value: < 2.2e-16

sjPlot::tab_model(Modell4, 
                  show.std = TRUE, 
                  show.est = TRUE, 
                  show.r2 = TRUE
                  )
  Agression
Predictors Estimates std. Beta CI standardized CI p std. p
(Intercept) 35.95 -0.00 32.10 – 39.80 -0.09 – 0.08 <0.001 0.968
Video Games(Hours per
week)
0.10 0.11 -0.07 – 0.27 0.03 – 0.20 0.238 0.008
Anti Soz hoch -3.28 0.37 -12.84 – 6.29 0.29 – 0.46 0.501 <0.001
Vid_Games:Anti_Soz_hoch 0.77 0.15 0.36 – 1.18 0.07 – 0.23 <0.001 <0.001
Observations 442
R2 / R2 adjusted 0.183 / 0.177

Ü2.5 Was geschieht hier?

  1. Was macht wird durch die Funktion scale() erreicht?
  2. Was hat sich in der Regression zum letzten Modell geändert?
  3. Warum ist R^2 nicht grösser, obwohl das Problem mit der Multikollinearität gelöst wurde? (bei 6-Ambitionen)
  4. Warum hat scale das Problem mit der Multikollinearität gelöst? (bei 6-Ambitionen)
R-Code
Video_Games_z <- Video_Games %>% 
  mutate(Vid_Games = scale(Vid_Games))

Modell4 <- lm(Aggression ~ Vid_Games + Anti_Soz_hoch + Vid_Games * Anti_Soz_hoch, data = Video_Games_z)

olsrr::ols_vif_tol(Modell4)
##                 Variables Tolerance      VIF
## 1               Vid_Games 0.8318770 1.202101
## 2           Anti_Soz_hoch 0.9993801 1.000620
## 3 Vid_Games:Anti_Soz_hoch 0.8314800 1.202675

sjPlot::tab_model(Modell4, 
                  show.std = TRUE, 
                  show.est = TRUE, 
                  show.r2 = TRUE, 
                  show.fstat = TRUE
                  )
  Agression
Predictors Estimates std. Beta CI standardized CI p std. p
(Intercept) 38.17 -0.00 37.02 – 39.32 -0.09 – 0.08 <0.001 0.968
Vid Games 0.71 0.11 -0.47 – 1.88 0.03 – 0.20 0.238 0.008
Anti Soz hoch 13.52 0.37 10.43 – 16.62 0.29 – 0.46 <0.001 <0.001
Vid Games × Anti Soz hoch 5.35 0.15 2.49 – 8.22 0.07 – 0.23 <0.001 <0.001
Observations 442
R2 / R2 adjusted 0.183 / 0.177

Ü2.6 Wie sind diese Ergebnisse zu interpretieren?

  1. Warum ist das R^2 so viel grösser?
  2. Was bedeutet es, dass die beiden “Anti Soz”-Variablen signifikant sind?
  3. Was bedetet es, dass die Interaktion aus “Vid Games” x “Anti Soz mittel” nicht signifikant ist?
R-Code

Video_Games_z <- Video_Games  |>
  mutate(across(everything(), ~scale(.x))) # verändere alle numerischen Variablen, indem sie z-transformiert werden (scale)

Modell5 <- lm(Aggression ~ Vid_Games + Anti_Soz_hoch + Anti_Soz_mittel +
                Vid_Games * Anti_Soz_hoch + Vid_Games * Anti_Soz_mittel,
              data = Video_Games_z)

olsrr::ols_vif_tol(Modell5)
##                   Variables Tolerance      VIF
## 1                 Vid_Games 0.9907942 1.009291
## 2             Anti_Soz_hoch 0.7390622 1.353066
## 3           Anti_Soz_mittel 0.7373241 1.356256
## 4   Vid_Games:Anti_Soz_hoch 0.6855523 1.458678
## 5 Vid_Games:Anti_Soz_mittel 0.6887144 1.451981

sjPlot::tab_model(Modell5, 
                  show.std = TRUE, # zeige die standardisierten Koeffizienten
                  show.est = TRUE, # zeige die unstandardisierten estimates
                  show.r2 = TRUE, # zeige R^2
                  show.fstat = TRUE,
                  string.est = "b",
                  string.std = "std. b"
                  )
  Aggression
Predictors b std. b CI standardized CI p
(Intercept) -0.00 -0.00 -0.08 – 0.08 -0.08 – 0.08 0.958
Vid Games 0.10 0.10 0.02 – 0.18 0.02 – 0.18 0.015
Anti Soz hoch 0.57 0.57 0.48 – 0.66 0.48 – 0.66 <0.001
Anti Soz mittel 0.40 0.40 0.31 – 0.49 0.31 – 0.49 <0.001
Vid Games × Anti Soz hoch 0.16 0.16 0.07 – 0.25 0.07 – 0.25 <0.001
Vid Games × Anti Soz
mittel
0.01 0.01 -0.09 – 0.10 -0.09 – 0.10 0.865
Observations 442
R2 / R2 adjusted 0.299 / 0.291

Ü2.7 Sind die Voraussetzungen erfüllt?

  1. Suchen Sie sich aus der ersten Übung die Befehle für die Prüfung der Voraussetzungen der Regressionsanalyse, hängen Sie die an die Übung und passen Sie sie so an, dass sie funktionieren.

  2. Waren die Analysen erlaubt?

  3. Was könnte man tun, wenn Voraussetzungen verletzte werden. Recherchieren Sie. (bei 6-Ambitionen)

Take Home – Ausblick – Vokabeln

Take Home

Interaktionen

  • Sie wissen, wie man Interaktionen zwischen einer Dummy und einer metrischen interpretiert.
  • Sie wissen, wie man Interkationen zwischen zwei metrischen Variablen interpretiert.
  • Sie können (spätestens nach der Übung) eine Regression mit Interaktionen in R rechnen.

Ausblick

Wir gehen gemeinsam die Übung durch

LEF 6

Essayfragen 6

E6.1 Was ist eine Slope-Dummy-Variable?

E6.2 Wenn Sie die Hypothese haben, dass der Nachrichtenfaktor “Personalsierung” stärker wirkt, je älter die Befragten sind, wie würden Sie das Regressionsmodell formulieren (Gleichung)? Sie können auch die Modellschreibweise von R verwenden, also lm().

E6.3 Warum ist beim Rechnen mit Slope-Dummys die Multikollinearität ein besonderes Problem? Wie kann man das lösen?

E6.4 Zeichnen Sie ein typisches Beispiel für einen Zusammenhang, den man mit einer Slope-Dummy modellieren würde. (Tipp: Es braucht ein Koordinatensystem und dann zeichnen Sie da Punkte mit unterschiedlichen Farben und Regressionsgeraden rein.)

E6.5 Wenn es grosse Probleme mit Multikollinearität gibt, wie können Sie das bei Slope-Dummys (und nur hier) lösen?

E6.6 Wie bilden Sie in R eine Slope-Dummy (Interaktion zwischen einer Dummy und einer Metrischen)

MC-Fragen 6

MC 6.1.

MC 6.1: Sind folgende Aussagen richtig oder falsch?

Punkte:

MC 6.2.

MC 6.2: Sind folgende Aussagen richtig oder falsch?

Punkte:

MC 6.3.

MC 6.3: Sind folgende Aussagen richtig oder falsch?

Punkte:

MC 6.4.

MC 6.4: Sind folgende Aussagen richtig oder falsch?

Punkte:

MC 6.5.

MC 6.5: Sind folgende Aussagen richtig oder falsch?

Punkte:

Insgesamt von Punkten, was % und etwa einer entspricht.

Vokabeln

:::