5 GLM – kategoriale UV

Veröffentlichungsdatum

2024-03-05

Auch als Gruppenvergleiche oder Varianzanalyse (ANOVA) bzw. Multivariate Varianzanalyse (MANOVA/MANCOVA) bekannt.

Die Folien zur Sitzung

Der Vorlesungsmitschnitt

5.1 Gruppenvergleiche (ANCOVA)

Nominale UVs sind dichotome Variablen (zwei Ausprägungen) oder kategoriale (mehr als zwei Ausprägungen). Wenn wir mit solchen nominalen Variablen Unterschiede erklären wollen (die auf Zusammenhänge bzw. Kausalität zurückgehen), bilden wir mit diesen Variablen Gruppen der Fälle, die wir dann vergleichen. Der Vergleich besteht in der Regel in der Prüfung der Signifikanz von Unterschieden. Das können t-Tests für Mittelwertunterschiede sein. Varianzanalysen für zwei oder mehr Gruppen. Oder auch Regressionen, wo die nominalen Variablen als UV bzw. UVs eingehen.

Der Datensatz, der für dieses Beispiel herangezogen wird, ist von Andy Field. Er hatte einen Artikel darüber gelesen, dass Ingineure einen Stoff entwickeln, der wie unsichtbar macht, indem irgendwie der Hintergrund auf den Umhang projeziert wird oder so. Jedenfalls hat sich Andy Field dann überlegt, was die Leute mit so einem Unsichtbarkeitsumhang (Cloak) wohl für Schabernack (Mischief) anstellen würden, wenn sie von ihrer Umgegung nicht mehr beobachtet werden. Dafür hat Andy Field ein Experiment in der Zukunft imaginiert, bei dem 12 Personen kein Umhang gegeben wird und 12 ein Tarnmantel, der unsichtbar macht. Dann wird gemessen, wie viel Unsinn die Leute jeweils anstellen. Die durchschnittliche Anzahl von Schabernackstaten (Mischief) wird dafür zwischen der Experimental- (hat einen Cloak an) und der Kontrollgruppe (kein Cloak) verglichen.

5.2 Visualisierung und Deskriptives

Gruppenvergleiche können schon gut mit Boxplots gemacht werden. Dabei wird der Mittelwert in einer Box als Linie dargestellt und die das untere sowie das obere Quartil (25% bzw. 95% der Verteilung) als Ränder der Box.

Mittelwerte (Boxplot) für Gruppenvergleich

Es können aber auch Histogramme erstellt werden, mit Mittelwerten für zwei Gruppen, wobei die Balken für die einzelnen Werte bzw. Wertegruppen überlagert sind.

Spätestens an dieser Stelle sollte man sich die Ausgangsvariablen mal angucken, um zu sehen, wie die verteilt ist und wo ihr Mittelwert liegt und wie sie um ihren Mittelwert streut und all das. Dafür ist es immer sinnvoll sich die Variablen als Häufigkeitsauszählung anzusehen.

## Cloak of invisibility (Cloak) <numeric> 
## # total N=24 valid N=24 mean=0.50 sd=0.51
## 
## Value |    Label |  N | Raw % | Valid % | Cum. %
## ------------------------------------------------
##     0 | No Cloak | 12 |    50 |      50 |     50
##     1 |    Cloak | 12 |    50 |      50 |    100
##  <NA> |     <NA> |  0 |     0 |    <NA> |   <NA>
## 
## Mischievous Acts (Mischief) <numeric> 
## # total N=24 valid N=24 mean=4.38 sd=1.86
## 
## Value | N | Raw % | Valid % | Cum. %
## ------------------------------------
##     0 | 1 |  4.17 |    4.17 |   4.17
##     1 | 1 |  4.17 |    4.17 |   8.33
##     2 | 2 |  8.33 |    8.33 |  16.67
##     3 | 2 |  8.33 |    8.33 |  25.00
##     4 | 5 | 20.83 |   20.83 |  45.83
##     5 | 7 | 29.17 |   29.17 |  75.00
##     6 | 4 | 16.67 |   16.67 |  91.67
##     7 | 1 |  4.17 |    4.17 |  95.83
##     8 | 1 |  4.17 |    4.17 | 100.00
##  <NA> | 0 |  0.00 |    <NA> |   <NA>

Und man sollte sich die Mittelwerte der AV (hier Mischief) und die Gruppierungsvariable (auch UV und hier Cloak) ausgeben lassen.

## # A tibble: 2 × 2
##   Cloak        Mittelwerte
##   <dbl+lbl>          <dbl>
## 1 0 [No Cloak]        3.75
## 2 1 [Cloak]           5

5.3 Mittelwertvergleich für zwei Gruppen

5.3.1 mit dem t-Test

Mit dem t-Test kann geprüft werden, ob sich die Mittelwerte der beiden Gruppen unterscheiden. Es wird ein t-Test für unabhängige Stichproben gemacht. Dabei wird die Differenz der beiden Mittelwerte berechnet und gegen die H0 getestet, dass sie 0 sein könnte, also in der GG kein Unterschied zwischen der Gruppe Cloak = 1 und der Gruppe Cloak = 0.

## 
##  Welch Two Sample t-test
## 
## data:  Mischief by Cloak
## t = -1.7135, df = 21.541, p-value = 0.101
## alternative hypothesis: true difference in means between group 0 and group 1 is not equal to 0
## 95 percent confidence interval:
##  -2.764798  0.264798
## sample estimates:
## mean in group 0 mean in group 1 
##            3.75            5.00

Der Output sagt uns, dass die Mittelwerte von Mischief aufgeteilt nach Cloak angeschaut werden. Der t-Wert unter Annahme der Nullhypothese H0 ist -1.7135 und der zugehörige p-Wert ist 0.101. Im Text steht noch, dass die Alternativhypothese lautet: Der wahre Mittelwertunterschied zwischen der 0-Gruppe und der 1-Gruppe ist nicht gleich 0. Darunter steht das 95-prozentige Konfidenzintervall der Mittelwertdifferenz. In der untersten Zeile werden die beiden Mittelwerte der beiden Gruppen nochmals ausgegeben.

5.3.2 Mit Korrelation

Wenn die Gruppenvariable eine Dummyvariable ist (also dichotom und nur aus 0 und 1 bestehend), dann kann auch eine Korrelation gerechnet werden, wobei der t-Wert dann derselbe ist, wie beim t-Test von Mittelwertvergleichen für unabhängige Stichproben.

## 
##  Pearson's product-moment correlation
## 
## data:  Invisibility$Mischief and Invisibility$Cloak
## t = 1.7135, df = 22, p-value = 0.1007
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
##  -0.06994687  0.65575942
## sample estimates:
##       cor 
## 0.3431318

Vergleichen Sie mal den t-Wert und den p-Wert der Korrelation mit dem des t-Test für Mittelwertunterschiede. Die sind (bis auf Rundungsunterschiede) identisch.

Es gibt die einfache Varianzanalyse. Dabei wird geprüft, ob die Gruppierungsvariable signifikant Varianz der AV aufklärt. Der p-Wert ist derselbe, wie oben beim t-Test und der Korrelation, weil es dieselben Daten und Variablen sind.

5.3.3 Gruppenvergleich mit Varianzanalyse


# Mache eine Varianzanalyse (Analysis of Varian (aov bzw. ANOVA)) mit einer
# UV (one.way)
one.way <- aov(Mischief ~ Cloak, data = Invisibility)

# Gib die Zusammenfassung der aov raus
summary(one.way)
##             Df Sum Sq Mean Sq F value Pr(>F)
## Cloak        1   9.38   9.375   2.936  0.101
## Residuals   22  70.25   3.193

# Berechne mal das R^2 durch die Quadratsumme (Sum Sq), die die Gruppierung
# (hier nach Cloak) aufklärt, durch die Gesamtquadratsumme (Sum Sq der Cloak + 
#der der Residuals). Dann runde auf 4 Nachkommastellen.

R2 <- round(9.38/(9.38 + 70.25),4)

# Binde das R^2 in die Ausgabe ein, einfach für später
paste0("R2 = Sum_Sq_Cloak / (Sum_Sq_Cloak + Risiduals_SumSq): ", R2," (12%)")
## [1] "R2 = Sum_Sq_Cloak / (Sum_Sq_Cloak + Risiduals_SumSq): 0.1178 (12%)"

Die Varainzanalyse prüft, ob die Mittelwerte in einer AV für jede der UV-Gruppen identisch ist. Was in der Tabelle steht, sind lauter Hilfswerte für den einen relevantenn Wert: dem p-Wert (hier “Pr(>F)). Der p-Wert ist wieder derselbe wie oben bei der Korrelation und dem Mittelwertvergleich.

5.4 Mittelwertvergleich mit Regression

Am besten kann mit einer Regression ein Mittelwertvergleich durchgeführt werden. Das $R^2$ entspricht dem Quadrat der Korrelation. Der F-Wert zum $R^2$ ist gleich dem F-Wert aus der Varianzanalyse. Der b-Wert (hier von «Cloak of invisibility») in der Regression entspricht dem Mittelwertunterschied zwischen den beiden Gruppen. Der «Intercept» entspricht dem Mittelwert der 0-Gruppe (keine Cloak). Mit der Regression kann also alles abgedeckt werden, was mit den anderen Auwertungsmethoden auch erledigt wird. Die Regression kann aber mehr!

Regression mit einer Dummmy als UV
UVs	B	std. B	se	t	p
Intercept	3.75	NA	0.516	7.270	<0.001
Cloak	1.25	0.343	0.730	1.713	0.101
$R^2$ = 0.12; adj. $R^2$ = 0.08; F = 2.94; p = 0.10

5.5 Interaktionseffekte

Werden wir mal erwachsen und schauen uns ein anderes Beispiel an, das auf eine Medienwirkgungsfrage zurück geht. Gehen wir also jetzt der Frage nach, ob gewalthaltige Videospiele antisozial machen. Dazu hat das britische Ofcom (Office of Communication) 2008 eine Studie herausgegeben [@Ofcom2008]. Für die Studie wurden 442 Jugendliche befragt. Im folgenden Chunkg wird der dazugehörige Datensatz heruntergeladen, umgewandelt und im Datenobjekt «Video_Games» gespeichert. Den analysieren wir im Folgenden. Die Variablen sind «Aggression» als Messung aggressiver Verhaltensweisen, «CaUnTs» als callous unemotional traits (affektiv-soziale defizite) und «Vid_Games» in Stunden Nutzung von Videospielen.

## # A tibble: 442 × 4
##      ID Aggression Vid_Games CaUnTs
##   <dbl>      <dbl>     <dbl>  <dbl>
## 1    69         13        16      0
## 2    55         38        12      0
## 3     7         30        32      0
## 4    96         23        10      1
## 5   130         25        11      1
## 6   124         46        29      1
## # ℹ 436 more rows

Schauen wir uns das mal genauer an:

## Warning: There was 1 warning in `mutate()`.
## ℹ In argument: `Anti_Sozial = sjmisc::rec(CaUnTs, rec = "0:10 = 1 [gering]; 11:30 = 2
##   [mittel]; 31:max = NA [hoch]")`.
## Caused by warning in `FUN()`:
## ! NAs introduced by coercion
## `geom_smooth()` using formula = 'y ~ x'

Wie man sieht gibt es die zwei Gruppen. Wenn die Tage pro Woche mit Videospielen steigt, dann steigt die Aggression kaum an. Das ist für beide Gruppen so, ber für die 2-er-Gruppe (mittleres Antisoziales Verhalten) liegen die Werte im Mittel höher. Das haben wir jetzt gesehen, aber geschätzt und getestet haben wir es noch nicht. Das geht aber gut mit der Regression.

5.6 Eine Dummy als UV

Wenn wir eine Dummyvariable als UV haben, dann haben wir es eigentlich mit einem Unterschiedstest zu tun, also einem Mittelwertvergleich. Vergleichen werden dabei die Mittelwerte der UV für zwei Gruppen. Die Gruppen wiederum werden durch in der Dummyvariable festgelegt: Die eine Gruppe (G0) hat die 0 und die andere Gruppe (G1) die 1. Es wird also die Differenz in den Y-Werten (Y_Diff) durch die Dummyvariable erklärt.

\[\begin{align} \overline{Y}_{Diff}&=\overline{Y}_{G1}-\overline{Y}_{G0}&\\ Y_i&=b_1 + b_2X_{i2}\\ Y_i&=b_1 &\text{ wenn } X_{i2}=0\\ Y_i&=b_1 + b_2 &\text{ wenn } X_{i2}=1\\ \text{Also ist:}\overline{Y}_{Diff}&=b_2\\ t&=\frac{\overline{Y}_{G1}-\overline{Y}_{G0}}{se_{\overline{Y}_{Diff}}}=\frac{b_2}{se_b} \end{align}\]

Hier ist nur «Anti_Soz_mittel» als UV im Modell.

	Agression
Predictors	b	std. b	CI	standardized CI	p
(Intercept)	30.76	-0.00	28.71 – 32.81	-0.09 – 0.09	<0.001
Callous Unemotional Traits	10.33	0.40	7.91 – 12.75	0.30 – 0.49	<0.001
Observations	381
R² / R² adjusted	0.157 / 0.155

Regression mit einer Dummy als UV

Interpretation der Regression: Der (Intercept) hat im b eine 30.76 und zeigt daher in diesem Modell an, wie gross der Mittelwert für die Referenzgruppe ist (0 für Anti_Soz_mittel «nicht mittel»). Das b für die «Callous Unemotional Traits» liegt bei 10.33. Das bedeutet, dass der Mittelwert der Gruppe Anti_Soz_mittel = 1 um 10.33 grösser ist als der Mittelwert der 0-Gruppe, also 41.09. Dieser Unterschied entspricht einem Zusammenhang von .4 als Korrelation, was an dem standardisierten b abgelesen werden kann, weil die standardisierten Regressionskoeffizienten (oft auch als BETA bezeichnet) sehr dicht an den Korrelationskoeffizienten sind. Das Konfidenzintervall für den Mittelwertunterschied liegt zwischen 7.91 und 12.75. Da 0 nicht mit im Intervall liegt, sehen wir schon, dass der Mittelwertunterschied signifikant ist. Wir sehen aber nicht nur, dass der Mittelwertunterschied signifikant von 0 verschieden ist, sondern auch, dass er signifikant von z.B. 5 verschieden ist. Wenn jetzt zum Beispiel andere Forscherinnen das Phänomen vorher schon untersucht gehabt hätten und die Mittelwertunterschied zwischen 1.93 und 4.25 gefunden hätten, dann könnten wir mit der Analyse hier sagen, dass sich die beiden Konfidenzintervalle nicht überschneiden, also unser Ergebnis signifikant von dem der anderen Forscher ist. Das geht schon in die Richtung Metaanalyse. Wenn wir nochmal in die Tabelle schauen, dann sehen wir hinten auch, dass die p-Werte unter .05 liegen, was eine Signifikanz auf dem 95%-igem Signifikanzniveau anzeigt. Das wussten wir über die CI aber auch schon vorher und da wussten wir sogar mehr!

5.6.1 Dummykodierung

Q&A: Wie viele Dummyvariablen brauchen Sie, um die volle Information einer kategorialen Variablen mit vier Ausprägungen abzubilden?

Sie brauchen 3 Dummys im Modell. Das kommt daher, dass Sie 4 Ausprägungen einer kategorialen in 4 Dummys umkodieren würden. Wenn Sie zum Beispiel die Sprachregionen der Schweiz abgefragt haben, bestünde die kategoriale Variable aus 1. Deutsch, 2. Französisch, 3. Italienisch, 4. Rätoromanisch. Da Sie nach den Sprachregionen gefragt haben, in denen die Befragten ihren Wohnsitz haben, schliessen sich die Antwortmöglichkeiten aus (sind disjunkt). Nur deshalb können Sie überhaupt in einer Variable erfasst werden. Würden Sie danach fragen, welche Sprachen die Leute verstehen, würden Sie 4 Variablen anlegen, bei der jede:r Befragte auch zwei, drei oder alle vier Sprachen angeben könnte. Jede Sprache würde durch eine Dummyvariable gekennzeichnet sein, also eine Dummy für DE, eine für FR, eine für IT und eine für RR. Jeweils hätten die eine 1, wenn die jeweilige Sprache verstandne wird und eine 0, wenn nicht. So eine Dummykodierung können Sie aber auch für die Sprachregion machen, also die kategoriale Variable in vier Dummys für die Sprachregion umkodieren, in der die Leute leben. Das können Sie durch Umkodierung machen, indem man je Sprachregion sagt:

Für die Deutschschweiz DS:

Wenn in der (kategorialen) Sprachregion eine 1 (für DS), dann in der Dummy DS eine 1, sonst immer eine 0.
Wenn in der Sprachregion eine 2 (für FS), dann in der nächsten Dummy FS eine 1, sonst immer 0.
Wenn in der Sprachregion eine 3 (für IS), dann in der nächsten Dummy IS eine 1, sonst immer 0.
Wenn in der Sprachregion eine 4 (für RRS), dann in der nächsten Dummy RRS eine 1, sonst immer 0.

Damit hätten Sie die Kategoriale in 4 Dummys umkodiert und könnten die in eine Regression integrieren. R (und kein anderes Regressionsprogramm) würde das dann berechnen, weil es eine 100% Multikollinearität zwischen den Variablen gäbe: Wenn Sie die Ausprägungen von drei der Dummys kennen, können Sie exakt sagen, welche Ausprägung die Vierte hat. Also müssen Sie in der Regression eine Dummy weglassen. Das sollte immer am besten die grösste Gruppe sein, die damit zur Referenzgruppe wird. Im Beispiel würde man also die DS rauslassen.

Antwortsatz in der Klausur: Eine kategoriale Variable mit 4 Ausprägungen wird in Form von 3 Dummyvariablen in das Modell integriert (weil sie in 4 Dummys kodiert würde und eine der Dummys weggelassen wird, die damit die Referenzkategorie darstellt).

Dummmykodierung einer kategorialen Variable mit 4 Ausprägungen
Region	Dummy_DS	Dummy_FS	Dummy_IT	Dummy_RRS
DS	1	0	0	0
FS	0	1	0	0
IS	0	0	1	0
RRS	0	0	0	1

IYI: Effektkodierung

Bei der Dummykodierung muss man immer eine Referenzkategorie rauslassen, mit der dann die b’s der Dummys verglichen werden (Mittelwertunterschied zwischen den Gruppen die in den Dummys eine 1 haben und der Referenzgruppe, wenn es keine Interaktionen gibt). Nun möchte man vielleicht nicht immer eine Gruppe raus haben und gegen die Gruppe vergleichen, sondern Aussagen darüber treffen, ob die einzelnen Gruppen signifikant über oder unter dem Gesamtdurchschnitt liegen. Das geht, indem man eine sogenannte «Effektkodierung» vornimmt.

Bei der Effektkodierung bekommt immer eine Gruppe bei allen Zugehörigen eine -1 und die anderen Gruppen eine 1. Dann werden alle Dummys in das Modell mitaufgenommen. Die b’s dieser Effektkodierten Dummys geben immmer den Abstand zum Gesamtmittelwert wieder. Sind die b’s signifikant, ist der Unterschied zum Gesamtdurchschnitt signifikant.

Effektkodierung einer kategorialen Variable mit 4 Ausprägungen
Region	Dummy_DS	Dummy_FS	Dummy_IT	Dummy_RRS
1	1	0	0	0
2	0	1	0	0
3	0	0	1	0
4	0	0	0	-1

5.7 Dummy und Covariate

Jetzt wird das Modell um eine Covariate ergänzt. Mit olsrr::ols_vif_tol(Modell3) werden die Toleranz und der VIF berechnet.

##       Variables Tolerance     VIF
## 1     Vid_Games 0.9998605 1.00014
## 2 Anti_Soz_hoch 0.9998605 1.00014

	Agression
Predictors	b	std. b	CI	standardized CI	p
(Intercept)	33.13	-0.00	29.54 – 36.73	-0.09 – 0.09	<0.001
Video Games(Hours per week)	0.23	0.13	0.07 – 0.39	0.04 – 0.21	0.004
Callous Unemotional Traits	13.65	0.37	10.51 – 16.79	0.29 – 0.46	<0.001
Observations	442
R² / R² adjusted	0.157 / 0.153

Die Toleranzwerte sind sehr hoch und daher völlig ok. Der Varianzinflationsfaktor ist fast genau 1. Es gibt also eigentlich keine Inflation der Fehlerstreuung der b’s (und allem was darauf aufbaut, wie die standardisierten Regressionskoeffizienten, Konfidenzintervalle, t-Wert zum t-Test und also auch die p-Werte). Also ist hier alles gut.

LEF 5

Essayfragen 5

E5.1 Was ist eine Dummyvariable?

E5.2 Wie viele Dummyvariablen brauchen Sie, um die volle Information einer kategorialen Variablen mit vier Ausprägungen abzubilden?

E5.3 Wie würden Sie eine kategoriale UV mit drei Ausprägungen in einer Regressionsgleichung darstellen?

E5.4 Wenn eine Kovariate in einer Regression unterschiedliche Mittelwerte für zwei Gruppen haben soll, wie würden Sie die Regressionsgleichung aufstellen?

E5.5 Was sagt in einer Regression mit einer Dummy als UV a) das $b_1$ und b) das $b_2$ aus?

E5.6 Was sagt in einer Regression mit einer Dummy und eine metrischen Variablen das $b_2$ der Dummy aus?

MC-Fragen 5

MC 5.1.

MC 5.1: Sind folgende Aussagen richtig oder falsch?

MC_5_1 = [
    ["Dummyvariablen haben immer die Ausprägungen 1 und 2.", "falsch"],
    ["In einer Regression mit einer Dummy als UV, gibt das b2 den Mittelwertunterschied der AV wieder", "richtig"],
    ["Baut man für jeder Ausprägung einer kategorialen UV eine Dummy, kann die Regression nicht berechnet werden.", "richtig"],
    ["Bei einer Regression mit einer Dummyvariablen, gibt die Konstante b1 den Mittelwert der 0-Gruppe wieder.", "richtig"]
]

viewof answers_5_1 = quizInput({
  questions: MC_5_1,
  options: ["richtig", "falsch"]
})

Punkte_5_1 = {
const Sum = 
    (answers_5_1[0] == MC_5_1[0][1])*1 + 
    (answers_5_1[1] == MC_5_1[1][1])*1 + 
    (answers_5_1[2] == MC_5_1[2][1])*1 + 
    (answers_5_1[3] == MC_5_1[3][1])*1 

var Punkte_5_1 = Sum - 2
if (Punkte_5_1 < 1) {Punkte_5_1 = 0}
return(Punkte_5_1)
}

Punkte:

MC 5.2.

MC 5.2: Sind folgende Aussagen richtig oder falsch?

MC_5_2 = [
    ["R macht aus einer kategorialen Variablen (aka Faktor) immer genausoviele Dummys, wie der Faktor Ausprägungen hat.", "falsch"],
    ["Der t-Test einer Dummyvariablen prüft, ob es einen Mittelwertunterschied zwischen den beiden Gruppen gibt.", "richtig"],
    ["Liegt der p-Wert einer Dummy über .05, ist der Mittelwertunterschied zwischen den Gruppen nicht signifikant.", "richtig"],
    ["Das BETA einer Dummyvariablen ist nicht interpretierbar.", "falsch"]
]

viewof answers_5_2 = quizInput({
  questions: MC_5_2,
  options: ["richtig", "falsch"]
})

Punkte_5_2 = {
const Sum = 
    (answers_5_2[0] == MC_5_2[0][1])*1 + 
    (answers_5_2[1] == MC_5_2[1][1])*1 + 
    (answers_5_2[2] == MC_5_2[2][1])*1 + 
    (answers_5_2[3] == MC_5_2[3][1])*1 

var Punkte_5_2 = Sum - 2
if (Punkte_5_2 < 1) {Punkte_5_2 = 0}
return(Punkte_5_2)
}

Punkte:

MC 5.3.

MC 5.3: Sind folgende Aussagen richtig oder falsch?

MC_5_3 = [
    ["Bestehen in einer Regression die UVs aus einer Dummy und zwei metrischen Variablen, ergeben sich zwei Ebenen, die sich nicht berühren.", "richtig"],
    ["In einer Regression mit einem Faktor der drei Ausprägungen hat und einer metrischen Variablen, haben die drei Gruppen unterschiedliche Anstiege.", "falsch"],
    ["Besteht eine Regression aus zwei Dummys für eine kategoriale mit drei Ausprägungen, kann Multikollinearität ausgeschlossen werden.", "falsch"],
    ["In R kann man einen Faktor einfach so in eine Regressionsgleichung tun, also z.B. lm(Y ~ Faktor, data = DATEN)", "richtig"]
]

viewof answers_5_3 = quizInput({
  questions: MC_5_3,
  options: ["richtig", "falsch"]
})

Punkte_5_3 = {
const Sum = 
    (answers_5_3[0] == MC_5_3[0][1])*1 + 
    (answers_5_3[1] == MC_5_3[1][1])*1 + 
    (answers_5_3[2] == MC_5_3[2][1])*1 + 
    (answers_5_3[3] == MC_5_3[3][1])*1 

var Punkte_5_3 = Sum - 2
if (Punkte_5_3 < 1) {Punkte_5_3 = 0}
return(Punkte_5_3)
}

Punkte:

MC 5.4.

MC 5.4: Sind folgende Aussagen richtig oder falsch?

MC_5_4 = [
    ["Hat man zwei unabhängige Dummys (zB Geschlecht und Abstimmungsteilnahme) in einem Modell, gibt es zwei Referenzkategorien.", "richtig"],
    ["Ist die AV eine Dummyvariable, gibt das b1 den Mittelwertunterschied zwischen den UV-Gruppen wieder.", "falsch"],
    ["Ist die AV eine Dummyvariable, wird in der Regel eine logistische Regression gerechnet.", "richtig"],
    ["Hat man zwei metrische Variablen als UVs, müssen sie in zwei Dummys umkodiert werden.", "falsch"]
]

viewof answers_5_4 = quizInput({
  questions: MC_5_4,
  options: ["richtig", "falsch"]
})

Punkte_5_4 = {
const Sum = 
    (answers_5_4[0] == MC_5_4[0][1])*1 + 
    (answers_5_4[1] == MC_5_4[1][1])*1 + 
    (answers_5_4[2] == MC_5_4[2][1])*1 + 
    (answers_5_4[3] == MC_5_4[3][1])*1 

var Punkte_5_4 = Sum - 2
if (Punkte_5_4 < 1) {Punkte_5_4 = 0}
return(Punkte_5_4)
}

Punkte:

MC 5.5.

MC 5.5: Sind folgende Aussagen richtig oder falsch?

MC_5_5 = [
    ['Das Simpsons-Paradox stammt von der Serie "Die Simpsons"', "falsch"],
    ["Das Simpsons-Paradox gründet auf der Unterspezifikation eines Modells.", "richtig"],
    ["Das Simpsons-Paradox erklärt, warum bei Gruppenvergleichen die Homerskedastizität keine Rolle spielt.", "falsch"],
    ["Das Simpsons-Paradox erklärt, warum man zu falschen Schlüssen kommt, wenn man Gruppenunterschiede nicht berücksichtigt", "richtig"]
]

viewof answers_5_5 = quizInput({
  questions: MC_5_5,
  options: ["richtig", "falsch"]
})

Punkte_5_5 = {
const Sum = 
    (answers_5_5[0] == MC_5_5[0][1])*1 + 
    (answers_5_5[1] == MC_5_5[1][1])*1 + 
    (answers_5_5[2] == MC_5_5[2][1])*1 + 
    (answers_5_5[3] == MC_5_5[3][1])*1 

var Punkte_5_5 = Sum - 2
if (Punkte_5_5 < 1) {Punkte_5_5 = 0}
return(Punkte_5_5)
}

Punkte:

Punkte_5_max = 10

Punkte_5_Gesamt = Punkte_5_1 + Punkte_5_2 + Punkte_5_3 + Punkte_5_4 + Punkte_5_5 

Prozent_5_Gesamt = round(100*Punkte_5_Gesamt/Punkte_5_max, 0)

Note_5_grob = round((round(Punkte_5_Gesamt/Punkte_5_max,1)*10+2)/2, 1)

Insgesamt von Punkten, was % und etwa einer entspricht.

round = (n, places) => {
  if (!places) return Math.round(n);
  const d = 10 ** places;
  return Math.round(n * d) / d;
}

function quizInput({ questions, options}) {
  let answers = questions.map(() => null);
  let root = htl.html`<div
      style="
        display: grid;
        grid-template-columns: 10% 10% 70% 10%;"
    >
      ${options.map(
        (opt) => htl.html`<div style="font-weight: bold; font-size: HUGE">${opt}</div>`
      )}
      <div style="font-weight: bold">Aussagen</div>
      <div style="font-weight: bold"></div>
      ${Array.from(questions.entries(), ([i, [question, correct]]) =>
        quizInputRow({
          question,
          options,
          correct,
          onChange: (newAnswer) => {
            answers[i] = newAnswer;
            root.value = answers;
            root.dispatchEvent(new CustomEvent("input"));
          }
        })
      )}
    </div>`;
  root.value = answers;
  return root;
}

function quizInputRow({
  question,
  options,
  correct,
  onChange = () => {}
}) {
  let root = htl.html`<div>`;

  function setAnswer(answer, initial = false) {
    morph(
      root,
      htl.html`<div style="display: contents"> 
      <form style="display: contents">
        ${options.map(
          (opt) =>
            htl.html`<label>&emsp;</label> 
            <input  
              name=${question} &emsp;
              type="radio"
              value="${opt}"
              checked=${opt === answer}
              onChange=${() => setAnswer(opt)}
            >
            </input>`
        )}
      </form>
      <div>${question}</div>
      <div> &emsp; ${
       answer === null ? "" : answer === correct ? "💚" : "❌"
      }</div>
    </div>`
    );

    root.value = answer;
    if (!initial) {
      root.dispatchEvent(new CustomEvent("input"));
      onChange(answer);
    }
  }

  setAnswer(null, true);
  return root;
}

morph = require("https://bundle.run/nanomorph@5.4.2")

MathJax = require("https://cdnjs.cloudflare.com/ajax/libs/mathjax/2.7.5/MathJax.js?config=TeX-AMS_CHTML")
  .catch(() => window.MathJax)
  .then(MathJax => {
    MathJax.Hub.Config({
      CommonHTML: { scale: 110 }, // scaling to get the same size as katex (but katex still has more spacing between lines...)
      tex2jax: { inlineMath: [["$", "$"], ["\\(", "\\)"]] },
      displayMath: [["$$", "$$"], ["\\[", "\\]"]],
      processEscapes: true,
      TeX: { extensions: ["autoload-all.js"] },
    });
    return new Promise(resolve =>
      MathJax.Hub.Register.StartupHook("End", () => resolve(MathJax))
    );
  })