14  Besprechung der LEF

Veröffentlichungsdatum

2024-03-05

Unter dem Video (Kommentarbereich) finden Sie ein Inhaltsverzeichnis, mit dem Sie schneller die LEF finden, zu denen Sie sich die Besprechung nochmal anschauen möchten. Wenn Sie Fragen haben, dann gerne wieder im Forum.

Fehler: Bei Essayaufgabe 5.6 behaupt ich, dass das \(b_2\) den Anstieg der beiden parallelen Geraden festlegt (im Video 55:15). Das ist aber falsch, wenn das \(b_2\) zur Dummyvariablen gehören soll. Dann ist es nämlich der Mittelwertunterschied zwischen den beiden Gruppen, die durch die Dummy bestimmt werden (0-Gruppe und 1-Gruppe). Was ich erzählt habe, stimmt, wenn das \(b_2\) zur metrischen gehört.

Sie bekommen an der Klausur die Formelsammlung als ein Blatt Papier mit allen relevanten Formeln auf einer Seite:

Die Formelsammlung

Die Formelsammlung

LEF 1

Essayfragen

  1. Was ist der Unterschied zwischen unstandardisierten und standardisierten Kennwerten?

  2. Welche Masse der zentralen Tendenz kennen Sie?

  3. Welche Streumasse kennen Sie?

  4. Was kommt raus, wenn man die Covarianz einer Variablen mit sich selbst berechnet?

    1. Welche Skalenniveaus kennen Sie?

    2. Was macht eine Nominalskala aus?

    3. Was macht eine metrische Skala aus?

MC-Fragen

MC 1.1.

MC 1.1: Sind folgende Aussagen richtig oder falsch?

Punkte:

MC 1.2.

MC 1.2: Sind folgende Aussagen richtig oder falsch?

Punkte:

MC 1.3.

MC 1.3: Sind folgende Aussagen richtig oder falsch?

Punkte:

MC 1.4.

MC 1.4: Sind folgende Aussagen richtig oder falsch?

Punkte:

MC 1.5.

MC 1.5: Sind folgende Aussagen richtig oder falsch?

Punkte:

MC 1.6.

MC 1.6: Sind folgende Aussagen richtig oder falsch?

Punkte:

Für die MC der LEF 1: von Punkten, was % und etwa einer entspricht.

LEF 2

Essayfragen 2

E2.1 Wie ist die Korrelation definiert?

E2.2 Was ist das Analyseziel einer Regression?

E2.3 Wie sind die Regressionskoeffizienten gekennzeichnet? (Welcher Buchstabe)

E2.4 Was ist der Unterschied zwischen BETA und \(\beta\)?

E2.5 Was drückt der Standardfehler der Regressionskoeffizienten b aus?

E2.6 Mit welchen Kennwerten kann die Modellgüte insgesamt bewertet werden?

E2.7 Was ist a) \(R^2_{adj.}\) und b) wann würde man es verwenden?

E2.8 Was sagt die Signifikanz des F-Tests für ein Regressionsmodell aus?

MC-Fragen 2

MC 2.1.

MC 2.2: Sind folgende Aussagen richtig oder falsch?

Punkte:

MC 2.2.

MC 2.2: Sind folgende Aussagen richtig oder falsch?

Punkte:

MC 2.3.

MC 2.3: Sind folgende Aussagen richtig oder falsch?

Punkte:

MC 2.4.

MC 2.4: Sind folgende Aussagen richtig oder falsch?

Punkte:

MC 2.5.

MC 2.5: Sind folgende Aussagen richtig oder falsch?

Punkte:

MC 2.6.

MC 2.6: Sind folgende Aussagen richtig oder falsch?

Punkte:

Für LEF 2: von Punkten, was % und etwa einer entspricht.

LEF 3

Essayfragen 3

E3.1 Welches sind die Voraussetzungen für die Schätzung von Regressionen?

E3.2 Was bedeutet «Bias»?

E3.3 Was sagt Ihnen der Toleranzwert TOL?

E3.4 Was bedeutet Multikollinearität?

E3.5 Welche Kennwerte kennen Sie, mit denen Sie Multikollinearität abschätzen können?

E3.6 Wie reagieren a) p-Werte und b) Konfidenzintervalle auf Multikolliniearität?

E3.7 Warum kann man die volle Modellspezifikation nicht überprüfen?

E3.8 Was haben Theoriearbeit und Modellspezifikation miteinander zu tun?

E3.9 Was bedeutet es, dass die Variablen fix sein sollen?

MC-Fragen 3

MC 3.1.

MC 3.1: Sind folgende Aussagen richtig oder falsch?

Punkte:

MC 3.2.

MC 3.2: Sind folgende Aussagen richtig oder falsch?

Punkte:

MC 3.3.

MC 3.3: Sind folgende Aussagen richtig oder falsch?

Punkte:

MC 3.4.

MC 3.4: Sind folgende Aussagen richtig oder falsch?

Punkte:

MC 3.5.

MC 3.5: Sind folgende Aussagen richtig oder falsch?

Punkte:

MC 3.6.

MC 3.6: Sind folgende Aussagen richtig oder falsch?

Punkte:

Insgesamt von Punkten, was % und etwa einer entspricht.

LEF 5

Essayfragen 5

E5.1 Was ist eine Dummyvariable?

E5.2 Wie viele Dummyvariablen brauchen Sie, um die volle Information einer kategorialen Variablen mit vier Ausprägungen abzubilden?

E5.3 Wie würden Sie eine kategoriale UV mit drei Ausprägungen in einer Regressionsgleichung darstellen?

E5.4 Wenn eine Kovariate in einer Regression unterschiedliche Mittelwerte für zwei Gruppen haben soll, wie würden Sie die Regressionsgleichung aufstellen?

E5.5 Was sagt in einer Regression mit einer Dummy als UV a) das \(b_1\) und b) das \(b_2\) aus?

E5.6 Was sagt in einer Regression mit einer Dummy und eine metrischen Variablen das \(b_2\) der Dummy aus?

MC-Fragen 5

MC 5.1.

MC 5.1: Sind folgende Aussagen richtig oder falsch?

Punkte:

MC 5.2.

MC 5.2: Sind folgende Aussagen richtig oder falsch?

Punkte:

MC 5.3.

MC 5.3: Sind folgende Aussagen richtig oder falsch?

Punkte:

MC 5.4.

MC 5.4: Sind folgende Aussagen richtig oder falsch?

Punkte:

MC 5.5.

MC 5.5: Sind folgende Aussagen richtig oder falsch?

Punkte:

Insgesamt von Punkten, was % und etwa einer entspricht.

LEF 6

Essayfragen 6

E6.1 Was ist eine Slope-Dummy-Variable?

E6.2 Wenn Sie die Hypothese haben, dass der Nachrichtenfaktor «Personalsierung» stärker wirkt, je älter die Befragten sind, wie würden Sie das Regressionsmodell formulieren (Gleichung)? Sie können auch die Modellschreibweise von R verwenden, also lm().

E6.3 Warum ist beim Rechnen mit Slope-Dummys die Multikollinearität ein besonderes Problem? Wie können Sie das bei Slope-Dummys (und nur hier) lösen?

E6.4 Zeichnen Sie ein typisches Beispiel für einen Zusammenhang, den man mit einer Slope-Dummy modellieren würde. (Tipp: Es braucht ein Koordinatensystem und dann zeichnen Sie da Punkte mit unterschiedlichen Farben und Regressionsgeraden rein.)

E6.5 (war fast wie 6.3 und wurde mit ihr zusammengelegt)

E6.6 Wie bilden Sie in R eine Slope-Dummy (Interaktion zwischen einer Dummy und einer Metrischen)

MC-Fragen 6

MC 6.1.

MC 6.1: Sind folgende Aussagen richtig oder falsch?

Punkte:

MC 6.2.

MC 6.2: Sind folgende Aussagen richtig oder falsch?

Punkte:

MC 6.3.

MC 6.3: Sind folgende Aussagen richtig oder falsch?

Punkte:

MC 6.4.

MC 6.4: Sind folgende Aussagen richtig oder falsch?

Punkte:

MC 6.5.

MC 6.5: Sind folgende Aussagen richtig oder falsch?

Punkte:

Insgesamt von Punkten, was % und etwa einer entspricht.

LEF 8

Essayfragen 8

E8.1 Bitte schauen Sie sich die folgenden drei (mistigen) Tabellen an, die aus fiktiven Publikationen stammen. Jedes mal werden die Koeffizienten als «beta» bezeichnet, aber es könnten nur die unstandardisierten Regressionskoeffizienten b sein oder die standardisierten Regressionskoeffizienten std. b. Was ist wohl was? a) Begründen Sie Ihre Entscheidung! b) Eklären Sie, warum es nicht \(\beta\)s sein können.

Essayfragen 8.2-8.3

E8.2 Schreiben Sie zu jedem der folgenden Schlagworte in ganzen Sätzen auf, zu welchen Zwecken Faktorenanalysen alles eingesetzt werden können: a) latente Variablen entdecken b) Multikollinearität c) Indices d) Messung latenter Konstrukte

E8.3 a) Erklären Sie, was Faktorladungen sind. b) Wie gehen Sie vor, wenn Sie Faktorladungen interpretieren wollen?

Essayfragen 8.4-8.10

Lesen Sie @song2004 und beantworten Sie dann folgende Fragen und die anschliessenden MCs.

E8.4 Was wird mit Cronbachs \(\alpha\) beschrieben?

E8.5 Was für eine Faktorenanalyse haben Song et al durchgeführt?

E8.6 Mit welcher Methoden wurden die Faktoren rotiert?

E8.7 Wie viele initiale Faktoren hat die Faktorenanalyse herausgegeben?

E8.8 a) Nach welchen Kriterien wurden die Faktoren ausgewählt? b) Wie bewerten Sie das Vorgehen?

E8.9 a) Wie viele Items (Fragen) wurden mit der Faktorenanalyse ausgewertet? b) Auf wie viele Faktoren wurden die Items reduziert?

E8.10 Wie viel Varianz erklären die Faktoren, die von Song et al ausgewählt wurden?

MC-Fragen 8

MC 8.1.

MC 8.1: Was sagen die Zahlen im Text von @song2004?

Punkte:

MC 8.2.

MC 8.2: Was sagen die Zahlen im Text von @song2004?

Punkte:

MC 8.3.

MC 8.3: Was sagen die Zahlen im Text von @song2004?

Punkte:

MC 8.4.

MC 8.4: Was sagen die Zahlen im Text von @song2004?

Punkte:

MC 8.5.

MC 8.6: Was ist im Kontext der Faktorenanalyse richtig und was ist falsch?

Punkte:

MC 8.6.

MC 8.6: Was ist im Kontext der Faktorenanalyse richtig und was ist falsch?

Punkte:

Insgesamt (nur MCs) von Punkten, was % und etwa einer entspricht.

LEF 10

Essayfragen 10

E10.1 Was bedeuten die Exp(B) in der logistischen Regression?

E10.2 Wenn eine AV aus einer kategorialen Variable besteht mit drei Ausprägungen. Was muss man dann als Analyse damit machen?

E10.3 Die Voraussetzungen für eine normale Regression gelten auch bei der logistischen. Nennen Sie eine darüber hinausgehende Voraussetzung.

E10.4 Was bedeutet es, wenn ein Exp(B) einer logistischen Regression fast 0 ist?

E10.5 Wenn in einer Analyse die Wahlteilnahme die AV und die Frage, ob jemand Nachrichten konsumiert die UV ist, wie interpretieren Sie dann ein zugehöriges EXP(B) von 2?

E10.6 Schreiben Sie als Formel oder frei in Ihren Worten auf, was die ODDS-Ratio bedeutet.

E10.7 Was verbirgt sich hinter der Abkürzung «ML»?

E10.8 Wenn man in einem ML für das Trainingsmaterial nur einen Teil (sagen wir 70%) der gesammelten Daten nimmt, sind dann die b’s nicht verzerrt? Begründen Sie Ihre Antwort. Wenn sie es nicht sind, warum nimmt man dann nicht immer nur 70% der Daten? Das wäre doch billiger?

MC-Fragen 10

MC 10.1.

MC 10.1: Sind folgende Aussagen richtig oder falsch?

Punkte:

MC 10.2.

MC 10.2: Sind folgende Aussagen richtig oder falsch?

Punkte:

MC 10.3.

MC 10.3: Sind folgende Aussagen richtig oder falsch?

Punkte:

MC 10.4.

MC 10.4: Sind folgende Aussagen richtig oder falsch?

Punkte:

MC 10.5.

MC 10.5: Sind folgende Aussagen richtig oder falsch?

Punkte:

MC 10.6.

MC 10.6: Mal was zu R?

Punkte:

Insgesamt von Punkten, was % und etwa einer entspricht.

LEF 12

Essayfragen 12

E12.1 a) Was ist das Ziel einer Clusteranalyse? b) Was ist der Unterschied zu einer Faktorenanalyse?

E12.2 Welches Skalenniveau wird benötigt, wenn bei einer Clusteranalyse «Clusterzentren» berechnet werdenn sollen?

E12.3 Wie ist der grobe Ablauf einer k-means-Clusteranalyse?

E12.4 Warum werden Clusteranalysen im Kontext von ML als «unsupervised learning» bezeichnet?

E12.5 Warum kann man nicht einfach sagen, dass die Clusterlösung mit der kleinsten Heterogenität (mittlere Distanz zu Clusterzentren) die beste Lösung ist?

E12.6 Warum werden oft Faktorenanalysen vor den Clusteranalysen durchgeführt?

E12.7 Was verbirgt sich hinter der Abkürzung «ML»?

E12.8 Wozu dient bei einer Clusteranalyse das «Ellbogenkriterium»?

E12.9 Warum sind hierarchische Clusteranalysen für Big Data oder zum Beispiel Bildanalysen ungeeignet?

E12.10 NEU Bringen Sie die folgenden Ablaufschritte einer hierarchischen Clusteranalyse in die richtige Reihenfolge:

  • Clusteralgorithmus wählen (single linkage)
  • Anzahl Cluster bestimmen (zB mit Dendrogramm)
  • Clustervariable(n) festlegen
  • jedem Fall ein Cluster bauen
  • den letzten Schritt so lange tun, bis es nur noch ein Cluster gibt
  • zwei Cluster zusammenlegen
  • Clusterlösung interpretieren

MC-Fragen 12

MC 12.1.

MC 12.1: Sind folgende Aussagen richtig oder falsch?

Punkte:

MC 12.2.

MC 12.2: Sind folgende Aussagen richtig oder falsch?

Punkte:

MC 12.3.

MC 12.3: Sind folgende Aussagen richtig oder falsch?

Punkte:

MC 12.4.

MC 12.4: Sind folgende Aussagen richtig oder falsch?

Punkte:

MC 12.5.

MC 12.5: Sind folgende Aussagen richtig oder falsch?

Punkte:

MC 12.6.

MC 12.6: Mal was zu R?

Punkte:

Insgesamt von Punkten, was % und etwa einer entspricht.

Für alle MC der LEF: von Punkten, was % und etwa einer entspricht.