Formelsammlung

Veröffentlichungsdatum

2024-03-05

Univariat

Mittelwert \(\bar{x}\) und \(\mu\)

  • \(\mu\) ist der Parameter «Mittelwert» in der Grundgesamtheit GG, den wir nicht kennen
  • \(\overline{x}\) ist der Kennwert «Mittelwert» in der Stichprobe

\[\begin{align} \mu = & \frac{1}{N}\sum_i^N(x_i) \\ \overline{x} = & \frac{1}{n}\sum_i^n(x_i) \end{align}\]

Varianz und Standardabweichung

  • \(s^2\) ist die Varianz in der Stichprobe
  • \(s\) ist die Standardabweichung in der Stichprobe
  • \(\sigma^2\) ist die Varianz in der GG
  • \(\sigma\) ist die Standardabweichung in der GG

\[\begin{align} s^2 = V = & \frac{1}{n} \sum_i^n(x_i-\overline{x})^2 \\ s = & \sqrt{\frac{1}{n} \sum_i^n(x_i-\overline{x})^2}\\ \hat{\sigma}^2 = & \frac{1}{n-1} \sum_i^n(x_i-\overline{x})^2\\ \hat{\sigma} = & \sqrt{\frac{1}{n-1} \sum_i^n(x_i-\overline{x})^2}\\ \end{align}\]

Standardfehler

  • der Standardfehler \(s_\overline{x}\) (oder auch standard error se) ist die Standardabweichung von X geteilt durch die Wurzeln der Stichprobenfallzahl

\[\begin{align} s_{\bar{x}} = & \frac{s_x}{\sqrt{n}} \end{align}\]

z-Transformation

\[\begin{align} z_i= &\frac{x_i-\overline{x}}{s} \label{eq:z-Transformation} \end{align}\]

Konfidenzintervalle der Mittelwerte

\[\begin{align} \text{ KI:}& \overline{X}\pm z_1 \cdot se \label{eq:Konfidenz-Intervall-1}\\ \text{KI:}& \overline{X}\pm z_1 \cdot \frac{s_x}{\sqrt{n}} \label{eq:Konfidenz-Intervall-2}\\ \text{KI}_{l.05} =& \overline{x} - 1.96 \cdot \frac{s_x}{\sqrt{n}} \label{eq:Konfidenz-Intervall-3}\\ \text{KI}_{r.05} =& \overline{x} + 1.96 \cdot \frac{s_x}{\sqrt{n}}\label{eq:Konfidenz-Intervall-4} \end{align}\]

Bivariat

Kovarianz und Korrelation

  • \(cov\) bzw. \(C\) ist die Kovarianz (die Kovarianz zwischen \(Y\) und einer UV \(X_2\) würde man als $C_{Y2} schreiben.)
  • \(r\) ist die Korrelation nach Pearson.

\[\begin{align} cov = C = & \frac{1}{n}\sum_i^n(x_i-\overline{x}) (y_i-\overline{y}) \label{eq:Covarianz} \\ r = & \frac{\sum_i^n(x_i-\overline{x}) (y_i-\overline{y})}{n \cdot s_x \cdot s_y} \label{eq:Korrelation} \end{align}\]

Bivariate Regression

\[\begin{align} Y_i & = \overline{Y} + e_i \label{eq:Mittelwert-Modell} \\ Y_i & = b_1 + b_2X_i + e_i \label{eq:Regressions-gleichung} \\ \hat{Y_i} & = b_1 + b_2X_i \label{eq:Regressions-Modell} \\ Y_i & = \hat{Y_i}+e_i \label{eq:Varianz-Modell-Residuum} \end{align}\]

Multivariate Regression

Das Basismodell

Das theoretische Modell:

\[ Y_i = \beta_1 + \beta_2X_{i2} + \beta_3X_{i3} + U_i \]

Das Stichprobenmodell:

\[ Y_i = b_1 + b_2X_{i2} + b_3X_{i3}+e_i \]

Die b’s

\[\begin{align} b_2 & = \frac{r_{y2}-r_{23}r_{y3}}{(1-R_{2.3}^2)}\frac{s_y}{s_2} \end{align}\]

BETAs

\[\begin{align} BETA = b\cdot\frac{s_X}{s_Y} = r_{YX} \end{align}\]

\(R^2\)

\[\begin{align} R^2 & = \frac{SS_M/n}{SS_T/n} \end{align}\]

\(R^2_{adj.}\)

\(R^2_{adj.} = R^2\cdot\frac{n-k-1}{n-1}\)

Die Residuen

\[\begin{align} e_i= & Y_i-\hat{Y}_i=Y_i-b_1-b_2 X_{i 2}-b_3 X_{i 3} \end{align}\]

Standardfehler der Regressionskoeffizienten b

Hier im Beispiel für \(b_2\).

\[\begin{align} s_{b_2}^2&=\frac{s^2}{n} \frac{1 / s^2_2}{1-R_{2.3}^2} \end{align}\]

mit \(s^2\):

\[\begin{align} s^2=\frac{1}{n-3} \sum\left(e_i-\bar{e}\right)^2=\frac{1}{n-3} \sum e_i^2 \end{align}\]

und \(s_{b_3}\) entsprechend:

\[\begin{align} s_{b_3}^2=\frac{s^2}{n} \frac{1 / V_3}{1-r_{23}^2} \end{align}\]

Erwartungstreue \(b_2\)

\[\begin{align} E\left(b_2\right)=&\beta_2+\frac{V_3 E\left(C_{2 U}\right)}{D}-\frac{C_{23} E\left(C_{3 U}\right)}{D}, \end{align}\]

Toleranz (TOL)

\[\begin{align} TOL_{b_2} &=1-R_{2.3}^2 \label{eq:TOL2}\\ TOL_{b_3} &=1-R_{3.2}^2 \label{eq:TOL3} \end{align}\]

Varianz-Inflationsfaktor (VIF)

\[\begin{align} VIF_{b_2} = \frac{1}{TOL_{b_2}} &=\frac{1}{1-R_{2.3}^2} \label{eq:VIF2}\\ VIF_{b_3} = \frac{1}{TOL_{b_3}} &=\frac{1}{1-R_{3.2}^2} \label{eq:VIF3} \end{align}\]