Formelsammlung
Univariat
Mittelwert \(\bar{x}\) und \(\mu\)
- \(\mu\) ist der Parameter «Mittelwert» in der Grundgesamtheit GG, den wir nicht kennen
- \(\overline{x}\) ist der Kennwert «Mittelwert» in der Stichprobe
\[\begin{align} \mu = & \frac{1}{N}\sum_i^N(x_i) \\ \overline{x} = & \frac{1}{n}\sum_i^n(x_i) \end{align}\]
Varianz und Standardabweichung
- \(s^2\) ist die Varianz in der Stichprobe
- \(s\) ist die Standardabweichung in der Stichprobe
- \(\sigma^2\) ist die Varianz in der GG
- \(\sigma\) ist die Standardabweichung in der GG
\[\begin{align} s^2 = V = & \frac{1}{n} \sum_i^n(x_i-\overline{x})^2 \\ s = & \sqrt{\frac{1}{n} \sum_i^n(x_i-\overline{x})^2}\\ \hat{\sigma}^2 = & \frac{1}{n-1} \sum_i^n(x_i-\overline{x})^2\\ \hat{\sigma} = & \sqrt{\frac{1}{n-1} \sum_i^n(x_i-\overline{x})^2}\\ \end{align}\]
Standardfehler
- der Standardfehler \(s_\overline{x}\) (oder auch standard error se) ist die Standardabweichung von X geteilt durch die Wurzeln der Stichprobenfallzahl
\[\begin{align} s_{\bar{x}} = & \frac{s_x}{\sqrt{n}} \end{align}\]
z-Transformation
\[\begin{align} z_i= &\frac{x_i-\overline{x}}{s} \label{eq:z-Transformation} \end{align}\]
Konfidenzintervalle der Mittelwerte
\[\begin{align} \text{ KI:}& \overline{X}\pm z_1 \cdot se \label{eq:Konfidenz-Intervall-1}\\ \text{KI:}& \overline{X}\pm z_1 \cdot \frac{s_x}{\sqrt{n}} \label{eq:Konfidenz-Intervall-2}\\ \text{KI}_{l.05} =& \overline{x} - 1.96 \cdot \frac{s_x}{\sqrt{n}} \label{eq:Konfidenz-Intervall-3}\\ \text{KI}_{r.05} =& \overline{x} + 1.96 \cdot \frac{s_x}{\sqrt{n}}\label{eq:Konfidenz-Intervall-4} \end{align}\]
Bivariat
Kovarianz und Korrelation
- \(cov\) bzw. \(C\) ist die Kovarianz (die Kovarianz zwischen \(Y\) und einer UV \(X_2\) würde man als $C_{Y2} schreiben.)
- \(r\) ist die Korrelation nach Pearson.
\[\begin{align} cov = C = & \frac{1}{n}\sum_i^n(x_i-\overline{x}) (y_i-\overline{y}) \label{eq:Covarianz} \\ r = & \frac{\sum_i^n(x_i-\overline{x}) (y_i-\overline{y})}{n \cdot s_x \cdot s_y} \label{eq:Korrelation} \end{align}\]
Bivariate Regression
\[\begin{align} Y_i & = \overline{Y} + e_i \label{eq:Mittelwert-Modell} \\ Y_i & = b_1 + b_2X_i + e_i \label{eq:Regressions-gleichung} \\ \hat{Y_i} & = b_1 + b_2X_i \label{eq:Regressions-Modell} \\ Y_i & = \hat{Y_i}+e_i \label{eq:Varianz-Modell-Residuum} \end{align}\]
Multivariate Regression
Das Basismodell
Das theoretische Modell:
\[ Y_i = \beta_1 + \beta_2X_{i2} + \beta_3X_{i3} + U_i \]
Das Stichprobenmodell:
\[ Y_i = b_1 + b_2X_{i2} + b_3X_{i3}+e_i \]
Die b’s
\[\begin{align} b_2 & = \frac{r_{y2}-r_{23}r_{y3}}{(1-R_{2.3}^2)}\frac{s_y}{s_2} \end{align}\]
BETAs
\[\begin{align} BETA = b\cdot\frac{s_X}{s_Y} = r_{YX} \end{align}\]
\(R^2\)
\[\begin{align} R^2 & = \frac{SS_M/n}{SS_T/n} \end{align}\]
\(R^2_{adj.}\)
\(R^2_{adj.} = R^2\cdot\frac{n-k-1}{n-1}\)
Die Residuen
\[\begin{align} e_i= & Y_i-\hat{Y}_i=Y_i-b_1-b_2 X_{i 2}-b_3 X_{i 3} \end{align}\]
Standardfehler der Regressionskoeffizienten b
Hier im Beispiel für \(b_2\).
\[\begin{align} s_{b_2}^2&=\frac{s^2}{n} \frac{1 / s^2_2}{1-R_{2.3}^2} \end{align}\]
mit \(s^2\):
\[\begin{align} s^2=\frac{1}{n-3} \sum\left(e_i-\bar{e}\right)^2=\frac{1}{n-3} \sum e_i^2 \end{align}\]
und \(s_{b_3}\) entsprechend:
\[\begin{align} s_{b_3}^2=\frac{s^2}{n} \frac{1 / V_3}{1-r_{23}^2} \end{align}\]
Erwartungstreue \(b_2\)
\[\begin{align} E\left(b_2\right)=&\beta_2+\frac{V_3 E\left(C_{2 U}\right)}{D}-\frac{C_{23} E\left(C_{3 U}\right)}{D}, \end{align}\]
Toleranz (TOL)
\[\begin{align} TOL_{b_2} &=1-R_{2.3}^2 \label{eq:TOL2}\\ TOL_{b_3} &=1-R_{3.2}^2 \label{eq:TOL3} \end{align}\]
Varianz-Inflationsfaktor (VIF)
\[\begin{align} VIF_{b_2} = \frac{1}{TOL_{b_2}} &=\frac{1}{1-R_{2.3}^2} \label{eq:VIF2}\\ VIF_{b_3} = \frac{1}{TOL_{b_3}} &=\frac{1}{1-R_{3.2}^2} \label{eq:VIF3} \end{align}\]