Formelsammlung

Veröffentlichungsdatum

2024-03-05

Univariat

Mittelwert $\bar{x}$ und $\mu$

$\mu$ ist der Parameter «Mittelwert» in der Grundgesamtheit GG, den wir nicht kennen
$\overline{x}$ ist der Kennwert «Mittelwert» in der Stichprobe

\[\begin{align} \mu = & \frac{1}{N}\sum_i^N(x_i) \\ \overline{x} = & \frac{1}{n}\sum_i^n(x_i) \end{align}\]

Varianz und Standardabweichung

$s^2$ ist die Varianz in der Stichprobe
$s$ ist die Standardabweichung in der Stichprobe
$\sigma^2$ ist die Varianz in der GG
$\sigma$ ist die Standardabweichung in der GG

\[\begin{align} s^2 = V = & \frac{1}{n} \sum_i^n(x_i-\overline{x})^2 \\ s = & \sqrt{\frac{1}{n} \sum_i^n(x_i-\overline{x})^2}\\ \hat{\sigma}^2 = & \frac{1}{n-1} \sum_i^n(x_i-\overline{x})^2\\ \hat{\sigma} = & \sqrt{\frac{1}{n-1} \sum_i^n(x_i-\overline{x})^2}\\ \end{align}\]

Standardfehler

der Standardfehler $s_\overline{x}$ (oder auch standard error se) ist die Standardabweichung von X geteilt durch die Wurzeln der Stichprobenfallzahl

\[\begin{align} s_{\bar{x}} = & \frac{s_x}{\sqrt{n}} \end{align}\]

z-Transformation

\[\begin{align} z_i= &\frac{x_i-\overline{x}}{s} \label{eq:z-Transformation} \end{align}\]

Konfidenzintervalle der Mittelwerte

\[\begin{align} \text{ KI:}& \overline{X}\pm z_1 \cdot se \label{eq:Konfidenz-Intervall-1}\\ \text{KI:}& \overline{X}\pm z_1 \cdot \frac{s_x}{\sqrt{n}} \label{eq:Konfidenz-Intervall-2}\\ \text{KI}_{l.05} =& \overline{x} - 1.96 \cdot \frac{s_x}{\sqrt{n}} \label{eq:Konfidenz-Intervall-3}\\ \text{KI}_{r.05} =& \overline{x} + 1.96 \cdot \frac{s_x}{\sqrt{n}}\label{eq:Konfidenz-Intervall-4} \end{align}\]

Bivariat

Kovarianz und Korrelation

$cov$ bzw. $C$ ist die Kovarianz (die Kovarianz zwischen $Y$ und einer UV $X_2$ würde man als $C_{Y2} schreiben.)
$r$ ist die Korrelation nach Pearson.

\[\begin{align} cov = C = & \frac{1}{n}\sum_i^n(x_i-\overline{x}) (y_i-\overline{y}) \label{eq:Covarianz} \\ r = & \frac{\sum_i^n(x_i-\overline{x}) (y_i-\overline{y})}{n \cdot s_x \cdot s_y} \label{eq:Korrelation} \end{align}\]

Bivariate Regression

\[\begin{align} Y_i & = \overline{Y} + e_i \label{eq:Mittelwert-Modell} \\ Y_i & = b_1 + b_2X_i + e_i \label{eq:Regressions-gleichung} \\ \hat{Y_i} & = b_1 + b_2X_i \label{eq:Regressions-Modell} \\ Y_i & = \hat{Y_i}+e_i \label{eq:Varianz-Modell-Residuum} \end{align}\]

Multivariate Regression

Das Basismodell

Das theoretische Modell:

\[ Y_i = \beta_1 + \beta_2X_{i2} + \beta_3X_{i3} + U_i \]

Das Stichprobenmodell:

\[ Y_i = b_1 + b_2X_{i2} + b_3X_{i3}+e_i \]

Die b’s

\[\begin{align} b_2 & = \frac{r_{y2}-r_{23}r_{y3}}{(1-R_{2.3}^2)}\frac{s_y}{s_2} \end{align}\]

BETAs

\[\begin{align} BETA = b\cdot\frac{s_X}{s_Y} = r_{YX} \end{align}\]

$R^2$

\[\begin{align} R^2 & = \frac{SS_M/n}{SS_T/n} \end{align}\]

$R^2_{adj.}$

$R^2_{adj.} = R^2\cdot\frac{n-k-1}{n-1}$

Die Residuen

\[\begin{align} e_i= & Y_i-\hat{Y}_i=Y_i-b_1-b_2 X_{i 2}-b_3 X_{i 3} \end{align}\]

Standardfehler der Regressionskoeffizienten b

Hier im Beispiel für $b_2$.

\[\begin{align} s_{b_2}^2&=\frac{s^2}{n} \frac{1 / s^2_2}{1-R_{2.3}^2} \end{align}\]

mit $s^2$:

\[\begin{align} s^2=\frac{1}{n-3} \sum\left(e_i-\bar{e}\right)^2=\frac{1}{n-3} \sum e_i^2 \end{align}\]

und $s_{b_3}$ entsprechend:

\[\begin{align} s_{b_3}^2=\frac{s^2}{n} \frac{1 / V_3}{1-r_{23}^2} \end{align}\]

Erwartungstreue $b_2$

\[\begin{align} E\left(b_2\right)=&\beta_2+\frac{V_3 E\left(C_{2 U}\right)}{D}-\frac{C_{23} E\left(C_{3 U}\right)}{D}, \end{align}\]

Toleranz (TOL)

\[\begin{align} TOL_{b_2} &=1-R_{2.3}^2 \label{eq:TOL2}\\ TOL_{b_3} &=1-R_{3.2}^2 \label{eq:TOL3} \end{align}\]

Varianz-Inflationsfaktor (VIF)

\[\begin{align} VIF_{b_2} = \frac{1}{TOL_{b_2}} &=\frac{1}{1-R_{2.3}^2} \label{eq:VIF2}\\ VIF_{b_3} = \frac{1}{TOL_{b_3}} &=\frac{1}{1-R_{3.2}^2} \label{eq:VIF3} \end{align}\]