發表文章

目前顯示的是 8月, 2023的文章

(統計)(敘述統計) 變異數與標準差

1.未分組資料 母體變異數 $\sigma^2=\cfrac{\displaystyle\sum_{i=1}^{n}(X_i-\mu)^2}{N}$ 母體標準差 $\sigma=\sqrt{\sigma^2} $ 樣本變異數 $S^2=\cfrac{\displaystyle\sum_{i=1}^{n}(X_i-\mu)^2}{n-1}$ 樣本標準差 $S=\sqrt{S^2} $ 2.已分組資料 組中點 $m_i,\ i=1,\cdots,k$  ,次數 $f_i,\ i=1,\cdots,k$ 母體變異數 $\sigma^2=\cfrac{\displaystyle\sum_{i=1}^{k}f_i(m_i-\mu)^2}{N}$ 母體標準差 $\sigma=\sqrt{\sigma^2} $ 樣本變異數 $\sigma^2=\cfrac{\displaystyle\sum_{i=1}^{k}f_i(m_i-\overline{X} )^2}{n-1}=\cfrac{\displaystyle\sum_{i=1}^{k}f_i m_i^2-n\overline{X}^2}{n-1}$ 樣本標準差 $S=\sqrt{S^2} $

(統計)(敘述統計)偏態係數(skewness coefficinet),峰態係數(kurtosis coefficinet)

圖片
偏態係數(skewness coefficinet) $\alpha_1=\cfrac{\frac{\displaystyle\sum_{i=1}^{N}(X_i-\mu)^3}{N}}{\sigma^3}$ $\alpha_1= $$\left\{ \begin{array}{c}  >0,右偏 \\ =0,對稱 \\  <0,左偏 \end{array} \right.  $

(統計)(敘述統計) 經驗法則

 若資料分布呈現對稱鐘形時使用。 1.$68\%$資料落在$(\mu-\sigma,\mu+\sigma)$之間。 2.$95\%$資料落在$(\mu-2\sigma,\mu+2\sigma)$之間。 3.$99.7\%$資料落在$(\mu-3\sigma,\mu+3\sigma)$之間。 常和柴比雪夫不等式比較使用,柴比雪夫不等式不用規定資料分布對稱鐘形。

(統計)(集合論) 差集

圖片
 $A-B$ :A之中除去B的部分之集合。 $A-B\equiv A \cap B^{\ c}$

(統計) (敘述統計) 截尾平均數 (Trimmed Mean)

Step1. 計算 $Q_1$ 和 $Q_3$。 Step2. 刪除資料$\lt Q_1$ 和資料 $\gt Q_3$。 Step3. 剩餘資料計算算術平均數。 優點:刪去離群值。 缺點:丟失一半資訊。

(迴歸)簡單迴歸分析

模型: $Y_i=\beta_0+ \beta_1X_i+\varepsilon_i$ 假設:$\varepsilon_i \stackrel{iid}{\sim}N(0,\sigma^2)$ 1.常態性 2.變異數齊一性 3.獨立 4.$E(\varepsilon_i)=0$ 5.模型之正確性 $\beta_0+ \beta_1X_i$ is constant. $Y_i$ is r.v. 母體迴歸線: $E(Y\vert X)=E(Y)=\beta_0+\beta_1X$ 因為$X$為已知常數 $\implies E(Y\vert X)=E(Y)$ 樣本迴歸線:  $\hat{Y_i}=\hat{\beta_0}+\hat{\beta_1}X_i$ 樣本迴歸線估計母體迴歸線  $\hat{Y_i}$ 估計$E(Y_i)$,$\hat{\beta_0}$估計$\beta_0$,$\hat{\beta_1}$估計$\beta_1$ $e_i=Y_i-\hat{Y_i}$ 估計 $\varepsilon_i$ $\hat{\sigma^2}=\cfrac{SSE}{n-2}=MSE$ 最小平方法OLS $min\displaystyle\sum_{i=1}^{n}e_i^2=min\displaystyle\sum_{i=1}^{n}(Y_i-\hat{Y_i})^2$ 令$\cfrac{\partial \displaystyle\sum_{i=1}^{n}e_i^2}{\partial \hat{\beta_0}}=\displaystyle\sum_{i=1}^{n}[2(Y_i-\beta_0-\beta_1X_i)(-1)]=0$ 令$\cfrac{\partial \displaystyle\sum_{i=1}^{n}e_i^2}{\partial \hat{\beta_1}}=\displaystyle\sum_{i=1}^{n}[2(Y_i-\beta_0-\beta_1X_i)(-X_i)]=0$ 正規方程式 $\left\{\begin{array}{}  n\hat{\beta_0}&+\sum{}X_i \hat{\beta_1}&=\sum{}Y_i \\  \sum{}X_i\hat{\beta_0}&+\sum{}