1. データサイエンスとは何か(1週) 統計学の歴史を概観することでどのようにデータサイエンスが発展したのか知り、現代社会においてデータサイエンスが必要とされている背景を理解する。
2. ExcelとRの基礎(1週) ExcelとRの基礎的な関数を学ぶ。
3. データの要約と集計(1週) データを要約するために用いられる代表値(平均値、中央値、最頻値)、散らばりの尺度(分散や標準偏差など)、2変数の関係をあらわす統計量(相関係数など)を学ぶ。
4. データの可視化(1週) 単純集計やクロス集計といった質的変数の集計方法と量的変数の集計方法である度数分布表について学ぶ。 棒グラフ、円グラフ、折れ線グラフ、ヒストグラム、箱ひげ図、散布図などのグラフの特徴と作成方法を理解する。
5. 母集団と標本(2週) 母集団から標本を抽出するための手法(有意選出および無作為抽出)を学ぶ。 標本分布(標本平均の分布)は正規分布に従うことを理解する。
6. 推定(1週) 標本平均から母平均を推定する方法を学ぶ。 点推定と区間推定を理解する。
7. 検定(3週) 統計的仮説検定の基礎的な考え方を学ぶ。 帰無仮説と対立仮説、有意水準、棄却域、p値について理解する。
8. 回帰分析(2週) 回帰分析の考え方(残差、最小二乗法など)について学ぶ。 過学習を理解し、モデル選択の方法(AIC、ステップワイズ法など)を学ぶ。
9. 判別分析(2週) 判別分析の考え方(群間分散や群内分散など)について学ぶ。 マハラノビス距離について理解する。
10. 総復習(1週) これまでに採り上げた手法の復習を行う。
データサイエンス(基礎)では分析手法について講義を行った後にExcelとRを使用した演習を行います。
|