第1回 データサイエンスとは何か 統計学の歴史を概観することでどのようにデータサイエンスが発展したのか知り、現代社会においてデータサイエンスが必要とされている背景を理解する。また、データには機密情報や個人情報が含まれることが少なからずあるため、データサイエンスに関わる倫理的な問題について理解を深め、EU一般データ保護規則などの諸外国の取り組みを学ぶ。(専門知)
第2回 データの要約 量的変数と質的変数の違いを理解する。データを要約するために用いられる代表値(平均値、中央値、最頻値)、散らばりの尺度(分散や標準偏差など)、2変数の関係を表す統計量(相関係数など)を学ぶ。(専門知)
第3回 統計解析ソフトRの基礎 統計解析ソフトRの基礎的な操作方法を学ぶ。Rを用いた四則演算や第2回で学んだ基本統計量の算出、矩形データの取り扱いについて演習を通じて学習する。(専門知)
第4, 5回 データの可視化 単純集計やクロス集計といった質的変数の集計方法と量的変数の集計方法である度数分布表について学ぶ。棒グラフ、円グラフ、折れ線グラフ、ヒストグラム、箱ひげ図、散布図などのグラフの特徴と作成方法を理解し、Rを使用してこれらのグラフを作図できるようになる。(専門知)
第6回 標本抽出 代表的な確率分布(一様分布、二項分布、正規分布など)を学ぶ。次に、母集団から標本を抽出するための手法(有意選出および無作為抽出)を学び、無作為抽出の重要性を理解する。また、標本平均の分布は正規分布に従うことを理解する。(専門知)
第7回 推定 標本平均から母平均を推定する方法を学ぶ。正規分布を用いる母平均の区間推定の方法とt分布を用いる母平均の区間推定の方法を学習する。また、確率分布の1つであるt分布についても理解を深める。(専門知)
第8, 9, 10回 検定 統計的仮説検定の基礎的な考え方を学ぶ。帰無仮説と対立仮説、有意水準、棄却域、p値について理解する。1標本のt検定、対応のない2標本のt検定、対応のある2標本のt検定、カイ二乗検定、フィッシャーの正確確率検定について学習する。(専門知)
第11回 推定と検定(ALH) 講義で配布されたデータを対象に、各自が課題を設定し、推定と検定を行う。その結果をレポートにまとめ、提出する。(発見力、発想力)
第12, 13回 回帰分析 回帰分析は体重から身長を予測するといったような予測モデルを構築する手法である。このような回帰分析を学習し、単回帰分析と重回帰分析を理解する。(専門知)
第14, 15回 判別分析 フィッシャーの線形判別分析を学び、データの判別を行うための決定境界の求め方を理解する。また、マハラノビス距離を用いた判別分析についても学ぶ。(専門知)
|