応用統計学演習[26R3023]

科目名
Course Title
応用統計学演習[26R3023]
Exercises in Advanced Statistical Mathematics
科目区分・科目種 文化情報工学科 クラス 文化情報工学科
コンピテンシー ◎批判的思考力,◎創造的思考力,◎問題解決力
カラーコード
単位数 2.0単位 履修年次 3

担当教員 坂田 綾香
学期 後期
曜日・時限・教室
木曜 5 6 共3-408【情報科学講義室2】

授業の形態
講義,演習

教科書・参考文献
【参考書】
1.「統計的機械学習の数理100問 with Python」
著者:鈴木 讓
出版社:共立出版
発行年:2020
ISBN:9784320125070

2. 「The Elements of Statistical Learning: Data Mining, Inference, and Prediction, Second Edition」
※ フリーで公開されているPDFがありますのでダウンロードしてください
著者: Trevor Hastie, Robert Tibshirani, Jerome Friedman
出版社:Springer Nature
発行年:2009
ISBN:978-0387848570

ALH区分
ALHを実施しない

評価方法・評価割合
期末試験=60,小論文(レポート)=30,授業への参加態度=10

主題と目標
本講義では,線形回帰や主成分分析といった広く用いられる統計的手法を、最適化的・幾何的・確率的観点から理解する。さらに最尤推定,情報量,正則化との関係を通して,統計モデルの構造と必然性を数式レベルで説明できる力を養う。これにより統計的機械学習の初歩的な方法論を身につける。

授業計画
以下の項目を、計15回の講義で順に説明する。
1. 線形代数の復習
 行列の演算,内積,直交射影,擬似逆行列など線形代数の基礎を確認し,統計的モデルの計算に必要な道具を整える。

2. 線形回帰の基礎
 最小二乗法による回帰係数の導出と正規方程式の解法を学び,射影としての回帰の幾何学的理解を深める。

3. 主成分分析の理論
 データの分散最大化と低ランク近似の考え方を学び,固有値・固有ベクトルを用いた次元削減の理論的基礎を理解する。

4. 正則化と制約付き最適化
 リッジ回帰や LASSO を例に,最適化問題への制約付加と解の性質を学び,複雑さ制御の概念を理解する。

5. 最尤推定
 正規分布を仮定した回帰モデルを中心に,尤度関数の構築と微分による最大化法を学び,最小二乗法との関係を理解する。

6. 指数型分布族と対数尤度
 正規分布・ベルヌーイ分布・ポアソン分布などを通じて,指数型分布族の共通構造と対数尤度の計算方法を習得する。

7. フィッシャー情報量
 情報行列の定義と計算を学び,推定量の分散下限としてのクラメール–ラオの不等式との関係を理解する。

8. 情報量規準
 AIC や BIC を導入し,モデル選択における複雑さと適合度のバランスを理論的に評価する方法を学ぶ。

9. 推定量の漸近理論
 一致性や漸近正規性など,サンプルサイズが大きくなる場合の推定量の性質を理解し,情報量との関係を確認する。

時間外学習
授業で扱った内容を理解し定着させるために、次のような学習を時間外に行うことが望ましい。
1. 例題・演習問題を手計算で丁寧に解くこと。
2. 線形代数や微分・固有値計算など、統計モデルで必要となる基礎計算を復習すること。
3. 尤度関数・フィッシャー情報量・情報量規準などの理論を,自分の手で導出・確認すること。
4. 主成分分析や正則化の理論を,具体的な小規模行列を用いて手計算で理解すること。
5. 授業で扱った公式や定理の証明を読み直し,理論の論理的つながりを確認すること。

学生へのメッセージ
統計学の理論に基づく機械学習の内容を扱います。この講義のタイトルの「応用」は、「さまざまな問題に応用できるための数理的基盤を確実にする」という目標を意味しています。また「演習」は自らの手で計算することを意味しています。既存のパッケージを当てはめて利用するだけではなく、その背後にある理屈を理解することを目指しましょう。