データサイエンス(上級)[25R3004]

科目名
Course Title
データサイエンス(上級)[25R3004]
Data Science (Advanced)
授業言語
Language
Japanese
科目区分・科目種 文化情報工学科 クラス 文化情報工学科
コンピテンシー ◎問題解決力
カラーコード
単位数 2.0単位 履修年次 2

担当教員 土山 玄
戸次 大介
学期 後期
曜日・時限・教室
木曜 1 2 理学部3号館207−209【仮ITルーム1】

受講条件・その他注意
注意事項:
2024年度以降の入学生は本科目(科目コード:25R3004)を履修登録してください。
2023年度以前の入学生はデータサイエンス(上級)(科目コード:25A0454)を履修してください。

受講条件等:
事前にデータサイエンス(基礎)およびデータサイエンス(中級)の履修は必須ではない。
本科目で必要な上記2科目の知識は、本授業においても解説を行う。

授業の形態
講義,演習

教科書・参考文献
講義中に配布する講義資料

ALH区分
ALH(自発的な学習時間枠)※を実施する

アクティブラーニングの技法
問題基盤型学習(PBL:Problem Based Learning)

評価方法・評価割合
小論文(レポート)=90%(中間レポート:30%,授業への参加態度=10%

主題と目標
授業の概要:
データサイエンス(上級)では、大規模なデータに対するデータマイニングの手法を学習する。本科目において採り上げる手法は近年のデータサイエンスにおける中心的な分析手法であり、そのような手法を学ぶことで多種多様なデータを分析する力を身につける。また、機械学習の考え方と基礎的な機械学習の手法を学ぶことで、データサイエンスへのさらなる関心を喚起させる。扱うデータは、文化情報工学の目的に即して人文・社会分野のデータである。

授業の到達目標:
1. 多変量解析の手法を理解する。(専門知)
2. 機械学習の基礎的な手法を理解する。(専門知)
3. 統計解析ソフトRを使用して、人文・社会分野の多種多様なデータを対象に、自ら課題を設定し、研究計画を立案し、データ分析を実践できるようになる(専門知、発見力、発想力)

授業計画
第1回 データサイエンス(基礎)およびデータサイエンス(中級)の復習
データサイエンス(基礎)およびデータサイエンス(中級)で解説した多変量解析の手法を復習する。(専門知)

第2-4回:ネットワーク分析
ネットワーク分析は要素間の関係を可視化するための分析手法で、組織内や地域社会内の人的ネットワークを表現するために用いられることが多い。ネットワークを作成するときに用いられる隣接行列について学び、有向グラフと無向グラフについて理解する。また、様々な中心性の指標について学ぶ。サブグラフの抽出やコミュニティの抽出についても学ぶ。(専門知)

第5-7回:アソシエーション分析
アソシエーション分析は小売店などで同時に購入される商品の組み合わせを発見するときに用いられる手法である。アソシエーション分析で用いられる支持度、信頼度、リフト値という3つの指標を理解する。アソシエーション分析の代表的なアルゴリズムであるアプリオリアルゴリズムについて学ぶ。(専門知)

第8回 データマイニングの実践(ALH)
講義で配布されたデータを対象に、各自が課題を設定し分析を行う。その結果をレポートにまとめ、提出する。(発見力、発想力)

第9回 機械学習の考え方
教師あり学習と教師なし学習について学ぶ。また、機械学習の手法によって構築されたモデルの精度を検証する方法を学習する。(専門知)

第10, 11回 決定木
決定木の代表的なアルゴリズムであるCARTについて学ぶ。過学習を回避するため方法を理解する。(専門知)

第12回 アンサンブル学習の考え方
ブートストラップおよびジャックナイフといったリサンプリングの方法を学習する。アンサンブル学習の代表的な手法であるバギングとブースティングについて概観する。(専門知)

第13, 14回 ランダムフォレスト
ランダムフォレストは決定木のアンサンブル学習である。ランダムフォレストではどのように決定木が用いられているのか理解する。また、分析によって推定される変数重要度についても理解する。(専門知)

第15回 まとめ
本科目で採り上げた分析手法を復習し、各手法の特徴についての理解を深める。(専門知)

時間外学習
時間外には復習として講義資料を読み返すことを推奨する。また、本授業ではデータサイエンスに関連する書籍を紹介するので、余裕がある受講生にはそれらの書籍を読むことを薦める。

学生へのメッセージ
各自のコンピュータにExcelとRをインストールし、積極的にデータ分析を体験してもらいたい。データサイエンスには体験することで理解が深まることがたくさんあります。また、本授業では予習よりも復習を重視することを薦めます。

学生の問い合わせ先
tsuchiyama.gen@ocha.ac.jp