データサイエンス(中級)[23A0453]

科目名
Course Title
データサイエンス(中級)[23A0453]
Data Science (Intermediate)
授業言語
Language
Japanese
科目区分・科目種 情報 クラス 全学科
コンピテンシー ◎創造的思考力,◎問題解決力,◎内的統制感,○省察的思考力
カラーコード
単位数 2.0単位 履修年次 14

担当教員 土山 玄
学期 前期
曜日・時限・教室
木曜 1 2 理学部3号館601室【ITルーム1】

受講条件・その他注意
事前にデータサイエンス(基礎)を履修していること。
文理融合データサイエンスUと授業内容が重複している部分があるので、本科目か文理融合データサイエンスUのいずれか一方を受講することが望ましい。
講義資料等をMoodleで配布するため、受講生は初回の授業までにMoodleで本科目を自己登録してください。

授業の形態
講義,演習,対面授業のみ

教科書・参考文献
教科書については講義中にアナウンスする。

ALH区分
ALHを実施しない

アクティブラーニングの技法
AL技法は授業に用いない

評価方法・評価割合
小論文(レポート)=90%(中間レポート:30%, 期末レポート:60%),授業への参加態度=10%

主題と目標
データサイエンス(中級)はデータサイエンス(基礎)の発展科目です。本科目では多次元データを対象とした分析手法を学びます。多次元データとは多くの変数を持つデータのことであり、データサイエンスでは多次元データを分析するための手法が数多く考案されています。本科目を履修することで、分析目的に応じて適切な分析手法を選択し、実践する力を身につけることを目的とします。

授業計画
1. データサイエンスとは何か(1週)
現代社会においてデータサイエンスが必要とされている背景を理解する。
データサイエンス(基礎)で解説したデータサイエンスの手法の復習を行う。

2. ロジスティック回帰分析(2週)
ロジスティック回帰分析の考え方(オッズ、ロジットなど)を学ぶ。
ロジスティック回帰分析と回帰分析、判別分析との関連を理解する。

3. 主成分分析(3週)
固有値分解を学び、主成分分析における固有値と固有ベクトルの意味について理解する。
主成分得点の求め方と主成分の解釈の仕方を理解する。

4. 対応分析(2週)
対応分析および多重対応分析の考え方を学び、主成分分析との類似点を理解する。
対応分析と数量化V類の関係について学ぶ。

5. 多次元尺度構成法(2週)
類似度と非類似度について学ぶ。
多次元尺度構成法の考え方を学び、主成分分析との類似性を理解する。

6. 階層的クラスター分析(2週)
クラスターを結合させる代表的な手法を学び、各手法の特徴を理解する。
デンドログラム(樹形図)の解釈の仕方を理解する。

7. 非階層的クラスター分析(2週)
非階層的クラスター分析の考え方(k-means法とk-medoids法)を学ぶ。
階層的クラスター分析と非階層的クラスター分析のそれぞれのメリットおよびデメリットを理解する。

8. 総復習(1週)
これまでに採り上げた手法の復習を行う。

データサイエンス(中級)では分析手法について解説を行った後にRを使用した演習を行います。

時間外学習
時間外には復習として講義資料を読み返すことを推奨する。また、本授業ではデータサイエンスに関連する書籍を紹介するので、余裕がある受講生にはそれらの書籍を読むことを薦める。

学生へのメッセージ
各自のコンピュータにExcelとRをインストールし、積極的にデータ分析を体験してもらいたい。データサイエンスには体験することで理解が深まることがたくさんあります。また、本授業では予習よりも復習を重視することを薦めます。

学生の問い合わせ先
tsuchiyama.gen@ocha.ac.jp