年度
科目別検索
学科別検索
教員別検索
プログラム別検索
資格別検索
コンピテンシー別検索
時間割検索
全文検索
データサイエンス(中級)
[25R3003]
科目名
Course Title
データサイエンス(中級)
[25R3003]
Data Science (Intermediate)
授業言語
Language
Japanese
科目区分・科目種
文化情報工学科
クラス
文化情報工学科
コンピテンシー
◎問題解決力
カラーコード
単位数
2.0
単位
履修年次
2
年
担当教員
土山 玄
戸次 大介
学期
前期
曜日・時限・教室
木曜
1
〜
2
限
理学部3号館601室【ITルーム1】
受講条件・その他注意
注意事項:
2024年度以降の入学生は本科目(科目コード:25R3003)を履修登録してください。
2023年度以前の入学生はデータサイエンス(中級)(科目コード:25A0453)を履修してください。
受講条件等:
事前にデータサイエンス(基礎)を履修していることが望ましいが、必ずしも履修していなくても良い。
文理融合データサイエンスUと授業内容が重複している部分があるため、本科目か文理融合データサイエンスUのいずれか一方を受講することを推奨する。
授業の形態
講義,演習
教科書・参考文献
授業で配布する講義資料
ALH区分
ALH(自発的な学習時間枠)※を実施する
アクティブラーニングの技法
問題基盤型学習(PBL:Problem Based Learning)
評価方法・評価割合
小論文(レポート)=90%(中間レポート:30%, 期末レポート:50%, アクティブ・ラーニング:10%),授業への参加態度=10%
主題と目標
授業の概要:
データサイエンス(中級)ではデータサイエンス(基礎)で解説した手法を復習し、その発展的な手法を学習する。次に、本科目では多次元データを対象とした分析手法を学ぶ。多次元データとは多くの変数を持つデータのことであり、そのままでは可視化することが難しい。そのため、データサイエンスでは多次元データの特徴を可視化するための分析手法が数多く考案されている。本科目では主要な多次元データを対象とした分析手法を学ぶ。また、分析目的に応じて適切な分析手法を選択し、実践する力を身につけることを目的とする。
授業の到達目標:
1. 多変量解析の基礎的な手法を理解する。(専門知)
2. 統計解析ソフトRを使用して、人文・社会分野の多種多様なデータを対象に、自ら課題を設定し、研究計画を立案し、データ分析を実践できるようになる。(専門知、発見力、発想力)
授業計画
第1回 データサイエンス(基礎)の復習
データサイエンス(基礎)で解説したデータサイエンスの手法の復習を行う。特に、多変量解析の手法である回帰分析と判別分析の考え方についての理解を深める。(専門知)
第2, 3回 ロジスティック回帰分析
ロジスティック回帰分析は判別分析と同様にデータを分類するモデルを構築する手法である。ロジスティック回帰分析と回帰分析、判別分析との関連を理解する。ロジスティック回帰分析を理解するために重要なオッズ、ロジットについて学ぶ。ロジスティック回帰分析によって得られたモデルの精度を検証する手法について学習する。(専門知)
第4, 5回 主成分分析
主成分分析は固有値分解を行い、主成分と呼ばれる合成変数を作成することで、多次元データの次元縮約を行う手法である。まず、固有値分解を学び、主成分分析における固有値と固有ベクトルの意味について理解する。次に、主成分得点の求め方と主成分の解釈の仕方を理解する。(専門知)
第6回 対応分析
対応分析は質的データを対象とした分析手法である。対応分析の考え方を学び、量的データを対象とする主成分分析との類似点を理解する。(専門知)
第7, 8回 因子分析
因子分析は多次元データを少数の共通因子で説明する分析手法である。共通因子の求め方、因子軸の回転方法について理解する。また、因子分析と主成分分析との相違点を理解する。(専門知)
第9回 多次元データの可視化(ALH)
講義で配布されたデータを対象に、各自が課題を設定し分析を行う。その結果をレポートにまとめ、提出する。(発見力、発想力)
第10回 多次元尺度構成法
多次元尺度構成法は分析対象となる個体間の距離を求めることで多次元データの可視化を行う手法である。多次元尺度構成法の考え方を学び、主成分分析との類似性を理解する。また、類似度と非類似度について学ぶ。(専門知)
第11, 12回 階層的クラスター分析
階層的クラスター分析は類似した特徴を持つ個体を逐次的にまとめていく手法である。クラスターを結合させる代表的な手法を学び、各手法の特徴を理解する。階層的クラスター分析の結果として得られるデンドログラム(樹形図)の解釈の仕方を理解する。(専門知)
第13, 14回 非階層的クラスター分析
非階層的クラスター分析の代表的なアルゴリズムであるk-means法とk-medoids法を学ぶ。また、階層的クラスター分析と非階層的クラスター分析のそれぞれの強みを理解する。(専門知)
第15回 総復習
本科目で採り上げた分析手法を復習し、各手法の特徴についての理解を深める。(専門知)
時間外学習
時間外には復習として講義資料を読み返すことを推奨する。また、本授業ではデータサイエンスに関連する書籍を紹介するので、余裕がある受講生にはそれらの書籍を読むことを薦める。
学生へのメッセージ
各自のコンピュータにExcelとRをインストールし、積極的にデータ分析を体験してもらいたい。データサイエンスには体験することで理解が深まることがたくさんあります。また、本授業では予習よりも復習を重視することを薦めます。
学生の問い合わせ先
tsuchiyama.gen@ocha.ac.jp