データマイニング[26R3006]

科目名
Course Title
データマイニング[26R3006]
Data Mining
授業言語
Language
Japanese
科目区分・科目種 文化情報工学科 クラス 文化情報工学科
コンピテンシー ◎批判的思考力,◎問題解決力
カラーコード
単位数 2.0単位 履修年次 3

担当教員 土山 玄
佐藤 有理
学期 後期
曜日・時限・教室
金曜 3 4 共通講義棟1号館201室

受講条件・その他注意
データサイエンス(基礎・中級・上級)あるいは文理融合データサイエンスT・Uを受講していることが望ましい。

授業の形態
講義,演習

教科書・参考文献
参考文献
"Training Data for Machine Learning: Human Supervision from Annotation to Data Science" Anthony Sarkis, O'Reilly (2023)
『心理学研究法〔第3版〕』高野陽太郎, 岡隆/編、有斐閣 (2025) 978-4641222588
『Rによるやさしいテキストアナリティクス』小林雄一郎, オーム社 (2023) 978-4274230639
『テキストアナリティクスの基礎と実践』金明哲, 岩波書店 (2021) 978-4000298964

ALH区分
ALH(自発的な学習時間枠)※を実施する

アクティブラーニングの技法
PBL(プロジェクト型学習)

評価方法・評価割合
中間試験=50%,小論文(レポート)=(期末レポート:40%),ALH(自発的な学習時間枠)=10%

主題と目標
前半は、データ収集法について解説します(佐藤担当)。データマイニング・文化情報工学で扱う元データ、(1) 現実にある画像やテキストなどの素材【実世界データ】、(2) 実世界データを構造化するための人手ラベル 【アノテーションデータ】、(3) 心理実験で得られる人間の反応【行動データ】(および1,2,3混合としての自由記述データ)を扱います。
後半は、主にテキストデータの分析方法について解説します(土山担当)。特に前半の授業で収集した自由記述データやスクレイピングによって収集したテキストデータを扱い、データ分析を実践します。

授業計画
第1回. 全体導入
第2回. 実世界データの収集
第3回. アノテーションデータの収集1
第4回. アノテーションデータの収集2
第5回. 行動データの収集1
第6回. 行動データの収集2
第7回. 自由記述データの収集(Qualtricsを利用した演習)
第8回. 前半まとめ
第9回. 形態素解析
第10回. テキストデータの加工
第11回. テキストデータの分析1
第12回. スクレイピング
第13回. テキストデータの分析2
第14回. ALH
第15回. 後半まとめ

時間外学習
時間外学習として各回の授業内容を復習することを推奨する。また、本授業では授業内容に関連する書籍を紹介する。余裕がある受講生にはそれらの書籍を読むことを薦める。

学生へのメッセージ
データマイニングに係わる一連の作業は繰り返し演習することで理解が深まります。主体的に演習に取り組み、本授業で学んだ知識やスキルを使いこなし卒業研究を行えるようになることを期待します。

学生の問い合わせ先
tsuchiyama.gen@ocha.ac.jp