テキストアナリティクス特論[26K8019]

科目名
Course Title
テキストアナリティクス特論[26K8019]
Advanced Text Analytics
科目区分・科目種 クラス 共創工学
コンピテンシー ◎批判的思考力,◎問題解決力
カラーコード  
単位数 2.0単位 履修年次 12

担当教員 土山 玄
学期 前期
曜日・時限・教室
月曜 7 8

受講条件・その他注意
本科目は共創工学専攻と比較社会文化学専攻の院生に向けて開講されている科目です。
共創工学専攻では「テキストアナリティクス特論(26K8019)」、比較社会学専攻では「計量文献学特論(26H1351)」という科目名になっていますが、同一の授業であることに注意してください。

授業の形態
講義

教科書・参考文献
教科書の指定はありません。

ALH区分
ALHを実施しない

評価方法・評価割合
小論文(レポート)=90%,授業への参加態度=10%

主題と目標
テキストアナリティクス特論では文学作品において使用される語彙や表現の特徴を統計的に解明する方法を講義し、計量的な観点による文学作品の研究について理解を深めることを目的とする。また、本授業では実際の研究を紹介することで、文学作品のテキストデータの作成方法、その加工方法、データサイエンスの手法について解説します。直感的に理解できる内容をめざしながら、修士論文などの自身の研究の際に必要になりえるデータサイエンスの基礎を身につけてることも目標の1つとします。

授業計画
テキストアナリティクス特論では以下の10項目のテーマを採り上げます。
テーマによっては複数の週にわたって解説するものもあります。
1. 計量文献学の歴史
2. 計量文献学における主要な研究テーマ
3. 文学作品のテキストデータの取得
4. テキストデータのクリーニング(正規表現)
5. 形態素解析
6. テキストデータの可視化
7. 執筆時期の推定
8. 作者の識別
9. 特徴語の抽出
10. 小説の分類(テキストクラスタリング)

時間外学習
授業で採り上げた分析手法の復習をし、関連文献を読んでください。関連文献については授業で紹介します。

学生へのメッセージ
この授業では可能な限り、数理的な解説を行いません。数学や統計学が苦手であっても、文学作品を対象とした計量的な研究に興味があれば、テキストデータを対象としたデータ分析を実践できるようになると思います。

学生の問い合わせ先
tsuchiyama.gen@ocha.ac.jp