計量文献学演習[25H1352]

科目名
Course Title
計量文献学演習[25H1352]
Stylometry Seminar
授業言語
Language
Japanese
科目区分・科目種 比較社会文化学専攻共通科目 クラス 比較
コンピテンシー ◎問題解決力
カラーコード  
単位数 2.0単位 履修年次 12

担当教員 土山 玄
学期 後期
曜日・時限・教室
月曜 7 8 文教育学部1号館308室

受講条件・その他注意
コア科目(情報)の文理融合データサイエンスIおよび比較社会文化学専攻共通科目の計量文献学特論を事前に受講していることが望ましい。また、この授業では演習としてプログラミングを行います。ですので、授業に自身のコンピュータを持参する必要があります。コンピュータはWindowsとMacのいずれでも構いません。コンピュータを用意できない場合は、文理融合AI・データサイエンスセンターの貸出用のコンピュータを使用してください。

授業の形態
演習

教科書・参考文献
教科書の指定はありません。

ALH区分
ALH(自発的な学習時間枠)※を実施する

アクティブラーニングの技法
問題基盤型学習(PBL:Problem Based Learning),学生授業

評価方法・評価割合
小論文(レポート)=50%,発表=50%

主題と目標
計量文献学演習は、著作権の消滅した日本の小説を分析対象として採り上げ、文学作品のテキストデータを対象とした研究を実践的に学ぶ演習科目です。
授業では教員と受講生、あるいは受講生間のディスカッションを通じて分析課題の設定、テキストデータの収集、正規表現を用いたテキストデータのクリーニング、形態素解析、分析、分析結果の解釈、報告を行うことで文学作品の計量分析に係わる一連の作業を実践的に学修します。

授業計画
計量文献学演習での全15回の授業内容は下記の12項目です。
1. テキストデータの分析ツールの紹介と解説(専門知)
2. テキストデータの分析環境の構築(専門知)
3. テキストデータの作成(専門知)
4. 正規表現を用いたテキストデータのクリーニング(専門知)
5. Web茶まめを用いた形態素解析(専門知)
6. Rによるテキストデータの可視化(専門知)
7. 中間発表
8. 回帰分析(専門知)
9. 判別分析(専門知)
10. 主成分分析(専門知)
11. クラスター分析(専門知)
12. 期末発表

第13回 1月5日 ALH(プレゼン資料の作成)
本授業では受講生自らが分析課題を設定し、テキストデータの分析の演習を行います。そのため、研究課題について報告する中間発表、分析結果について報告する期末発表があります。

時間外学習
授業で解説した分析手法を、Rを用いて実際に分析できるように理解を深めてください。

学生へのメッセージ
この授業で使用するプログラミング言語のRはそれほど難しくはありません。また、演習の時間を十分に確保するので、プログラミングが未経験であっても、いくつかのデータサイエンスの手法を実践できるようになると思います。

学生の問い合わせ先
tsuchiyama.gen@ocha.ac.jp ※@を半角にしてください