プログラミング演習2[19A0179]

科目名
Course Title
プログラミング演習2[19A0179]
Exercises in Computer Programming 2
授業言語
Language
Japanese
科目区分・科目種 情報 クラス DSによる小説の分析
カラーコード キャリアデザイン  
単位数 2.0単位 履修年次 14

担当教員 土山 玄
学期 後期
曜日・時限・教室
火曜 9 10 理学部3号館601室【ITルーム1】

授業の形態
講義,演習

教科書・参考文献
教科書の指定はありません。

参考書@
書名:文体論 ことばのスタイル
著者:ピエール・ギロー
訳者:佐藤信夫
出版社:白水社
出版年:1979

参考書A
書名:数字が明かす小説の秘密
著者:ベン・ブラット
訳者:坪野圭介
出版社:DU BOOKS
出版年:2018

参考書B
書名:犯罪捜査のためのテキストマイニング: 文章の指紋を探り, サイバー犯罪に挑む計量的文体分析の手法
監修:金明哲
著者:財津亘
出版社:共立出版
出版年:2019

評価方法・評価割合
小論文(レポート)=70%(中間レポート:20%,期末レポート:50%),授業への参加態度=30%

主題と目標
本授業では主に日本の近現代の小説を採り上げ、テキストデータを用いて名作と称される小説に使用される語彙や表現の特徴を統計的に解明する方法を概観し、受講生が小説の計量分析を実践できるようになることを目指します。授業形態は1回の授業の前半が講義形式、後半が演習形式です。演習では教員と学生、学生間のディスカッションを通じて分析課題の設定、テキストデータの収集、正規表現を用いたテキストデータのクリーニング、形態素解析、分析、分析結果の解釈、報告を行うことで文学作品の計量分析に係わる一連の作業を実践的に学修します。
また、本授業におけるデータ分析ではデータサイエンスの手法を用います。直感的に理解できる内容をめざしながら、卒業研究の際に必要になってくるデータサイエンスの基礎も身につけてもらうことを目標とします。

授業計画
第1回
小説の計量分析について
テキストデータの取得
第2回
テキストデータのクリーニング
正規表現
形態素解析
第3回
データハンドリングの基礎
特徴量の集計
第4回
小説の基本統計量
第5回
特徴量の可視化
第6回
これまでの復習
中間レポートの説明
第7回
小説の分類@ 主成分分析
第8回
小説の分類A 階層的クラスター分析
第9回
小説の分類B 非階層的クラスター分析
第10回
作者の判別@ 判別分析
第11回
作者の判別A 決定木
第12回
特徴語の抽出 カイ二乗検定
第13回
これまでのデータ分析の手法の復習
期末レポートの説明
第14回
小説の計量分析の実践@
期末レポート作成のために、履修生各自が興味のある分析対象を選び計量分析を行う
第15回
小説の計量分析の実践A
小説の計量分析の実践@の続き

時間外学習
授業で解説した分析手法を、Rを用いて実際に分析できるように理解を深めておいてください。また、分析対象として選んだ小説を通読することを薦めます。

学生へのメッセージ
数学や統計学が苦手でも小説が好きであれば楽しめます。小説を対象にデータ分析を行うことで今まで気付かなかったことがたくさん発見できると思います。また、分析ではRを使用することが多いので、各自が所有するコンピュータにRをインストールして、積極的にデータ分析を体験してください。また、本授業では予習よりも復習に重点をおくことを薦めます。授業や時間外学修で生じた疑問点は積極的に質問してください。