言語情報処理特論[24M2005]

科目名
Course Title
言語情報処理特論[24M2005]
Advanced Language Informatoin Processing
授業言語
Language
Japanese
科目区分・科目種 情報科学コース クラス 理学
コンピテンシー ◎創造的思考力,◎問題解決力
カラーコード  
単位数 2.0単位 履修年次 12

担当教員 小林 一郎
学期 前期
曜日・時限・教室
金曜 3 4 共3-408【情報科学講義室2】

授業の形態
講義

教科書・参考文献
教科書・資料・参考文献は講義の最初に伝えます。

ALH区分
ALHを実施しない

評価方法・評価割合
小論文(レポート)=全体評価の50%,授業への参加態度=全体評価の50%

主題と目標
自然言語処理の技術は、コンピュータによる日本語変換機能や検索エンジンなどの基礎となる技術を提供するだけではなく、近年はロボットとのコミュニケーションを実現するなど、さまざまなシステムに応用されている.本講義では、自然言語処理の初期の研究として、言語学的なアプローチから始まり、1990年代に入ってからの統計的なアプローチ、2010年代からの深層学習によるアプローチと、自然言語処理の手法の変遷を技術の歴史的な背景を踏まえて紹介を行いつつ、人の言葉をコンピュータで処理を行う枠組みである自然言語処理の基礎技術について解説する.本講義ではとくに統計的機械学習手法や深層学習を用いた自然言語処理を行う際に重要となる研究などの紹介も行う。

授業計画
授業計画は授業の最初に説明する.
(予定)前半は、以下に示すような本からの言語情報処理、機械学習手法の紹介を予定している。後半は、受講生による言語情報処理、機械学習に関する論文を分担発表を予定している。
言語処理のための機械学習入門、コロナ社、高村大也著(ISBN:978-4-339-02751-8)
ゼロから作るDeep Learning@、O'Reilly、斎藤 康毅著(ISBN:978-4-87311-758-4)
ゼロから作るDeep LearningA、O'Reilly、斎藤 康毅著(ISBN:9978-4-87311-836-9)
ベイズ推論による機械学習入門, 講談社, 須山 敦志著(ISBN:978-4-06-153832-0)
トピックモデル, 講談社, 岩田具治著
パターン認識と機械学習 上・下, 丸善出版, C.M.ビショップ著

おおよその講義の概要を以下に示す。講義は全体として前半の8回、後半の7回の計15回を想定している。
前半(以下の4項目を8回で実施予定)
1. オリエンテーション
2.機械学習の基礎1:最適化
3.機械学習の基礎2:確率分布・パラメータ推定
4.機械学習の基礎3:情報量とエントロピー
後半(以下の4項目を7回で実施)
5.ナイーブペイズモデル
6.EMアルゴリズム・k平均法・混合ガウス分布
7.サポートベクターマシン
8.深層学習

(注)ただし、上記、資料は予定であり変更する可能性があることを留意されたい。講義の最初のオリエンテーションにて講義計画や使用する資料の詳細について話をするので、資料を買い揃える必要はない。

時間外学習
自然言語処理の研究において、深層学習が欠かせないものになっています。統計的な自然言語処理手法と同様に深層学習を使った自然言語処理の書籍などを読むことを奨めます。

学生へのメッセージ
情報検索や対話システムなど、言葉を使った知的なシステムが日常生活に溶け込んできています。そのような技術がどのような理論や技術について成り立っているかを学びましょう。