自然言語論[26C5066]

科目名
Course Title
自然言語論[26C5066]
Natural Language Processing
授業言語
Language
Japanese
科目区分・科目種 情報科学科 クラス 情報科学科
コンピテンシー ◎創造的思考力,◎問題解決力
カラーコード
単位数 2.0単位 履修年次 34

担当教員 小林 一郎
学期 前期
曜日・時限・教室
火曜 3 4 共3-409【情報科学講義室1】

受講条件・その他注意
初回の授業から Moodle を使用するので事前に自己登録を済ませておくこと。

授業の形態
講義

教科書・参考文献
教科書は現時点において指定せず、講義のページから資料をダウンロードできるようにするつもりです。

ALH区分
ALHを実施しない

評価方法・評価割合
小論文(レポート)=講義の内容についての習熟度を確認するレポートを出す予定です。比率は全体100に対して70の割合。変更するときは事前に知らせます。,授業への参加態度=講義への出席(演習も含む)も評点に入れます。比率は全体100に対して30の割合。変更するときは事前に知らせます。

主題と目標
自然言語処理の技術は、コンピュータによる日本語変換機能や検索エンジンなどの基礎となる技術を提供するだけではなく、近年はロボットとのコミュニケーションを実現するなど、さまざまなシステムに応用されている.本講義では、自然言語処理の初期の研究として、言語学的なアプローチから始まり、1990年代に入ってからの統計的なアプローチ、2010年代からの深層学習によるアプローチと、自然言語処理の手法の変遷を技術の歴史的な背景を踏まえて紹介を行いつつ、人の言葉をコンピュータで処理を行う枠組みである自然言語処理の基礎技術について解説する.

授業計画
1.序論:言語とは?
 言語は我々が日常使っているものです。それはどのような機能をもっているのか考えます。
2.自然言語処理技術概要
 世の中にはたくさんの言葉の情報があふれています。それをコンピュータが処理をする技術にはどのようなものがあるのかを考えます。
3.形態素解析
 自然言語処理において一番基礎となる技術を学びます。深層学習を使った自然言語処理でも重要となる言語モデルについて深く学びます。隠れマルコフモデル、動的計画法についても紹介します。
4.構文解析
 単語の依存関係により構文ができます。それを処理する技術を学びます。とくに、文脈自由文法は自然言語処理を学ぶ上でとても重要な文法となるため、それについてチョムスキー階層を踏まえた位置付けとともに紹介します。
5.意味解析
 言語の意味を捉えようとする技術について学びます。近年、ニューラルネットワークを使った自然言語処理の普及により、言葉の意味を単語埋め込み空間のベクトルとして扱う手法が盛んになっています。そのようなさまざまな意味表現を踏まえて自然言語の意味をどのように捉えてきたかについて歴史的な経緯とともに紹介します。
6.文脈解析
 文が集まって文脈ができます。それをどのように処理するかについて学びます。文章の構成を文間の意味を通じて捉える修辞構造理論について紹介します。
7.情報検索
情報検索について基礎技術を学びます。
8.統計的言語処理
 言語を使った各種統計的な手法(クラスタリングや分類など)を学びます。
9. ニューラルネットワークを使った自然言語処理
 ニューラルネットワークの基礎、分散表現などを学びます。
10. 深層学習を用いた自然言語処理
大規模言語モデルにつながる基礎的なモデルから大規模言語モデルがどのようなものかについて紹介します。
以上の内容を15回にわけて実施する
(※)講義の順番と内容は進行状況によって変わることがあります。

時間外学習
自然言語処理を行うために、正規表現の使い方やプログラミング言語であるPythonなどを学ぶことを奨めます。また、現在の自然言語処理は深層学習に代表されるニューラルネットワーク技術を使う手法が多く、ニューラルネットワークの使い方についても学ぶことを奨めます。

学生へのメッセージ
情報検索や対話システムなど日常生活において言葉を使った情報処理が一般的になってきています。そのようなものがどのような仕組みで動いているのかなどを考えてみてください。また、近年、深層学習(ディープラーニング)が人工知能や自然言語処理において一般的に使われるようになってきています。そのような技術の動向にも目をむけることを奨めます。