大量のテキストから有益な情報を見つけ出すテキストマイニングについて学ぶ。テキストマイニングのための基礎的な事項およびテキスト処理手法を理解できるようになることを目指す。講義では,様々なテキスト言語資料および、それらから情報を取り出すための基本的な自然言語処理技術やツール,その使い方などについて学ぶ。
|
|
|
テキストマイニングについての基礎的な事項を理解する テキストマイニングのためのテキスト処理手法を理解する
|
|
|
全15回で、以下のトピックについて【】の中に書かれている回数分の講義を行う予定です。 授業の進行具合や受講生の理解度によって、予定を変更する場合があります。
・概説、テキストマイニングとは、テキストマイニングを支える技術【1回】 ・テキストデータの収集と加工【1回】 ・形態素解析と構文解析【1回】 ・語の共起関係の抽出: KH-Coder、集計表、クラスター分析、共起ネットワーク、対応分析、多次元尺度構成法など【3回】 ・文書の検索: KH-Coder、全文検索、Bag-of-Words、ベクトル空間モデル、TF-IDF法、トピックモデル【4回】 ・深層モデル: ニューラルネットワーク、分散表現、単語の予測モデル、RNN、Transfomer、BERT【5回】
|
|
|
毎回の学習内容について予習を行うこと。 毎回の学習内容について復習を行い、知識を確実に身につけること
|
|
|
期末テスト 60% 授業内・授業外の課題の達成度 40%
|
|
|
テキストマイニングについての基礎的な事項を理解している テキストマイニングのためのテキスト処理手法を理解している
|
|
|
|
|
|
|
社会調査のための計量テキスト分析 第2版
|
|
樋口耕一
|
|
ナカニシヤ出版
|
|
2020
|
|
|
|
|
|
|
|
|
|
|
|
KH Coder, R, pythonなどを使ったテキストマイニングを講義では扱う予定である。扱った手法を受講者自身で確認することで理解が深まる。KH Coder, R, pythonなどが動作するパソコンを用意でき、かつ授業時に持参できること
|
|
|
|
|
|