タイトル
時間割番号: 7022102001
テキストマイニング
 
担当教員
南條 浩輝[NANJO Hiroaki]
開講学部等 データサイエンス学部 対象年次   単位数 2
開講時期 秋学期 開講曜時 火2 クラス  
ナンバリング DSST23003
授業形態 【対】ハイブリッド授業(対面+同時双方向)
授業の目的と概要  
大量のテキストから有益な情報を見つけ出すテキストマイニングについて学ぶ。テキストマイニングのための基礎的な事項およびテキスト処理手法を理解できるようになることを目指す。講義では,様々なテキスト言語資料および、それらから情報を取り出すための基本的な自然言語処理技術やツール,その使い方などについて学ぶ。
 
授業の到達目標  
テキストマイニングについての基礎的な事項を理解する
テキストマイニングのためのテキスト処理手法を理解する
 
授業計画  
全15回で、以下のトピックについて【】の中に書かれている回数分の講義を行う予定です。
授業の進行具合や受講生の理解度によって、予定を変更する場合があります。


・概説、テキストマイニングとは、テキストマイニングを支える技術【1回】
・テキストデータの収集と加工【1回】
・形態素解析と構文解析【1回】
・語の共起関係の抽出: KH-Coder、集計表、クラスター分析、共起ネットワーク、対応分析、多次元尺度構成法など【3回】
・文書の検索: KH-Coder、全文検索、Bag-of-Words、ベクトル空間モデル、TF-IDF法、トピックモデル【4回】
・深層モデル: ニューラルネットワーク、分散表現、単語の予測モデル、RNN、Transfomer、BERT【5回】
 
事前学習・事後学習など授業時間外の学習  
毎回の学習内容について予習を行うこと。
毎回の学習内容について復習を行い、知識を確実に身につけること
 
成績評価の方法  
期末テスト 60%
授業内・授業外の課題の達成度 40%
 
成績評価の基準  
テキストマイニングについての基礎的な事項を理解している
テキストマイニングのためのテキスト処理手法を理解している
 
教科書  
教科書1 ISBN
書名 社会調査のための計量テキスト分析 第2版
著者名 樋口耕一 出版社 ナカニシヤ出版 出版年 2020
 
参考書  
参考書1 ISBN 9784274222771
書名 Rによるやさしいテキストマイニング 活用事例編
著者名 小林 雄一郎 出版社 株式会社オーム社 出版年 2018
参考書2 ISBN 9784274221002
書名 Rによるやさしいテキストマイニング 機械学習編
著者名 小林 雄一郎 出版社 株式会社オーム社 出版年 2017
参考書3 ISBN 9784779516399
書名 動かして学ぶ! はじめてのテキストマイニング
著者名 樋口 耕一ほか 出版社 ナカニシヤ出版 出版年 2022
参考書9 ISBN
書名
著者名 出版社 出版年
教材に関する補足情報  
特になし
 
参考文献一覧  
特になし
 
履修上の注意事項  
KH Coder, R, pythonなどを使ったテキストマイニングを講義では扱う予定である。扱った手法を受講者自身で確認することで理解が深まる。KH Coder, R, pythonなどが動作するパソコンを用意でき、かつ授業時に持参できること
 
キーワード(「実務経験のある教員による授業科目」は「実務経験」で検索)  
 
備考(実務経験の内容と授業との関連を含む)  
 
参照ホームページ  
 
教員からの一言  
 
オフィスアワー  
 
連絡先(研究室他)  
 
連絡先(電話番号)  
 
連絡先(メールアドレス)  
 
ホームページ  
 
備考(教員情報)  
 
↑ページの先頭へ戻る