滋賀大学キャンパス教育支援システム（SUCCESS）

時間割番号: 7022102001
テキストマイニング

担当教員
南條　浩輝[NANJO Hiroaki]
開講学部等	データサイエンス学部	対象年次		単位数	2
開講時期	秋学期	開講曜時	火2	クラス
ナンバリング	DSST23003
授業形態	【対】ハイブリッド授業（対面＋同時双方向）

授業の目的と概要

大量のテキストから有益な情報を見つけ出すテキストマイニングについて学ぶ。テキストマイニングのための基礎的な事項およびテキスト処理手法を理解できるようになることを目指す。講義では，様々なテキスト言語資料および、それらから情報を取り出すための基本的な自然言語処理技術やツール，その使い方などについて学ぶ。

授業の到達目標

テキストマイニングについての基礎的な事項を理解する
テキストマイニングのためのテキスト処理手法を理解する

授業計画

全15回で、以下のトピックについて【】の中に書かれている回数分の講義を行う予定です。
授業の進行具合や受講生の理解度によって、予定を変更する場合があります。

・概説、テキストマイニングとは、テキストマイニングを支える技術【1回】
・テキストデータの収集と加工【1回】
・形態素解析と構文解析【1回】
・語の共起関係の抽出: KH-Coder、集計表、クラスター分析、共起ネットワーク、対応分析、多次元尺度構成法など【3回】
・文書の検索: KH-Coder、全文検索、Bag-of-Words、ベクトル空間モデル、TF-IDF法、トピックモデル【4回】
・深層モデル: ニューラルネットワーク、分散表現、単語の予測モデル、RNN、Transfomer、BERT【5回】

事前学習・事後学習など授業時間外の学習

毎回の学習内容について予習を行うこと。
毎回の学習内容について復習を行い、知識を確実に身につけること

成績評価の方法

期末テスト 60%
授業内・授業外の課題の達成度 40%

成績評価の基準

テキストマイニングについての基礎的な事項を理解している
テキストマイニングのためのテキスト処理手法を理解している

教科書

教科書1	ISBN
	書名	社会調査のための計量テキスト分析　第2版
	著者名	樋口耕一	出版社	ナカニシヤ出版	出版年	2020

参考書

参考書1	ISBN	9784274222771
	書名	Rによるやさしいテキストマイニング活用事例編
	著者名	小林雄一郎	出版社	株式会社オーム社	出版年	2018

参考書2	ISBN	9784274221002
	書名	Rによるやさしいテキストマイニング機械学習編
	著者名	小林雄一郎	出版社	株式会社オーム社	出版年	2017

参考書3	ISBN	9784779516399
	書名	動かして学ぶ！はじめてのテキストマイニング
	著者名	樋口耕一ほか	出版社	ナカニシヤ出版	出版年	2022

参考書9	ISBN	‎
	書名
	著者名		出版社	‎	出版年

教材に関する補足情報

特になし

参考文献一覧

特になし

履修上の注意事項

KH Coder, R, pythonなどを使ったテキストマイニングを講義では扱う予定である。扱った手法を受講者自身で確認することで理解が深まる。KH Coder, R, pythonなどが動作するパソコンを用意でき、かつ授業時に持参できること

キーワード（「実務経験のある教員による授業科目」は「実務経験」で検索）

備考（実務経験の内容と授業との関連を含む）

参照ホームページ

教員からの一言

オフィスアワー

連絡先（研究室他）

連絡先（電話番号）

連絡先（メールアドレス）

ホームページ

備考（教員情報）

↑ページの先頭へ戻る