文化情報研究 (その1)
准教授・石田 基広
2単位
目的
テキストマイニング入門
概要
従来,人文科学分野では,小説や資料などのテキストを人間が読んでまとめて,その結果を文章として書くことが研究と考えられてきた. しかし,そのような作業の結果は,必然的に主観に大きく左右されており,第三者をせっtくさせることが難しい.要するに,単なる感想,個人的印象の域を出ることがない. これに対して,最近,テキストマイニングとよばれるデータ分析技法が注目を集めている.これは,たとえばインターネット上に散乱する大量のブログやホームページから自動的に情報を収集し,いま何がどうして注目されているのかをコンピュータに分析させる技法である. 本演習ではテキスト研究にコンピュータを導入し,完全に客観的な研究手法として注目されているテキストマイニングを学んでいく.前期は,そのために必要となるデータマイニングを基礎から学んでいく.
キーワード
テキストマイニング,データマイニング,統計学
注意
私のホームページ上で予習復習用のページを開設予定である.,
目標
1. | 対象を形式的に分析する能力を身につける.簡単な表計算処理,データベース処理ができるようになる. |
計画
1. | オリエンテーション |
2. | 情報処理と人文科学の接点について |
3. | 対象を形式化する,計量化する |
4. | データマイニングとは何か |
5. | 統計学とは何か |
6. | 統計学の基礎 |
7. | 統計解析をコンピュータで実現する方法 |
8. | 解析ソフトの基本操作に慣れる-- Rを学ぶ1 |
9. | 解析ソフトの基本操作に慣れる-- Rを学ぶ2 |
10. | 解析ソフトの基本操作に慣れる-- Rを学ぶ3 |
11. | 解析ソフトを使いつつ習った事項を確認する-- 平均と分散 |
12. | 解析ソフトを使いつつ習った事項を確認する--相関とグラフ |
13. | 応用的な統計解析を試みる1 |
14. | 応用的な統計解析を試みる2 |
15. | 応用的な統計解析を試みる3 |
16. | まとめ |
評価
成績そのものは試験によって判定する. ただし出欠も重視する. 欠席が続けば,そもそもその後の内容が全く分らなくなります.
再評価
未定
教科書
『Rによるテキストマイニング入門』森北書店 ISBN 4627848412
連絡先
- オフィスアワー: 火曜日, 水曜日, 木曜日の12時00分から13時00分のあいだ