Text Mining Maniax for R:フリーの統計解析環境Rを用いた日本語計量テキスト分析の基礎
- 物販商品(自宅から発送)あんしんBOOTHパックで配送予定冊子版+DL版支払いから発送までの日数:7日以内¥ 600
- ダウンロード商品DL版¥ 400
- ダウンロード商品体験版¥ 0
フリーの統計解析ソフト「R」と、日本語形態素解析ソフト「MeCab」、そしてMeCabをRで動かせるパッケージ「RMeCab」や、種々のRの機能を用いて、日本語文章の計量テキスト分析を行うための解説書です。 【目次】 はじめに 第1章 RとMeCabの導入 1.1 はじめに 1.2 Rの導入 1.3 MeCabとRMeCabの導入 1.4 RMeCabで簡単な文章を解析してみる 1.5 dplyrパッケージの活用 1.6 辞書のカスタマイズ 1.7 秀丸エディタを用いた青空文庫の文章データの整形 1.8 Excelのマクロを用いた青空文庫データの整形 第2章 単一の文書を解析する 2.1 はじめに 2.2 テキストファイルを読み込んで解析を行う 2.3 絞り込み 2.4 POS2でも絞り込んでみる 2.5 N-gramとネットワークグラフ 第3章 複数の文書を解析する 3.1 はじめに 3.2 複数のテキストファイルを解析する方法 3.3 minFreqをめぐる誤解 3.4 多次元尺度構成法による単語のカテゴリー分け 3.5 クラスター分析による文書のクラスター分け 3.6 対応分析
フリーの統計解析ソフト「R」と、日本語形態素解析ソフト「MeCab」、そしてMeCabをRで動かせるパッケージ「RMeCab」や、種々のRの機能を用いて、日本語文章の計量テキスト分析を行うための解説書です。
【目次】
はじめに
第1章 RとMeCabの導入
1.1 はじめに
1.2 Rの導入
1.3 MeCabとRMeCabの導入
1.4 RMeCabで簡単な文章を解析してみる
1.5 dplyrパッケージの活用
1.6 辞書のカスタマイズ
1.7 秀丸エディタを用いた青空文庫の文章データの整形
1.8 Excelのマクロを用いた青空文庫データの整形
第2章 単一の文書を解析する
2.1 はじめに
2.2 テキストファイルを読み込んで解析を行う
2.3 絞り込み
2.4 POS2でも絞り込んでみる
2.5 N-gramとネットワークグラフ
第3章 複数の文書を解析する
3.1 はじめに
3.2 複数のテキストファイルを解析する方法
3.3 minFreqをめぐる誤解
3.4 多次元尺度構成法による単語のカテゴリー分け
3.5 クラスター分析による文書のクラスター分け
3.6 対応分析