こちらではプログラミング言語【R】を使って、様々なことをしていきます。
Rを勉強にしている人に、参考にしていただければ嬉しいです。
Rを使う準備
【R】を使うには、インストールする必要があります。さらに、Rを使いやすくするために「RStudio」を使っていきます。
Rではパッケージという便利にしてくれるものをよく使います。そのパッケージのインストール方法と使い方をお伝えします。
どうやって分析したのか可視化できるソフトです。プレゼンなので使えます。
パッケージを使ってみたいという人は、この記事をどうぞ。
分類別
このサイトでは、4つのカテゴリーに分類してRを使っていきます。
- グラフ・図・分析・・・名前の通り
- テキストマイニング・・・文章(単語)の分析
- スクレイピング・・・Webサイトから必要な部分をとりだす
- その他
グラフ・図・分析
ここでは、データを棒グラフにしたり、分析していきます。
とりあえず手始めに、ヒストグラム・棒グラフを作っていきます。
散布図です。
テキストマイニング
「テキストマイニング」は、文章を単語や文節でくぎったり、同じ単語の頻度、出現傾向、時系列などを解析することで有用な情報を取り出す、テキストデータの分析方法です。
例えば、夏目漱石の文章のくせを発見したり、人のツイートによく使われる単語を表示したりすることもできます。
テキストマイニングをするために、「MeCab」・「RMeCab」を使っていきます。
RMeCabを軽く使っていきましょう。
さっそく面白いことをしてみます。
記事のポジティブ率を調べる方法です。ぜひ、ご覧ください。
人のツイートのポジティブ率を調べる方法です。とてもおもしろいのでやってみてください。
スクレイピング
Webサイトから必要な部分を取る作業です。例えば、ここに書いてある文字です。ここも取ることができます。
スクレイピングをすることで、必要な情報を集め、分析することもできます。とにかく、夢が広がります。
スクレイピングをするには、HTML・CSSなどの知識があると便利です。
ただし、HTMLやCSSをネット上で調べると、過剰なほど情報がでてきます。そこで、Rでスクレイピングをする際に必要な、HTML・CSSの最低限の知識をまとめました。
天気情報を取得していきましょう。
その他
今後に期待。
終わりに
以上、R言語記事のまとめでした。Udemyでも学んでみてください。
コメント