RMeCabをインストールしたけど…どうやって使えばいいの?
という方対象です。
RMeCabを使って、このようなことをしていきます。
- それぞれの単語にわける
- 名詞・動詞などの品詞名をつける
とりあえず【RMeCab】を使ってみたい人におすすめです。
目次
今回の目的
【RMeCab】で、単語ごとにわける・品詞名(形態素解析とよぶ)をつける。
実行環境
- Windows10(MacでもLinuxでも可)
- MeCab・RMeCabインストール済み
- Rstudio
MeCab・RMeCabをインストールしていない人は、【MeCab】を【R】で使えるようにするための【RMeCab】を導入する方法・流れ【Windows編】
必要なパッケージ
- RMeCab
先に読み読み込んでおきましょう。
library(RMeCab)
短い文を形態素解析する
「わたしはグミが好きだ」これを解析していきましょう。
metestという変数にいれます。
metest <- RMeCabC(“わたしはグミが好きだ”)
metest
[[1]]
名詞
"わたし"
[[2]]
助詞
"は"
[[3]]
名詞
"グミ"
[[4]]
助詞
"が"
[[5]]
名詞
"好き"
[[6]]
助動詞
"だ"
この結果になります。しっかり単語ごとに分けてありますし、品詞名もついています。
RMeCabC | 文字列を形態素解析(単語に分けたり、品詞名をつける)する |
リストの各要素にアクセス
上で表示された縦長の結果は、リスト形式となっています。
metest[[1]]
[[1]]
名詞
“わたし”
metest[[3]]
[[1]]
名詞
“グミ”
このように各要素にアクセスすることができます。
変数名[数字] | 数字で指定した要素を表示 |
リスト形式→ベクトル形式
先ほどの縦長に書かれたリスト形式のものを、ベクトル形式にしていきます。
理由として、ベクトル形式の方が見やすく、便利だからです。
metest1 <- unlist(metest)
metest1
名詞 助詞 名詞 助詞 名詞 助動詞
“わたし” ”は” ”グミ” ”が” ”好き” ”だ”
この結果になります。縦書きのリスト形式からベクトル形式になりました。
unlist() | ベクトル形式にする |
ベクトルの各要素にアクセス
リスト形式と同じように、ベクトル形式の要素にもアクセスできます。
metest1[[1]]
名詞
“わたし”
変数名[数字] | 数字で指定した要素を表示 |
品詞情報だけを表示
さきほどのやり方だと、品詞と単語が同時に表示されてしまいました。
品詞情報だけ取り出す方法もあります。
names(metest1)
[1]”名詞” “助詞” “名詞” “助詞” “名詞” “助動詞”
names(変数名) | 品詞情報のみ表示 |
品詞情報の一部を表示
こちらも一部を取り出すことができます。
names(metest1[[1]])
[1] “名詞”
names(変数名[数字]) | 品詞情報の数字で指定した部分を表示 |
まとめ:RMeCabCで形態素解析できる
- RMeCabCで
- 単語ごとに分けられる
- 品詞を表示することができる
以上RMeCabCの使い方でした。「Udemy 」でもR言語について学べます。
ゼロから始めるR言語
UdemyでR言語について学ぶ>> こちらではプログラミング言語【R】を使って、様々なことをしていきます。 Rを勉強にしている人に、参考にしていただければ嬉しいです。 ...