python3で文章解析をしてみる【テキストマイニングを気軽に始めてみた vol.1】

初投稿となります。マーケットエンタープライズ(以下、ME) 山口です。

 

今回はpythonの勉強も兼ねて、簡単な文章解析から始めたいと思います。
今後、これをバージョンアップさせてテキストマイニングを含めた勉強を進めていきたいと思っています。(数学的な知識とか、、不安たっぷりですが、、、汗

 

まずは、簡単に自己紹介させてください!
前職は、新卒〜6年半ほど中小SIerでjavaをメインに開発に携わっていました。
それはそれは、日々平凡で平和な毎日を過ごしていました。
しかし、ふと「これでいいのか?」「このまま流れるままに生きていて楽しいのか?」と思い。
新しい技術、裁量の幅広さ、そして何より自主性が重要視されるMEにjoinさせていただきました。
10月1日に入社しまして早1ヶ月!前職とのスピード感の違いや開発手法・言語(python)の違いに戸惑いはありましたが日々奮闘中です。

 

趣味は、料理、フットサル・テニス・自転車(ロードバイク)です!

 

どうぞよろしくお願いしまーす!

 

さて、そろそろ本題に入りましょうか。
すでに知識のある方々にはあくびの出るような内容だと思いますのでご容赦ください。
また間違ったところやツッコミがありましたら是非コメントお願いいたします!

 

まずは辞書インストールからですね!

 

・MeCabと辞書をインストール

まずHomebrewでMeCabと辞書をインストールします。

ここで一旦terminalを開き、mecabと入力すると入力待ちになります。
何か文字を入力してみると動作確認できます。

 

– 新しい辞書をインストール
 ・mecab-ipadic-NEologdをインストールします。
 ・これはWeb上の新語をデフォルトの辞書に追加したものです。

 

– 追加した辞書を使用する

 

・python3でmecabを使ってみる
– pipでmecab-python3をインストール

– 簡単なサンプル

– 結果

解析できましたね!簡単ですね♪
つづいて、あらかじめ用意した文章テンプレートに入力した名詞をはめて返答するbot的なものを作ってみました。

 

 試してみましょう。

 

 

 会話になってるようななってないような…(いや、なってない。というかいきなり誘うとか…)
用意したテンプレートでしか返答できないので当たり前ですね。
今後これに学習を加えて行って、まともな返答ができるようにしていきたいと思います。

 

### ちょブレ(ちょっとブレイク) ###
文中にイタリアンという文字が出てきたので、今回はこちらを紹介(自作です)
[料理]トマトソース
[料理]ナスのトマトソースパスタ
[料理]ナスのトマトソースパスタ

 

 

 

 

 

 

 

・トマトソース作り方(超簡単)
1.  にんにく(1かけ)、玉ねぎ(半玉、小さければ1玉)をみじん切り。
2. 1を弱火でじっくり炒める(玉ねぎが透き通ってくるまで)
3. トマト缶を1缶投入。ある程度煮詰めたら、お好みでオレガノとバジルを加えて出来上がり。
是非お試しアレ!
毎回何かしら紹介していきます!(自己満