書かないとなって思って忘れていたんですが,Twitterを解析して,個別にオススメのお土産を紹介するプログラムを書きました.
この「たのみやげ」の機能の一つですね.
以下のTwitterアカウントに,リプライを飛ばしてもらえればお土産が解析されます.
このように,@omiyage_listに 解析したい人のIDとハッシュタグおすすめを付加して呟きます.
すると,このように,おすすめのカテゴリがおすすめされます.
ナイーブベイジアンフィルタというものを用いて実装は行いました.
簡単に言うと,あるツイートが与えられた時に,そのツイートがあらかじめ用意されてあるカテゴリのどこに属するかっていうのを確率的に算出して,その確率が一番高いカテゴリをおすすめするというものになっています.
下記にナイーブベイジアンの解説はのっていますので,興味のある方は是非.
ソースコードは,一部こちらにアップしてあります.Bot関係はあげていませんが,カテゴライズのところ辺りは見ていただけます.
お土産データはwikipediaやnaverまとめからとらせていただきました.
ツイートは,mecabを用いて形態素解析し,名詞,動詞,形容詞のみを抽出しています.(「です」とか,「http」を解析データに入れてしまうと結果がおかしくなるため)