2012/02/20

ビックデータを「使う」ための技術、「機械学習」とは?

EnterpriseZine -
もっとも身近なビッグ(?)データ

迷惑メールフィルタは非常に簡単な理論でできていて、いつの間にか利用している機械学習のよいサンプルです。迷惑メールフィルタといっても、携帯電話のキャリアが提供しているようなドメインを指定して受信するかどうかを決めるような、迷惑メールフィルタではありません。Gmailに付いている自動で振り分けをしてくれる迷惑メールフィルタです。

今回は、迷惑メールフィルタがどのように判別するのか、そして機械学習とどう関係しているのかを解説してみたいと思います。 実際にはパラメータの推定には最尤法を使っていたり、 今日話すことよりももっともっと複雑なことをしているはずですが、シンプルな最小構成での例として聞いていて下さい。... 続きを読む

http://enterprisezine.jp/dbonline/detail/3761/

シェアする

Twitter Delicious Facebook Digg Stumbleupon Favorites More