グーグルの新技術はパターン認識を活用していた

 キーワード検索を行うPageRnakはgoogleそのものとして有名である。 画像そのものをランク付けするVisualRankなるものの発表が4月にあった。今までの画像検索は、添えられた文字情報を手がかりに行っていたので精度は格段に落ちる。画像そのもののうまいランキングをつければ、上位のものが代表的な画像となる。たとえば、モナリザだとすると、パロディーも含めて、ダビンチの絵が一番上に来ることは容易に想定できる。
 何が代表的なのかといえば、画像間の類似性を計算し、その真ん中にあるものがVisualRnakが高いと設定したのである。
 では画像の類似性をどう計算するかということになる。私が昔、経験したパターン認識がでてくる。画像を正規化し、一枚の画像をベクトル表現し、その類似度を計算することになる。類似度の中心は、この画像ベクトル空間の固有値であるから、あとは巨大マトリックスガリガリ固有値の計算である。

 さてその結果は、人間の評価でも4倍の精度が得られたそうである。面白いのはエラーの出かたである。まずブラウザーの画面を貼り付けた画像はIEであれば、枠のところはどの画像も非常に類似度が高くなる。同じだから当たり前です。これが類似度を引っ張りすぎで間違うそうです。なるほど!!!
 次は、会社のロゴマークだそうです。似たようなものが沢山でてくるのはデザイン上仕方のないことですが、画像の意味とはまったく無関係なのでエラーがでてくるそうです。これもわかります。

 どういう意図・目的で画像が提示されているのか、ということとのリンクが必要でしょう。奥深いですね。彼らの研究に期待します。