[概要]
近年,デジタルカメラの普及やインターネットの発展に伴い,人々が手軽に画像を蓄積するようになった.また,安価な大容量記憶媒体の普及やオンラインストレージのサービスの登場により個人で膨大な画像データを取り扱うことも多い.
大規模画像データベースから所望の画像を取り出す手段としては,キーワード検索が挙げられる.しかし,これにはあらかじめ画像にタグを付けておく必要があり,ユーザに大変な労力と手間を負わせることになる.そこで,画像の特徴をコンピュータにより自動的に解析し分類・検索する技術が注目されており,実用化もされている.しかしこれらの検索システムでは,画像の意味的内容をも考慮して画像検索を行うことはできない.それ故に,ユーザの検索ニーズと検索結果にズレが生じてしまうセマンティックギャップの問題が生じる場合がある.
画像に映っている物体をコンピュータにより認識することが物体認識の目標であり,一般物体認識の分野で研究がなされている.基本的に一般物体認識では,事前に対象となる物体をカテゴリごとに学習して識別器を作成し,未知画像について識別器からその画像に映っている物体を推定する.これまで,画像特徴量に物体の形状を表現するSIFT(Scale-Invariant
Feature Transform)特徴を用いたBag of Featuresモデルを利用することで高い識別性能を示すことが報告されている.しかし,SIFT特徴のみを用いた場合,色の情報が直接的に認識に考慮しないという問題点がある.また,機械学習にはラベリングされた学習画像が必要となるが,事前に大量の学習画像を要求することはユーザにかける負担が大きい.これらの画像をどのようにして獲得するかが実用化に向けた鍵となる.
本研究では,SIFT特徴に加え色を表現するCILAC(Color Index Local Auto Correlation)特徴を併せて利用した画像検索手法を提案する.提案手法では,対象物体のクラスラベルと特徴量を直接比較するために正準相関分析を利用する.また,検索・分類実験を行い手法の有効性を確認する.さらに,実用化を踏まえて,ユーザの検索意図や検索結果をフィードバックすることで検索性能を向上させ,利用と共に学習画像を徐々に獲得するシステムを提案する.最後に,被験者実験を通して,提案する画像検索システムの有効性について検証する.