モデル選択による動画像理解

f:id:peroon:20081024201240j:image

というpdfを読んだ。著者は金谷健一教授(著「これなら分かる応用数学教室」)

    • -
  • 著者は「赤池のAIC」「RissanenのMDL」をコンピュータビジョンに応用
  • (上のどちらも「モデル選択の指標」)
  • (モデル選択とは、「複数のデータ点を通る曲線の次数」を決めることなど)
  • 未知パラメータを持つ数式をモデルと呼ぶ
  • (モデルが決まればパラメータはデータから求まる)
  • 残差=観測データとモデルの距離
  • モデル選択基準=残差+自由度に対するペナルティ
  • (残差を減らせば、自由度(次数)が上がってペナルティを受ける)
  • トレードオフ
  • モデル選択基準「赤池のAIC」「SchwarzのBIC」
  • 「RissanenのMDL」「MallowsのCp」
  • これらの基準を画像処理に応用したい
  • 例えば「複数の画像からパノラマ画像を作る「画像モザイク生成」」
  • カメラの向きが変わると画像に「射影変換」がかかる
  • なので「対応する点を重ねて貼り付ける」だけではうまくいかない
  • 「幾何学的AIC」によってモデル選択するとうまく貼り合わせられる
  • <幾何学的AICとは何か>
  • 統計学で言う「モデル」とは観測したデータを説明する数式のこと
  • 幾何学的AICAICは違うが、原理はKL情報量で同じ
  • KL情報量の評価が2種類あって、それぞれが幾何学的AICAICに対応
  • 幾何学的MDL
  • MDL:「データとモデルを指定するのに必要最低限の符号列の長さ
  • (記述長)が最小となるモデルを選択する」
  • 実数を表現するには符号長が無限になってしまうので量子化する
  • 量子化が荒いと「モデル記述長が短く、データ記述長が長くなる」
  • 量子化が細かいと「逆になる」
  • Rissanenは「全体の記述長が最小になるように量子化幅を定めた」
  • 一般に幾何学的MDLのほうが幾何学的AICより、
  • 複雑なモデルに対するペナルティが大きい
  • AICとMDLの場合も同様か?)
  • AICの出発原理はKL情報量
  • MDLの出発原理は最小記述長
  • どちらがいいという根拠はない
  • <幾何学的モデル選択の応用>
  • パノラマ画像
  • 画像中の対象の対称性の判定
  • 2画像に3次元形状を復元する十分な視差が含まれているかの判定
  • 動画像中の動きが「シーン全体の動きか、独立に移動する物体がいるのか」
  • カメラを動かしながら撮影して「背景と独立に動く物体を抽出」
  • など
  • モデル選択を生かすには、システム設計者が問題を十分に理解し、
  • 適切な基準を選び、適切な方法で適用することが必要

と、いうことでした。