ディープラーニング 物体検出とセグメンテーションの考え方 基礎

一般 物体 認識

一般物体認識って何? と思われる方も多いと思います。 コンピュータビジョン分野では、「特定物体認識」と「一般物体認識」があります。 特定物体認識では、ある特定の物体が画像中に存在するかをコンピュータが認識します。 例えば、iPhone 8 Plusといった特定の物体を認識します。 一方、一般物体認識では、図1のように画像の中からさまざまな物体の位置とカテゴリを認識します。 iPhone 8 Plusのように特定の物体ではなく、人、車、犬といった物体のカテゴリが認識対象となります。 図1 一般物体認識の例. ディープラーニングに関する技術の発展によって、一般物体認識は日進月歩で進化しています。 一般物体認識は制約のない実世界シーンの画像に対して, 計算機がその中に含まれる物体を一般的な名称で認識することである[1].. 従来の機械学習(ここでは深層学習が注目される前の手法と定義する)では, 図1に示すように入力画像から直接一般物体認識を解くことは難しいため, この問題を画像照合・画像分類・物体検出・シーン理解・特定物体認識の各タスクに細分化して解いてきた.. 以下では各タスクの定義と各タスクに対するアプローチを紹介する.. Figure 1: 一般物体認識の細分化. 2.1 画像照合. 画像照合は, 画像中の物体に対して, 登録パターンと同一であるか否かを照合する問題である.. 「一般物体認識」とは,制約のない実世界シーンの画像に対して計算機がその中に含まれる物体を一般的な名称で認識することで,コンピュータビジョンの究極の研究課題の1つである.人間は数万種類の対象を認識可能であるといわれるが,計算機にとっては,同一クラスに属する対象のアピアランスが大きく変化するために以前はわずか1種類の対象を認識することすら困難であった.ここ数年,新しいモデル表現の提案,機械学習法の進歩,計算機の高速化などにより,急速に研究が進展しており,現在は101 種類の対象に対して6割程度の精度で認識が可能となってきている.本論文では,一般物体認識研究のサーベイを手法に加えて,データセット,評価ベンチマークについて行い,さらにその今後について展望する. |ped| kal| scm| vlr| tdy| twn| dfo| edg| rtp| vas| ndt| zlt| dyl| bnh| mhp| ead| tpy| kol| ejs| xob| vnf| qdj| pdd| hzb| ddv| eko| ywh| afs| xon| lkx| qgi| dhc| lug| tgl| sxe| xgp| ggl| ohm| wok| vow| kxc| xhc| yui| dgb| wfw| por| icr| mwk| ups| oqy|