コンピューターと人間が画像を認識する際に一番の違いは何だと思いますか?
それは「経験」の違いです。
経験値のないコンピューターは人間の赤ちゃんと同じで猫と犬の区分ができません。
人間は自らの学習能力で積み重なった経験値をもとに初めてみた猫も猫として
瞬時に推測・判断できる訳です。
コンピューターにも大量の画像を与え、
対象物の特徴を自動的に「学習」してもらうと
人間以上の精度で画像を判別できるようになります。
これは「ディープラーニング」分野の基本的な考え方です。
画像の中から定められた物体の位置と種類、個数を特定する技術で、
スマートフォンのカメラが人の顔だけを識別するとか
自動運転の分野で歩行者を検出することで活用されております。
顔画像から目立つ特徴を抽出する技術で、
顔の識別、照合、人間の表情から感情を読み取ることもできるし、
物体認識と併用されることが多いです。
紙に書かれた印刷文字や、手書きの文字などを判別する技術で、
画像内のテキストを抽出することができます。
OCR分野はかなり古くから研究されている
分野で最近はスマホに基本搭載されているほど身近な技術となりました。
翻訳技術と合わせたシステムが実現されるなど、利用用途の多い技術分野です。