光学文字認識は

光学文字認識は、活字の文書の画像をコンピュータが編集できる形式に変換するソフトウェアである。

一般にOCRと略記される。

OCRは、人工知能やマシンビジョンの研究分野として始まった。研究は続けられているが、OCRの中心はその実装と応用に移っている。

光学文字認識とデジタル文字認識は本来別の領域と考えられていた。

光学技術として生き残った部分が非常に少ないため、光学文字認識という言葉は現在ではデジタル文字認識を含むものとみなされている。

初期のシステムは特定の書体を読むための「トレーニング」が必要であった。

現在では、ほとんどの書体を高い識字率で変換することが可能である。

いくつかのシステムでは読み込まれた画像からそれとほぼ同じになるようフォーマットされた出力を生成することが可能である。
update:2010年07月21日