読み取った結果の修正
いくらOCRソフトといえども、文字の認識が完璧に行えるわけではありません。手書きのものや印刷状態の悪い原稿を使うと、原稿とは異なるテキストで誤認識されてしまうことがあります。
そのような場合は、右画面で誤認識されている文字の先頭にカーソルを移動して、テキストを編集してやれば簡単に修正できますし、誤認識された文字を次回から正しく認識するように辞書に登録しておくこともできます。
辞書に登録するには、誤認識された文字の先頭にカーソルを置いたまま、「オプション - ユーザー辞書の設定…」を開いて正しい文字に変更し、“追加”ボタンを押します。
【ユーザ辞書の設定ダイアログ】
※ この状態のまま、左上の「牌」の文字を「胸」に書き換えて(追加)ボタンを押します。
これで次回から、同じイメージを「胸」で認識するようになります。
また「認識 - パラメータの設定…(*1)」を変更することで、認識精度が改善される場合があります。特に「かすれ補正をする」のチェックをオフにすると、うまく認識されるようになる場合が多いようです。
(*1)このメニューはスキャンした画像を表示しているウインドウが最前面の状態で、かつ赤色の範囲選択がある場合のみ選択可能です。赤色の選択位置をダブルクリックしても表示されます。
【認識パラメータの設定ダイアログ】
※上図はオンの状態、(デフォルトに登録)ボタンを押せば、
今後の認識処理の初期設定にできます。
認識結果の保存ほか
認識結果は、「ファイル - 認識結果の保存」により、いろいろな形式で保存できます。PDF形式ならば、テキストの位置やスタイルに加えて画像等の情報をそのまま保持してくれるので便利です。もちろん、Mac OS X の標準機能である“検索用の索引を使った検索機能(*2)”により内容で検索することも可能。
(*2) Windows で PDF を内容で検索する場合は別途ソフトウェアが必要です。
【認識結果の保存 ダイアログ】
※ファイルの種類を選択して保存します。
PDF形式は[標準]のほうがサイズが小さいのでおすすめです。
【ファイルの種類と拡張子の対応表】
[レイアウト]/[段組み]
[標準]/[透明テキスト]
.txt にします
後から複数のPDFファイルを1つのPDFファイルにまとめたい場合、オンラインソフトの「PDFLab 」「iMergePDFs 」などを利用するとよいでしょう。
(Windows 向けの同様なフリーソフトは ConcatPDF があります。ただし、こちらでは試していないので動作は保証しません。)
(2005年2月10日 木下幹司 )
関連リンク:
エー・アイ・ソフト
エー・アイ・ソフト「読んde!!ココ Ver.7 for Macintosh」製品紹介
エー・アイ・ソフト サポート情報 (アップデータなどのダウンロード)