OCR・文字認識

日本語OCR完全ガイド

スキャンした書類、スマホで撮った名刺、紙のレシート、縦書きの本のページ—— 日本語の活字をテキスト化したい場面は意外と多いものです。 しかしGoogleドキュメントやクラウドOCRに業務書類をアップロードすることに抵抗を感じる方も多いはず。 本ガイドでは、ブラウザ内で完結する日本語OCRの実用的な手順と、縦書き・手書きへの対応範囲、 校正のコツまでまとめて解説します。

なぜブラウザ完結のOCRが必要か

OCRしたい画像には、想像以上にセンシティブな情報が含まれます。 名刺の電話番号、レシートのクレジットカード下4桁、契約書の金額、医療領収書の病院名、 役所の通知書類の住所——いずれも一度でも外部サーバーに送信されればプライバシーリスクとなる情報です。

Googleドキュメント、Adobe Acrobat、Microsoft Lensなどの主要OCRサービスは すべてファイルをクラウドにアップロードして処理する方式です。 「処理後に削除する」と謳っていても、ログ・バックアップ・サーバー所在国の法令により データが残留・開示される可能性は否定できません。

ブラウザ内OCRは、 OCRエンジン(Tesseract.js)を画像と一緒にあなたのブラウザにダウンロードし、 すべての処理をローカルで実行します。ネットワーク通信は最初のエンジンダウンロードだけで、 画像データ自体は外部に送信されません。

FreeToolで日本語OCRを行う手順

1

画像OCRページを開く

freetool.jp/image/ocr にアクセスします。アカウント登録もインストールも不要です。Chrome・Edge・Safariの最新版で動作します。

2

OCRしたい画像をドロップ

JPG・PNG・WebP形式の画像をドラッグ&ドロップします。スキャンした書類、スマホで撮った活字、スクリーンショットなど何でも投入できます。

3

言語を選択

日本語のみ、英語のみ、または日本語+英語の混在モードから選びます。混在モードは精度がやや落ちるため、可能であれば言語を1つに絞ることを推奨します。

4

OCRを実行してコピー

実行ボタンを押すとブラウザ内でTesseractが起動します。初回は言語データのダウンロード(10〜30秒)が発生しますが、2回目以降はキャッシュから即起動。認識結果はそのままコピー・ダウンロード可能です。

精度を上げる撮影・スキャンのコツ

  • 解像度を上げる:スキャンは300dpi以上を推奨。スマホ撮影なら4K以上の解像度設定で撮ると認識率が大きく上がります。
  • 明るさとコントラスト:背景が白、文字が黒の状態が理想。影が落ちる撮影は精度を大きく下げます。蛍光灯の真下や自然光の下で撮影してください。
  • 傾きを補正:撮影時に紙が斜めだとOCR精度が下がります。スマホアプリの「書類スキャン」モードで自動補正してから投入するのが効果的です。
  • 画像形式:JPGよりPNGや高品質JPGの方が文字エッジが鮮明で精度が出ます。HEICからの変換時にも品質を90%以上に保ってください。
  • PDFをOCRしたい場合:FreeToolの「PDF→画像変換」で各ページを画像化してから、画像OCRに投入してください。

他のOCRサービスとの比較

サービス日本語精度送信先コスト
FreeTool(ブラウザ完結)活字○ / 縦書き△ / 手書き×送信なし無料
Google ドキュメント活字◎ / 縦書き△ / 手書き△Googleサーバー無料
Adobe Acrobat OCR活字○ / 縦書き○ / 手書き×Adobeサーバー月額2,000円〜
Google Cloud Vision API活字◎ / 縦書き◎ / 手書き○Googleサーバー従量課金
Microsoft Lens活字○ / 縦書き△ / 手書き△Microsoftサーバー無料

縦書き・手書きへの対応

縦書きはTesseractの`jpn_vert`データで対応可能です。 FreeToolのOCRで言語選択時に縦書きモードに切り替えると、明治以降の活版印刷の小説、 新聞記事、雑誌などある程度認識できます。ただし行の折り返しや段組はうまく扱えないため、 ページ単位での認識→手作業での整形が必要です。

手書き文字はTesseractの苦手分野です。 楷書で書かれたきれいな数字や英字は部分的に認識できますが、漢字・続け字・走り書きは ほぼ認識できません。手書き原稿のOCRが必要な業務では、Google Cloud Vision API、 Microsoft Azure Computer Vision、専用の手書きOCRサービスをご利用ください。

それでもFreeToolが選ばれるのは、活字スキャンに限定すれば 「機密書類を絶対に外部送信したくない」というニーズを唯一満たせるからです。 社内文書のテキスト化、人事資料のデジタル化、医療領収書の整理、社外秘契約書の検索可能化に向いています。

関連ツール・ガイド

よくある質問

FreeToolのOCRはどんな日本語を認識できますか?
Tesseract.jsの日本語データ(jpn・jpn_vert)を使い、印刷された横書きの日本語を高精度で認識します。教科書フォント・明朝・ゴシック・MS Mincho・游ゴシックなど一般的なフォントは安定して読み取れます。縦書きは専用モードを選択することで対応可能ですが、横書きより精度がやや落ちます。手書きや崩し字は基本的に対象外です。
GoogleドキュメントのOCRと精度はどう違いますか?
Google ドキュメントのOCRは大規模な学習データを使うため、Tesseractより認識精度は高い傾向にあります。一方、Googleドライブにファイルをアップロードする必要があり、業務文書や機密書類の取り扱いに不安があります。FreeToolはローカルOCRなのでファイルがクラウドに送信されません。精度よりプライバシーを優先する場面(社外秘書類・人事資料・医療記録など)に最適です。
縦書きの古文書や本のページもOCRできますか?
明治以降の活版印刷の縦書きであれば、Tesseractの縦書きモードである程度認識できます。ただし、変体仮名や旧字体、毛筆風の活字、和歌の改行レイアウトなどは精度が著しく低下します。古文書のOCRには専用サービス(KuroNetなど)の使用を推奨しますが、明治・大正期の小説本などは試す価値があります。
手書き文字は読み取れますか?
Tesseractは活字向けに設計されているため、手書き文字の認識は基本的に苦手です。きれいに書かれた楷書の数字や英字は一部認識できる場合がありますが、漢字や続け字、走り書きはほぼ認識できません。手書き原稿のOCRが必要な場合は、Google Cloud Vision APIや専用の手書きOCRサービスをご利用ください。FreeToolは活字スキャン・スマホ撮影の活字テキストに特化しています。
OCR後のテキストの誤認識を効率的に直すには?
OCR結果は完全ではなく、必ず人間による校正が必要です。コツは「縦の流し読みより、行単位の対比読み」です。元画像と認識結果を左右に並べ、1行ずつ確認することで誤認識を見逃しにくくなります。「O」と「0」、「l」と「I」と「1」、「カ」と「力」など、機械が混同しやすい文字を意識して校正すると効率的です。