日本語OCR完全ガイド
スキャンした書類、スマホで撮った名刺、紙のレシート、縦書きの本のページ—— 日本語の活字をテキスト化したい場面は意外と多いものです。 しかしGoogleドキュメントやクラウドOCRに業務書類をアップロードすることに抵抗を感じる方も多いはず。 本ガイドでは、ブラウザ内で完結する日本語OCRの実用的な手順と、縦書き・手書きへの対応範囲、 校正のコツまでまとめて解説します。
なぜブラウザ完結のOCRが必要か
OCRしたい画像には、想像以上にセンシティブな情報が含まれます。 名刺の電話番号、レシートのクレジットカード下4桁、契約書の金額、医療領収書の病院名、 役所の通知書類の住所——いずれも一度でも外部サーバーに送信されればプライバシーリスクとなる情報です。
Googleドキュメント、Adobe Acrobat、Microsoft Lensなどの主要OCRサービスは すべてファイルをクラウドにアップロードして処理する方式です。 「処理後に削除する」と謳っていても、ログ・バックアップ・サーバー所在国の法令により データが残留・開示される可能性は否定できません。
ブラウザ内OCRは、 OCRエンジン(Tesseract.js)を画像と一緒にあなたのブラウザにダウンロードし、 すべての処理をローカルで実行します。ネットワーク通信は最初のエンジンダウンロードだけで、 画像データ自体は外部に送信されません。
FreeToolで日本語OCRを行う手順
画像OCRページを開く
freetool.jp/image/ocr にアクセスします。アカウント登録もインストールも不要です。Chrome・Edge・Safariの最新版で動作します。
OCRしたい画像をドロップ
JPG・PNG・WebP形式の画像をドラッグ&ドロップします。スキャンした書類、スマホで撮った活字、スクリーンショットなど何でも投入できます。
言語を選択
日本語のみ、英語のみ、または日本語+英語の混在モードから選びます。混在モードは精度がやや落ちるため、可能であれば言語を1つに絞ることを推奨します。
OCRを実行してコピー
実行ボタンを押すとブラウザ内でTesseractが起動します。初回は言語データのダウンロード(10〜30秒)が発生しますが、2回目以降はキャッシュから即起動。認識結果はそのままコピー・ダウンロード可能です。
精度を上げる撮影・スキャンのコツ
- 解像度を上げる:スキャンは300dpi以上を推奨。スマホ撮影なら4K以上の解像度設定で撮ると認識率が大きく上がります。
- 明るさとコントラスト:背景が白、文字が黒の状態が理想。影が落ちる撮影は精度を大きく下げます。蛍光灯の真下や自然光の下で撮影してください。
- 傾きを補正:撮影時に紙が斜めだとOCR精度が下がります。スマホアプリの「書類スキャン」モードで自動補正してから投入するのが効果的です。
- 画像形式:JPGよりPNGや高品質JPGの方が文字エッジが鮮明で精度が出ます。HEICからの変換時にも品質を90%以上に保ってください。
- PDFをOCRしたい場合:FreeToolの「PDF→画像変換」で各ページを画像化してから、画像OCRに投入してください。
他のOCRサービスとの比較
| サービス | 日本語精度 | 送信先 | コスト |
|---|---|---|---|
| FreeTool(ブラウザ完結) | 活字○ / 縦書き△ / 手書き× | 送信なし | 無料 |
| Google ドキュメント | 活字◎ / 縦書き△ / 手書き△ | Googleサーバー | 無料 |
| Adobe Acrobat OCR | 活字○ / 縦書き○ / 手書き× | Adobeサーバー | 月額2,000円〜 |
| Google Cloud Vision API | 活字◎ / 縦書き◎ / 手書き○ | Googleサーバー | 従量課金 |
| Microsoft Lens | 活字○ / 縦書き△ / 手書き△ | Microsoftサーバー | 無料 |
縦書き・手書きへの対応
縦書きはTesseractの`jpn_vert`データで対応可能です。 FreeToolのOCRで言語選択時に縦書きモードに切り替えると、明治以降の活版印刷の小説、 新聞記事、雑誌などある程度認識できます。ただし行の折り返しや段組はうまく扱えないため、 ページ単位での認識→手作業での整形が必要です。
手書き文字はTesseractの苦手分野です。 楷書で書かれたきれいな数字や英字は部分的に認識できますが、漢字・続け字・走り書きは ほぼ認識できません。手書き原稿のOCRが必要な業務では、Google Cloud Vision API、 Microsoft Azure Computer Vision、専用の手書きOCRサービスをご利用ください。
それでもFreeToolが選ばれるのは、活字スキャンに限定すれば 「機密書類を絶対に外部送信したくない」というニーズを唯一満たせるからです。 社内文書のテキスト化、人事資料のデジタル化、医療領収書の整理、社外秘契約書の検索可能化に向いています。