N2
NanToo
AD
ビジネス・仕事効率化

OCR 画像文字認識

画像から文字を読み取るブラウザ内OCR。日本語・英語・中国語・韓国語対応。Tesseract.jsエンジンでブラウザ内完結処理。テキストブロック単位の信頼度表示、コピー機能付き。

ブラウザ内OCR: 画像から文字を読み取ります。すべてブラウザ内で処理され、画像はサーバーに送信されません。

初回ダウンロード: 初めて使用する際に、OCRエンジン(WASM)と言語データをブラウザにダウンロードします。 日本語の場合約12〜16MBのダウンロードが必要です(2回目以降はキャッシュされ高速です)。

AD

OCR 画像文字認識について

OCR(光学文字認識)とは

OCR(Optical Character Recognition)は、画像内の文字をテキストデータとして認識・抽出する技術です。紙の書類のスキャン画像、写真に写った看板やラベル、スクリーンショット内のテキストなどを、コピー&ペースト可能なテキストに変換できます。

本ツールはTesseract.js(Apache 2.0ライセンス)を使用し、すべての処理をブラウザ内で実行します。画像がサーバーに送信されることはありません。

初回ダウンロードについて

本ツールはブラウザ内でOCRエンジン(WebAssembly)と言語学習データをダウンロードして動作します。

コンポーネントサイズ目安
OCRエンジン(WASM)約4 MB
日本語データ約12 MB
英語データ約4 MB
日本語+英語約16 MB

初回は数秒〜十数秒のダウンロード時間がかかりますが、ブラウザにキャッシュされるため2回目以降は高速に動作します。進捗バーでダウンロード状況をリアルタイムに確認できます。

対応言語と精度

  • 日本語: 印刷文字(明朝体・ゴシック体)で95〜98%の認識精度。手書き文字は精度が低下
  • 英語: 印刷文字で97%以上の高精度
  • 中国語(簡体字): 印刷文字に対応
  • 韓国語: 印刷文字に対応
  • 日本語+英語混在: 日英両方の学習データを併用して認識

画像の解像度(300DPI以上推奨)、コントラスト、テキストの傾きが認識精度に大きく影響します。

活用シーン

  • 書類のデジタル化: スキャンした紙の書類からテキストを抽出
  • 名刺の読み取り: 写真に撮った名刺の情報をテキスト化
  • スクリーンショットからのコピー: 画像内のテキストをコピペ可能に
  • 看板・ラベルの翻訳準備: 写真のテキストを抽出して翻訳ツールに入力
  • PDF画像のテキスト化: 画像としてスキャンされたPDF内の文字を抽出

よくある質問

Q. 画像はサーバーに送信されますか?
いいえ。Tesseract.jsはWebAssembly技術を使い、すべての処理をブラウザ内で実行します。選択した画像がインターネットを通じてサーバーに送信されることは一切ありません。
Q. 初回のダウンロードは毎回必要ですか?
いいえ。初回にダウンロードされたOCRエンジンと言語データはブラウザにキャッシュされます。同じブラウザで再度アクセスすれば、キャッシュから高速に読み込まれます。ブラウザのキャッシュをクリアした場合は再ダウンロードが必要です。
Q. 手書き文字は認識できますか?
はっきりとした手書き文字であれば一定の認識は可能ですが、Tesseractエンジンは印刷文字向けに最適化されているため、手書き文字の認識精度は大幅に低下します。
Q. 縦書き日本語は認識できますか?
日本語の学習データには縦書き用のモデル(jpn_vert)が含まれており、縦書きテキストの認識にも対応しています。ただし横書きに比べると精度がやや低い場合があります。
Q. 複数のテキスト領域がある画像でも認識できますか?
はい。Tesseractはページ分割機能により、画像内の複数のテキストブロックを自動検出します。各ブロックの認識結果と信頼度を個別に確認できます。
このツールを評価
(0件)