画像はサーバーに送信されますか？

いいえ。Tesseract.jsはWebAssembly技術を使い、すべての処理をブラウザ内で実行します。選択した画像がインターネットを通じてサーバーに送信されることは一切ありません。

初回のダウンロードは毎回必要ですか？

いいえ。初回にダウンロードされたOCRエンジンと言語データはブラウザにキャッシュされます。同じブラウザで再度アクセスすれば、キャッシュから高速に読み込まれます。ブラウザのキャッシュをクリアした場合は再ダウンロードが必要です。

手書き文字は認識できますか？

はっきりとした手書き文字であれば一定の認識は可能ですが、Tesseractエンジンは印刷文字向けに最適化されているため、手書き文字の認識精度は大幅に低下します。

縦書き日本語は認識できますか？

日本語の学習データには縦書き用のモデル（jpn_vert）が含まれており、縦書きテキストの認識にも対応しています。ただし横書きに比べると精度がやや低い場合があります。

複数のテキスト領域がある画像でも認識できますか？

はい。Tesseractはページ分割機能により、画像内の複数のテキストブロックを自動検出します。各ブロックの認識結果と信頼度を個別に確認できます。

ビジネス・仕事効率化

OCR 画像文字認識

画像から文字を読み取るブラウザ内OCR。日本語・英語・中国語・韓国語対応。Tesseract.jsエンジンでブラウザ内完結処理。テキストブロック単位の信頼度表示、コピー機能付き。

ブラウザ内OCR: 画像から文字を読み取ります。すべてブラウザ内で処理され、画像はサーバーに送信されません。

初回ダウンロード: 初めて使用する際に、OCRエンジン（WASM）と言語データをブラウザにダウンロードします。日本語の場合約12〜16MBのダウンロードが必要です（2回目以降はキャッシュされ高速です）。

認識言語:

📄

画像をドラッグ＆ドロップ、またはクリックして選択

JPEG, PNG, BMP, WebP, TIFF 対応

このツールについて問い合わせる →

OCR 画像文字認識について

OCR（光学文字認識）とは

OCR（Optical Character Recognition）は、画像内の文字をテキストデータとして認識・抽出する技術です。紙の書類のスキャン画像、写真に写った看板やラベル、スクリーンショット内のテキストなどを、コピー＆ペースト可能なテキストに変換できます。

本ツールはTesseract.js（Apache 2.0ライセンス）を使用し、すべての処理をブラウザ内で実行します。画像がサーバーに送信されることはありません。

初回ダウンロードについて

本ツールはブラウザ内でOCRエンジン（WebAssembly）と言語学習データをダウンロードして動作します。

コンポーネント	サイズ目安
OCRエンジン（WASM）	約4 MB
日本語データ	約12 MB
英語データ	約4 MB
日本語＋英語	約16 MB

初回は数秒〜十数秒のダウンロード時間がかかりますが、ブラウザにキャッシュされるため2回目以降は高速に動作します。進捗バーでダウンロード状況をリアルタイムに確認できます。

対応言語と精度

日本語: 印刷文字（明朝体・ゴシック体）で95〜98%の認識精度。手書き文字は精度が低下
英語: 印刷文字で97%以上の高精度
中国語（簡体字）: 印刷文字に対応
韓国語: 印刷文字に対応
日本語＋英語混在: 日英両方の学習データを併用して認識

画像の解像度（300DPI以上推奨）、コントラスト、テキストの傾きが認識精度に大きく影響します。

活用シーン

書類のデジタル化: スキャンした紙の書類からテキストを抽出
名刺の読み取り: 写真に撮った名刺の情報をテキスト化
スクリーンショットからのコピー: 画像内のテキストをコピペ可能に
看板・ラベルの翻訳準備: 写真のテキストを抽出して翻訳ツールに入力
PDF画像のテキスト化: 画像としてスキャンされたPDF内の文字を抽出

よくある質問

Q. 画像はサーバーに送信されますか？: いいえ。Tesseract.jsはWebAssembly技術を使い、すべての処理をブラウザ内で実行します。選択した画像がインターネットを通じてサーバーに送信されることは一切ありません。
Q. 初回のダウンロードは毎回必要ですか？: いいえ。初回にダウンロードされたOCRエンジンと言語データはブラウザにキャッシュされます。同じブラウザで再度アクセスすれば、キャッシュから高速に読み込まれます。ブラウザのキャッシュをクリアした場合は再ダウンロードが必要です。
Q. 手書き文字は認識できますか？: はっきりとした手書き文字であれば一定の認識は可能ですが、Tesseractエンジンは印刷文字向けに最適化されているため、手書き文字の認識精度は大幅に低下します。
Q. 縦書き日本語は認識できますか？: 日本語の学習データには縦書き用のモデル（jpn_vert）が含まれており、縦書きテキストの認識にも対応しています。ただし横書きに比べると精度がやや低い場合があります。
Q. 複数のテキスト領域がある画像でも認識できますか？: はい。Tesseractはページ分割機能により、画像内の複数のテキストブロックを自動検出します。各ブロックの認識結果と信頼度を個別に確認できます。