画像からテキストへ — 無料オンラインOCR
写真、スクリーンショット、スキャンした文書からテキストを瞬時に抽出します。30以上の言語に対応。完全無料、アップロード不要、ブラウザ上で動作します。
ここに画像をドロップしてください
JPG、PNG、WebP、BMP、TIFF、GIF形式に対応(最大50MB)
初回使用時にはOCR言語パック(言語ごとに約4~10MB)がダウンロードされます。その後はキャッシュされるため、次回からはオフラインでも使用できます。画像はデバイスから外部に送信されることはありません。
あらゆる画像から正確なテキスト抽出
Tesseract OCR(世界で最も人気のあるオープンソースのテキスト認識エンジン)を搭載。ブラウザ上で完全に動作し、ファイルのアップロードは一切不要です。
30以上の言語に対応
英語、スペイン語、フランス語、ドイツ語、中国語、アラビア語、ヒンディー語、日本語、韓国語、ロシア語など、20以上の言語でテキストを抽出します。言語パックは必要に応じてダウンロードされ、ローカルにキャッシュされます。
完全非公開 — アップロード禁止
OCR処理はすべてWebAssemblyを介してブラウザ上で直接実行されます。画像はデバイスから外部に送信されることはありません。機密文書、契約書、個人写真などに最適です。
スクリーンショットとスキャン画像の処理
スクリーンショット、スキャンしたPDFを画像としてエクスポートしたもの、領収書、名刺、ホワイトボード、手書きのメモなどに最適です。画像内の判読可能なテキストであれば何でも対象となります。
永久無料、登録不要
アカウント不要、クレジットカード不要、透かしなし、利用制限なし。大手テクノロジー企業が採用しているのと同じTesseractエンジンが、今ならブラウザで無料で利用できます。
信頼度スコア
抽出後、認識されたテキストの信頼性を示す信頼度パーセンテージが表示されます。これにより、結果を再確認する必要があるタイミングがわかります。
ワンクリックでコピー&ダウンロード
抽出したテキストを即座にクリップボードにコピーするか、プレーンテキストファイル(.txt)としてダウンロードできます。文書、メール、スプレッドシートなど、あらゆる場所に貼り付けて使用できます。
画像OCRで何ができるのか
印刷された文書のデジタル化からスクリーンショットからのデータ抽出まで、OCRは静止画像を編集可能で検索可能なテキストに変換します。
文書およびスキャンされたページ
スキャンしたPDFファイル(画像としてエクスポートされたもの)、手紙、印刷された文書を編集可能なテキストに変換します。手作業での再入力にかかる時間を大幅に節約できます。
- 印刷された契約書や手紙をデジタル化する
- スキャンした書籍ページからテキストを抽出する
- 領収書を経費記録に変換する
スクリーンショットとデジタルコンテンツ
アプリのスクリーンショット、ソーシャルメディアの投稿、エラーメッセージ、またはコピー&ペーストができない画像からテキストを抽出します。すぐに編集可能です。
- 画像としてエクスポートされたロックされたPDFからテキストをコピーする
- ソーシャルメディアのスクリーンショットから引用文を抽出する
- ソフトウェアのスクリーンショットからエラーメッセージを取得する
多言語対応&国際
中国語、アラビア語、ヒンディー語、日本語、キリル文字、その他25以上の言語のテキストを同じツールで認識できます。これは、無料のブラウザベースのOCRとしては珍しい機能です。
- 旅行中にメニューや看板を翻訳する
- 外国語文書をデジタル化する
- スクリーンショットから字幕を抽出する
仕組み
画像をドラッグ&ドロップまたは選択してください。JPG、PNG、WebP、BMP、TIFF、GIF形式に対応しており、最大50MBまでご利用いただけます。
画像内のテキストの言語を選択してください。言語パックは一度ダウンロードされ(約4~10MB)、ローカルにキャッシュされるため、次回以降はすぐに使用できます。
Tesseract OCRはブラウザ上で動作し、すべてのテキストを抽出します。クリップボードにコピーするか、.txtファイルとしてダウンロードすれば完了です。
よくある質問
弊社の無料OCRツールを使って画像からテキストを抽出する方法について、知っておくべきことをすべてご紹介します。
このツールは私の画像をサーバーにアップロードしますか?
いいえ。OCR処理はすべてTesseract.jsとWebAssemblyを使用してブラウザ内で実行されます。画像はデバイスから外部に送信されることはありません。サーバーは一切関与しません。そのため、機密文書、契約書、医療記録、その他機密性の高いコンテンツにも安全にご利用いただけます。
どの画像フォーマットがサポートされていますか?
JPG、JPEG、PNG、WebP、BMP、TIFF、GIF形式に対応しており、最大50MBまで対応しています。OCRの精度を最大限に高めるには、テキストと背景のコントラストが良好な高解像度画像(スキャンした文書の場合は300dpi以上)を使用してください。ぼやけた画像や解像度の低い画像では、OCRの精度が低下する可能性があります。
OCRはどの言語を認識できますか?
英語、スペイン語、フランス語、ドイツ語、ポルトガル語、イタリア語、オランダ語、ロシア語、アラビア語、中国語(簡体字・繁体字)、日本語、韓国語、ヒンディー語、ベトナム語、タイ語、ポーランド語、チェコ語、ルーマニア語など、30以上の言語に対応しています。実行前に言語を選択してください。言語パック(約4~10MB)は一度ダウンロードされ、ローカルにキャッシュされます。
信頼度スコアは何を意味するのですか?
信頼度スコア(0~100%)は、Tesseractが認識したテキストに対する確信度を示します。80%を超えるスコアは、信頼性の高い抽出であることを示します。50~80%のスコアは、多少の不確実性があることを示唆します。出力結果を注意深く確認してください。50%未満の場合は、通常、画像がぼやけている、コントラストが低い、または特殊なフォントが使用されていることを意味します。OCRを実行する前に画像品質を向上させると、スコアが向上します。
テキスト抽出の精度はどの程度ですか?
Tesseractは、Google、大学、企業向けソフトウェアなどで使用されている、最も高精度なオープンソースOCRエンジンの1つです。精度は画像品質に大きく左右されます。デジタルテキストの鮮明なスキャン画像やスクリーンショットであれば、通常95%以上の精度が得られます。手書き文字、装飾的なフォント、低解像度の写真などは精度が低下します。最適な結果を得るには、十分な照明、高解像度、そして鮮明なコントラストを確保してください。
手書き文字を読み取れますか?
Tesseractは主に印刷されたテキストで学習されており、筆記体やカジュアルな手書き文字には最適化されていません。印刷されたブロック体の手書き文字は中程度の精度で認識できますが、流れるような筆記体では精度が低下します。高精度の手書き文字認識には、専用の手書き文字OCRモデル(Google LensやMicrosoftのHandwriting APIなど)の方が適しています。