PixConvert

图片转文字——免费在线OCR识别

立即从任何照片、屏幕截图或扫描文档中提取文本。支持 30 多种语言。100% 免费,无需上传,完全在浏览器中运行。

首次使用会下载 OCR 语言包(每种语言约 4-10 MB)。下载完成后会缓存,下次可离线使用。您的图像永远不会离开您的设备。

从任何图像中精确提取文本

由 Tesseract OCR 提供技术支持——Tesseract OCR 是全球最流行的开源文本识别引擎。完全在浏览器中运行,无需上传任何文件。

支持30多种语言

可提取英语、西班牙语、法语、德语、中文、阿拉伯语、印地语、日语、韩语、俄语等 20 多种语言的文本。语言包按需下载并缓存于本地。

100% 私密 — 禁止上传

所有 OCR 处理均通过 WebAssembly 在您的浏览器中直接运行。您的图像不会离开您的设备——非常适合用于机密文件、合同和个人照片。

适用于屏幕截图和扫描件

非常适合截取屏幕截图、扫描并导出为图像的 PDF 文件、收据、名片、白板内容和手写笔记。图像中任何可读文本均可处理。

永久免费,无需注册

无需注册账号,无需信用卡,无水印,无每日限额。与各大科技公司使用的 Tesseract 引擎相同——现在可在您的浏览器中免费使用。

置信度评分

提取后,可以看到置信度百分比,它会告诉你识别出的文本有多可靠——这样你就知道什么时候需要再次检查结果。

一键复制和下载

提取的文本可立即复制到剪贴板,或下载为纯文本.txt文件。可直接粘贴到任何文档、电子邮件或电子表格中。

图像OCR技术能做什么?

从将打印文档数字化到从屏幕截图中提取数据——OCR 将静态图像转换为可编辑、可搜索的文本。

文档和扫描页面

将扫描的PDF文件(导出为图像)、纸质信件和打印文档转换为可编辑文本。节省大量手动重新输入的时间。

  • 将印刷的合同和信函数字化
  • 从扫描的书籍页面中提取文本
  • 将收据转换为费用记录

屏幕截图和数字内容

从应用截图、社交媒体帖子、错误信息或任何无法复制粘贴的图片中提取文本。即时可编辑。

  • 从导出为图像的锁定 PDF 中复制文本
  • 从社交媒体截图中提取引语
  • 从软件屏幕截图中捕获错误信息

多语种和国际化

同一个工具即可识别中文、阿拉伯语、印地语、日语、西里尔字母以及其他 25 种以上语言的文本——对于一款免费的基于浏览器的 OCR 来说,这是一项罕见的功能。

  • 旅行途中翻译菜单和标牌
  • 将外语文件数字化
  • 从屏幕截图中提取字幕

工作原理

1

拖放或选择您的图片。我们支持 JPG、PNG、WebP、BMP、TIFF 和 GIF 格式,最大文件大小为 50 MB。

2

请选择图片中文本的语言。语言包只需下载一次(约 4–10 MB),并缓存在本地,以便日后立即使用。

3

Tesseract OCR 在您的浏览器中运行,并提取所有文本。复制到剪贴板或下载为 .txt 文件——完成。

常见问题解答

您需要了解的有关使用我们的免费 OCR 工具从图像中提取文本的所有信息。

这个工具会将我的图片上传到服务器吗?

不。所有 OCR 处理都完全在您的浏览器中使用 Tesseract.js 和 WebAssembly 完成。您的图像永远不会离开您的设备——无需服务器参与。这确保了机密文档、合同、医疗记录和任何敏感内容的安全。

支持哪些图像格式?

我们支持 JPG、JPEG、PNG、WebP、BMP、TIFF 和 GIF 格式的文件,最大文件大小为 50 MB。为了获得最佳的 OCR 识别精度,请使用高分辨率图像(扫描文档至少 300 DPI),并确保文本与背景之间具有良好的对比度。模糊或分辨率过低的图像可能会导致识别结果置信度降低。

OCR可以识别哪些语言?

我们支持 30 多种语言,包括英语、西班牙语、法语、德语、葡萄牙语、意大利语、荷兰语、俄语、阿拉伯语、中文(简体和繁体)、日语、韩语、印地语、越南语、泰语、波兰语、捷克语、罗马尼亚语等等。请在运行程序前选择您的语言——语言包(约 4-10 MB)只需下载一次并缓存到本地。

置信度得分意味着什么?

置信度得分(0-100%)反映了 Tesseract 对识别文本的确定程度。高于 80% 的得分表示提取结果可靠。50-80% 之间的得分表示存在一定不确定性——请仔细检查输出结果。低于 50% 通常意味着图像模糊、对比度低或使用了不常见的字体。在运行 OCR 之前提高图像质量可以提高得分。

文本提取的准确率如何?

Tesseract 是目前最精准的开源 OCR 引擎之一,被谷歌、大学和企业软件广泛使用。准确率很大程度上取决于图像质量:清晰的扫描件和数字文本截图通常能达到 95% 以上的准确率。手写文本、艺术字体和低分辨率照片的准确率会较低。为了获得最佳效果,请确保光线充足、分辨率高且对比度清晰。

它能识别手写字迹吗?

Tesseract 主要针对印刷文本进行训练,并未针对草书或随意书写进行优化。它或许能以中等准确率识别印刷体印刷体,但对于流畅的草书,识别效果会很差。若要获得高精度的手写识别结果,专用的手写 OCR 模型(例如 Google Lens 或 Microsoft 的 Handwriting API)会更为合适。