首页 关于 主要功能 OCR WEB API 电子邮件OCR 奖金计划 FAQ

电子邮件OCR服务

您可将PDF文档、扫描图片等通过电子邮件转换为可编辑的Word、Excel、TXT文本、PDF、Html格式文档。

将PDF或图片文件发到我们的邮箱,然后您可以轻松的从PC或笔记本电脑甚至无线设备接收到转换好的文档邮件。

在使用电子邮件OCR服务之前,您应使用邮箱地址创建onlineocr账号并拥有足够的可转换页数。


如何使用:

  • 新建一封电子邮件
  • 在“收件人”框中输入
  • 将您想要识别的文件或ZIP压缩包添加到邮件附件中(最大30 Mb)
  • 也可在邮件中自定义识别设置(参见下文)
  • 发送邮件

几分钟后,您的邮箱将收到含有转换后的文档附件的邮件。


关于识别设置命令行:

默认情况下的识别设置命令行为:

-lang:english -output:docx -tobw:true -combine:false -pagerange:all -createzip:false

意思为:

-lang - 默认情况下识别语言为英语
-output - 默认情况下输出格式为Word文档
-tobw - 默认情况下将图像转换为黑白图像
-combine - 将输出文件合并到多页文档中,默认情况下禁用
-pagerange- 页面范围。 例如“1-20”,“all” - 默认情况下将识别所有页面。 仅适用于邮件中的单个文档。
-createzip - 将输出文件打包成ZIP压缩文件

因此,您可以发送没有特殊识别设置命令行的邮件,以按照默认设置识别转换图像。

例如:

--------------------------------------------------------------------
Hello OCR!

Best regards,
John
--------------------------------------------------------------------
+ attached images

图像将以英语识别并输出为MS Word格式。在处理之前,图像将转换为黑白色。多页文档则会识别所有页面。


如果您想用英语和葡萄牙语识别图像并转换为TXT格式,请发送以下格式的邮件:

--------------------------------------------------------------------
Hi!

-lang:english,portuguese -output:txt
Best regards,
--------------------------------------------------------------------
+ attached images


这是使用命令行的一些不同示例:

-lang:spanish -output:docx,xlsx

图像将以西班牙语识别并转换为MS Word和Excel格式。其他均为默认设置。

-lang:english,german -output:txt -combine:true

图像将以英语和德语识别并转换为TXT文本格式。输出文件将合并为单个多页文档。 其他均为默认设置。

-pagerange:1-20

如果您发送了一个多页PDF或TIFF文件,且只需识别前20页。其他均为默认设置。

-output:doc -createzip:true

如果您发送了包含多个图像的电子邮件,且需将转换后的DOC格式文件存储为单个zip压缩包。其他均为默认设置。


或者您可以通过以下表单生成识别设置命令行并复制粘贴到邮件中:

语言 输出格式 其他设置
Adobe PDF
Microsoft Excel 97-2003 (xls)
Microsoft Excel (xlsx)
Microsoft Word 97-2003 (doc)
Microsoft Word (docx)
RTF document (rtf)
Text Plain (txt)

转换为黑白图像

合并为多页文档

打包成压缩包

转换所有页面
指定识别页面
生成的邮件OCR命令行