關於 主要特徵 OCR WEB服務 電子郵件OCR 獎金計劃 FAQ

電子郵件OCR服務

電子郵件OCR允許您識別PDF文檔,掃描圖像並通過電子郵件轉換為可編輯的Word,文本,Excel,PDF,Html輸出格式

發送PDF文件或圖像,並像桌面,筆記本電腦或無線設備上的電子郵件一樣輕鬆地接收OCRed轉換文檔。

在使用電子郵件OCR服務之前,您應該使用電子郵件地址創建onlineocr帳戶並擁有足夠的可用頁面。


怎麼運行的:

  • 打開外發電子郵件
  • 在“收件人”字段中輸入
  • 將您想要識別的文件或ZIP存檔附加到外發電子郵件中(最大30 Mb)
  • 可選:在電子郵件正文中定義識別設置
  • 發電子郵件

幾分鐘後,您會將轉換後的文件作為附件收到傳入的電子郵件中。


關於識別設置:

默認情況下,識別設置為:

-lang:english -output:docx -tobw:true -combine:false -pagerange:all -createzip:false

這是什麼意思:

-lang - 指定識別語言,默認為英語
-output - 指定輸出格式,默認為MS Word
-tobw - 默認情況下,將輸入圖像轉換為黑白
-combine - 將輸出文件合併到多頁文檔中,默認情況下禁用
-pagerange- 頁面範圍。 例如“1-20”,“全部” - 將識別所有頁面默認情況下所有頁面。 僅適用於電子郵件中的單個文檔。
-createzip - 將輸出文件放入單個zip-archive中

因此,您可以發送沒有特殊識別設置的電子郵件,默認情況下將使用設置識別圖像。

例如:

--------------------------------------------------------------------
Hello OCR!

Best regards,
John
--------------------------------------------------------------------
+ attached images

圖像將以英語識別並導出為MS Word格式。 在處理之前,圖像將轉換為黑白。 對於多頁文檔,將識別所有頁面。


如果您想用英語和葡萄牙語識別圖像並轉換為TXT格式,請發送下一封電子郵件:

--------------------------------------------------------------------
Hi!

-lang:english,portuguese -output:txt
Best regards,
--------------------------------------------------------------------
+ attached images


使用命令行有不同的示例:

-lang:spanish -output:docx,xlsx

圖像將以西班牙語識別並轉換為MS Word和Excel格式。 其他默認設置。

-lang:english,german -output:txt -combine:true

圖像將以英語和德語識別,並轉換為純文本格式。 輸出文件將合併為單個多頁文檔。 其他默認設置。

-pagerange:1-20

如果您發送一個多頁PDF或TIFF文件,則只能識別前20頁。 其他默認設置。

-output:doc -createzip:true

如果您發送包含多個圖像的電子郵件,則轉換後的DOC文件將存檔到單個zip存檔中。 其他默認設置。


或者您可以通過以下表單構建識別設置並複制並粘貼到電子郵件中:

語言 輸出格式 其他設置
Adobe PDF
Microsoft Excel 97-2003 (xls)
Microsoft Excel (xlsx)
Microsoft Word 97-2003 (doc)
Microsoft Word (docx)
RTF document (rtf)
Text Plain (txt)

轉換為BW

結合

創建ZIP

所有頁面
網頁:
電子郵件OCR的命令行