電子郵件OCR允許您識別PDF文檔,掃描圖像並通過電子郵件轉換為可編輯的Word,文本,Excel,PDF,Html輸出格式
發送PDF文件或圖像,並像桌面,筆記本電腦或無線設備上的電子郵件一樣輕鬆地接收OCRed轉換文檔。
在使用電子郵件OCR服務之前,您應該使用電子郵件地址創建onlineocr帳戶並擁有足夠的可用頁面。
怎麼運行的:
- 打開外發電子郵件
- 在“收件人”字段中輸入
- 將您想要識別的文件或ZIP存檔附加到外發電子郵件中(最大30 Mb)
- 可選:在電子郵件正文中定義識別設置
- 發電子郵件
幾分鐘後,您會將轉換後的文件作為附件收到傳入的電子郵件中。
關於識別設置:
默認情況下,識別設置為:
-lang:english -output:docx -tobw:true -combine:false -pagerange:all -createzip:false
這是什麼意思:
參數名稱 |
描述 |
-lang |
指定識別語言,默認為英語 |
-output |
指定輸出格式,默認為MS Word |
-tobw |
默認情況下,將輸入圖像轉換為黑白 |
-combine |
將輸出文件合併到多頁文檔中,默認情況下禁用 |
-pagerange |
頁面範圍。 例如“1-20”,“全部” - 將識別所有頁面默認情況下所有頁面。 僅適用於電子郵件中的單個文檔。 |
-createzip |
將輸出文件放入單個zip-archive中 |
因此,您可以發送沒有特殊識別設置的電子郵件,默認情況下將使用設置識別圖像。
例如: --------------------------------------------------------------------
Hello OCR!
Best regards, John --------------------------------------------------------------------
+ attached images
圖像將以英語識別並導出為MS Word格式。 在處理之前,圖像將轉換為黑白。 對於多頁文檔,將識別所有頁面。
如果您想用英語和葡萄牙語識別圖像並轉換為TXT格式,請發送下一封電子郵件:
--------------------------------------------------------------------
Hi!
-lang:english,portuguese -output:txt
Best regards, -------------------------------------------------------------------- + attached images
使用命令行有不同的示例:
-lang:spanish -output:docx,xlsx
圖像將以西班牙語識別並轉換為MS Word和Excel格式。 其他默認設置。
-lang:english,german -output:txt -combine:true
圖像將以英語和德語識別,並轉換為純文本格式。 輸出文件將合併為單個多頁文檔。 其他默認設置。
-pagerange:1-20
如果您發送一個多頁PDF或TIFF文件,則只能識別前20頁。 其他默認設置。
-output:doc -createzip:true
如果您發送包含多個圖像的電子郵件,則轉換後的DOC文件將存檔到單個zip存檔中。 其他默認設置。
或者您可以通過以下表單構建識別設置並複制並粘貼到電子郵件中: |