Umi-OCR文字識(shí)別工具電腦多語(yǔ)言版是一款便捷高效的功能強(qiáng)大免費(fèi)的OCR軟件,適用于Windows操作平臺(tái),還有批量識(shí)別的圖片,支持用戶精準(zhǔn)高效的進(jìn)行文字的識(shí)別,可以將文字識(shí)別后導(dǎo)出成為不同的文件格式,擁有多個(gè)字符識(shí)別庫(kù),滿足用戶的使用需求,無(wú)需網(wǎng)絡(luò)就可以進(jìn)行文字識(shí)別啦,感興趣的用戶快來(lái)下載體驗(yàn)吧~

Umi-OCR文字識(shí)別工具電腦多語(yǔ)言版使用說(shuō)明
快速開(kāi)始
打開(kāi)主程序,將任意 圖片/文件夾 拖入窗口中的白色背景表格區(qū)域,或點(diǎn)擊左上方的 瀏覽 選擇圖片。
若拖入文件夾,則加載文件夾下所有 符合后綴(見(jiàn)后) 的圖片文件。
點(diǎn)擊右上方 開(kāi)始任務(wù) ,等待進(jìn)度條走完。
任務(wù)進(jìn)行中,可隨時(shí)點(diǎn)擊 終止任務(wù)(原開(kāi)始任務(wù)按鈕)來(lái)停止,但下次開(kāi)始時(shí)依然會(huì)從頭開(kāi)始。
點(diǎn)擊 識(shí)別內(nèi)容 選項(xiàng)卡查看輸出文字,或者前往 第一張圖片的目錄 查看識(shí)別結(jié)果txt文件。
識(shí)別內(nèi)容選項(xiàng)卡中,可一鍵將全部文本 復(fù)制到剪貼板 。
基礎(chǔ)設(shè)置
點(diǎn)擊 設(shè)置 選項(xiàng)卡,配置參數(shù)。大部分設(shè)置項(xiàng)(除去輸出目錄、文件名,忽略區(qū)域參數(shù))會(huì)自動(dòng)保存,下次打開(kāi)還是這個(gè)樣。
忽略圖片中某些區(qū)域內(nèi)的文字:
點(diǎn)擊 添加區(qū)域 展開(kāi)配置忽略區(qū)的新窗口。具體配置方式見(jiàn)后。
點(diǎn)擊 清空區(qū)域 清空已配置的所有忽略區(qū)域參數(shù)。
已添加區(qū)域后,上方標(biāo)題文字提示當(dāng)前忽略區(qū)域的 生效分辨率 。
輸出設(shè)置:
將 識(shí)別內(nèi)容寫(xiě)入本地文件 取消勾選后,不會(huì)再生成本地文件,只能在 識(shí)別內(nèi)容 選項(xiàng)卡中查看輸出信息。
輸出調(diào)試信息 若勾選,則會(huì)額外輸出程序工作狀態(tài)的內(nèi)容。
忽略無(wú)文字的圖片 若勾選,則不含文字(或文字全被忽略區(qū)域屏蔽掉)的圖片名稱不會(huì)出現(xiàn)在輸出信息中。
若想生成一份用于瀏覽的markdown文件,則建議取消勾選。
v1.2版本新功能 生成文件可選擇兩種風(fēng)格:純文本.txt文件 和 Markdown風(fēng)格.md文件 。前者可用于查找等一般用途。后者在編輯器或?yàn)g覽器中渲染為圖文并茂的頁(yè)面,可用于瀏覽和欣賞圖集。
v1.2.2版本新功能 可勾選任務(wù)完成后用系統(tǒng)默認(rèn)編輯器打開(kāi)輸出文件或輸出文件夾(不生成本地文件時(shí)無(wú)效)。
輸出目錄 和 輸出文件名 設(shè)置生成的文件的位置和名稱。
當(dāng)拖入第一張圖片且這兩項(xiàng)設(shè)置為空時(shí),自動(dòng)設(shè)置輸出路徑為第一張圖片的父目錄,輸出文件名為 [轉(zhuǎn)文字]_{父目錄}.txt。除非要自定目錄和名稱,否則這兩項(xiàng)默認(rèn)留空即可。
軟件 處理列表 標(biāo)簽頁(yè)的 清空表格 按鈕,除了會(huì)清空已導(dǎo)入的圖片列表,還會(huì)清空 輸出目錄 和 輸出文件名 設(shè)置。這樣下次拖入新圖片時(shí),就能在新的位置存放輸出文件。
識(shí)別器設(shè)置:
識(shí)別器路徑 配置當(dāng)前使用的識(shí)別器exe程序。
圖片后綴 配置軟件允許載入的圖片后綴,不同后綴以空格分隔,必須全為小寫(xiě)。
正常情況下無(wú)需改動(dòng)。
忽略區(qū)域功能
忽略區(qū)域是本軟件特色功能。可用于批量識(shí)別視頻截圖時(shí)排除右上角水印的干擾,批量識(shí)別游戲截圖時(shí)排除UI與按鈕的干擾,讓識(shí)別結(jié)果只留下干凈的臺(tái)詞文本。
“忽略區(qū)域”是指圖片上指定位置與大小的矩形區(qū)域,完全處于這些區(qū)域內(nèi)的文字塊,將被排除。
點(diǎn)擊 設(shè)置 選項(xiàng)卡中的 添加忽略區(qū)域 ,進(jìn)入忽略區(qū)域選擇窗口。
將任意圖片 拖入 該窗口,可預(yù)覽該圖片。將新圖片拖入窗口可切換預(yù)覽,但已繪制的忽略區(qū)域不會(huì)消失;可切換不同圖片來(lái)仔細(xì)調(diào)整忽略區(qū)域。
繪制 忽略區(qū)域 :拖入圖片后,點(diǎn)擊選中左起第一按鈕 +忽略區(qū)域 1 ,然后在圖片上按住左鍵拖拽,繪制矩形區(qū)域。可 撤銷 步驟。
繪制完后,點(diǎn)擊 完成 返回軟件主窗口。若不想應(yīng)用此次繪制,則右上角X,取消。

簡(jiǎn)單案例見(jiàn)下。
簡(jiǎn)單排除視頻截圖中的水印:
打開(kāi)忽略區(qū)域設(shè)置窗口,拖入任一張截圖。 稍等約1秒,面板上會(huì)顯示出圖片,識(shí)別到的文字區(qū)域會(huì)被虛線框起來(lái)。發(fā)現(xiàn)右上角的水印也被識(shí)別到了。
點(diǎn)擊選擇 +忽略區(qū)域 1 ,鼠標(biāo)按住,繪制矩形完全包裹住水印區(qū)域,范圍可以大一些。
點(diǎn)擊 完成 。返回主窗口, 開(kāi)始任務(wù) 。
排除游戲截圖中的兩種UI:
假設(shè)有一組游戲截圖,主要分為兩類圖片,這兩類圖片的文字位置和UI位置不太相同:
A類(上圖左)為對(duì)話模式,字?jǐn)?shù)少,要保留的臺(tái)詞文本在畫(huà)面下方,要排除的UI分布于底端。
B類(上圖右)為歷史文本模式,字?jǐn)?shù)多,從上到下都有要保留的文本(與A類UI位置有重合),要排除的UI分布在兩側(cè)。
拖入一張A類圖片。選擇 +忽略區(qū)域 1 ,繪制矩形包裹住要排除的 底端UI 。
拖入一張B類圖片。選擇 +識(shí)別區(qū)域 ,繪制矩形包裹住 小部分要保留的文本 。注意只要該區(qū)域內(nèi)含有任意保留文本即可,不需要畫(huà)得很大,不需要包裹住所有保留文本;不能與A類圖中 可能存在的任何文本 重合。
然后選擇 +忽略區(qū)域 2 ,繪制矩形包裹住B類圖要排除的 兩側(cè)UI 。
點(diǎn)擊 完成 。返回主窗口, 開(kāi)始任務(wù) 。
Umi-OCR文字識(shí)別工具電腦多語(yǔ)言版功能
批量識(shí)別:支持批量導(dǎo)入處理圖片,可以同時(shí)處理多張圖片,提高處理效率。
忽略指定區(qū)域:具有特殊功能,可以屏蔽視頻右上角水印、游戲UI等指定區(qū)域的內(nèi)容,提升識(shí)別準(zhǔn)確性。
多種導(dǎo)出格式:支持將識(shí)別結(jié)果保存為本地的txt、md、jsonl等多種格式文件,方便后續(xù)處理和應(yīng)用。
即時(shí)截屏識(shí)別:提供即時(shí)截屏功能,可以快速識(shí)別屏幕上的文字內(nèi)容,方便實(shí)時(shí)應(yīng)用。
多語(yǔ)言支持:軟件本體含有簡(jiǎn)體中文和英文識(shí)別庫(kù),并可以根據(jù)需求導(dǎo)入繁中、日、韓、俄、德、法等多國(guó)語(yǔ)言識(shí)別庫(kù),滿足不同語(yǔ)言的識(shí)別需求。

Umi-OCR文字識(shí)別工具電腦多語(yǔ)言版亮點(diǎn)
UMI-OCR最新版支持水印設(shè)置
1.點(diǎn)擊設(shè)置選項(xiàng),在點(diǎn)擊添加忽略區(qū)域,就會(huì)打開(kāi)新窗口。
2.將帶有水印的圖片拖入到窗口。
3.窗口當(dāng)中會(huì)顯示圖片,虛線所框出的區(qū)域是軟件識(shí)別到的文字區(qū)域,如果你不想它被識(shí)別出來(lái),那么點(diǎn)擊忽略區(qū)域并框起來(lái)即可。
4.點(diǎn)擊完成然后回到主窗口,然后正常的開(kāi)始任務(wù)即可。
特點(diǎn)
免費(fèi)開(kāi)源:Umi-OCR是完全開(kāi)源的項(xiàng)目,所有代碼開(kāi)源,用戶可以免費(fèi)使用并自由修改。
離線運(yùn)行:無(wú)需網(wǎng)絡(luò)連接,Umi-OCR可以在離線環(huán)境下運(yùn)行,保護(hù)用戶隱私并提供便捷的OCR體驗(yàn)。
高效快速:采用PaddleOCR-json C++識(shí)別引擎,通過(guò)充分利用計(jì)算機(jī)性能,通常比在線OCR服務(wù)更快速高效。
精準(zhǔn)識(shí)別:默認(rèn)使用PPOCR-v3模型庫(kù),能夠準(zhǔn)確辨認(rèn)常規(guī)文字,并在手寫(xiě)、方向不正、雜亂背景等情景下具有良好的識(shí)別率。
后處理功能:可設(shè)置忽略區(qū)域排除水印,通過(guò)設(shè)置文塊后處理合并排版段落,生成規(guī)整的文本結(jié)果。