硬字幕:也稱“內嵌字幕”,把字幕文件和視頻流壓制在同一組數據里,像水印一樣,無法分離,對于這樣的字幕想要提取的話就不能用簡單的方法了,通常可以使用一些內含OCR識別的工具,小編分享的一款硬字幕提取工具就可以很好的解決你的問題,經測試,非常好用!免費,綠色,下載就可以使用啦,采支持訊飛OCR、搜狗OCR、百度、有道等OCR識別,精確提取字幕,支持中文、英文、韓語、等眾多語言,有需要的朋友可以下載使用。
硬字幕提取工具使用手冊:
一、目前為止可行的硬字幕(hardsub)提取方案
這里只說“可行”的方案,那些不成熟的、按時收費的,用過就刪的,不在此列。
1.人工手提,用手和眼來提取時間軸和文字。
優點:
準確率高(廢話)。
缺點:
費時費力,不能常做。
2.esrXP + IdxSubOcr(MODI的OCR)
esrXP提取帶時間軸信息的字幕圖片,打包成一個idx文件,然后導入IdxSubOcr用MODI ocr識別文字。
優點:
用了計算機圖像技術判斷字幕出現和消失的時間點,從而提取時間軸信息,準確率較高。
缺點:
老掉牙的微軟MODI ocr識別引擎準確率較低,為了照顧MODI ocr,esrXP需要做較多設置、試驗、調整參數的工作,以便提供漂亮的黑底白字clearTxT給MODI ocr,這就很考驗用戶的經驗了。總體來說識別率不高、工作量較大。雖然esrXP已經停更多時,但是苦于沒有更好的選擇,長期以來字幕愛好者只能將就著用。
3.VideoSubFinder_5.50_x64 + ABBYY FineReader 15
VideoSubFinder_5.50_x64做類似esrXP的工作(區別是保存每個字幕圖片,不打包成一個idx文件),ABBYY FineReader 15做類似IdxSubOcr的工作,將每個jpg字幕圖片ocr識別為一個txt文件,然后回到VideoSubFinder_5.50_x64將所有txt文件合成一個srt文件。
優點:
跟esrXP類似,采用了更先進復雜的計算機圖像技術判斷字幕出現和消失的時間點,從而提取時間軸信息,更好的去重算法,準確率進一步提高(人家叫Finder嘛,從2011年做到現在)。ABBYY FineReader 15除了能ocr中英文,還支持其他語種。
缺點:
ABBYY FineReader 15號稱地表最強離線文字ocr引擎,雖然比MODI ocr好得多,但在實際使用效果上,對比經過數年AI人工智能訓練的云識別引擎(例如百度OCR通用文字識別引擎),識別準確率還是差了一大截。
4.硬字幕提取工具6.1
對了,正是在下:),采用VideoSubFinder_5.50_x64 + 百度搜狗有道訊飛OCR通用文字識別引擎,整合多個工具APP(為什么不好好利用別人的成果呢?),從開始到結束,整個字幕提取流程一氣呵成,識別率高、省時省力。
注:內附詳細教程,請下載后查看!
更新日志:
2021.09.02更新:
1、允許秘鑰拷貝填寫誤多輸入空格
6.3開放了5個OCR,對比6.2只開放了1個OCR
因近期百度免費額度政策調整,導致很多新用戶額度不夠用,故開放5個OCR,不夠用的朋友可以實名申請最多5個OCR秘鑰填入,從而提供5倍于單個賬號的免費額度。如果還不夠用,請購買OCR服務商的額度。
6.5版新增“鼠標左鍵一鍵定位+同時插入空格”功能,校對窗中文本框只須按一下鼠標左鍵就能插入一個空格,對于百度高精度這種文字識別率很高,但是空格不能識別,需要補漏空格的校對工作,變得更輕松了。對比6.3及以前版本支持“鼠標左鍵定位+鼠標右鍵插入空格”,須按兩下鼠標才能插入一個空格(繼續支持)。具體請看6.5版用戶使用手冊 - 校對窗章節。