去年的時候 Umi-OCR 還不是傳統(tǒng)意義上「截圖-識別-提取文字」的實時工具,而是需要你本地有截圖,再用 OCR 識別引擎進行識別。
彼時還是 1.2 版本的 Umi-OCR,主打的特點是:開源、免費、本地、批量、精準、高效。
當時我做的有測試,比如這樣一份表格截圖。
8 秒后 Umi-OCR 識別的效果喜人,所有鏈接都可以直接復制到瀏覽器正常打開:
哪怕增加難度,從網(wǎng)上找了個手機拍的照片,有對焦不準發(fā)虛的問題,也有右下角的陰影。
耗時 6 秒,Umi-OCR 仍然可以很好的識別出來,小小的遺憾是錯了一個字。
不過,上面這些只是 Umi-OCR 一年前的效果,前兩天我又去 GitHub 上瞅了瞅,不僅僅是 Star 翻了好幾倍,在過去這一年里,作者一直堅守在一線,從未斷過優(yōu)化迭代。
現(xiàn)在的 Umi-OCR 支持了快捷鍵截圖:
同樣的內(nèi)容,識別速度從過去的 6 秒變成了 0.43 秒,而且這次識別率更高。
過去只支持中英兩種語言的 Umi-OCR,現(xiàn)在不用手動 DIY,只要你下的是多國語言版。
在設(shè)置里,可以選擇識別語言,可以配置識別文字段落,還有各種可能會用到的選項,對了,Umi-ORC 現(xiàn)在支持命令行調(diào)用了,擴展屬性喜 +1。
簡單說就是,實用、好用、值得用,有本地 OCR 需要的小伙伴可以試試看,不知道當初被安利的小伙伴,有沒有用上最新版。
不過有一說一,OCR 工具雖然有用,但對于大多數(shù)人來說,它不是什么高頻需求,尤其是微信圖片可以直接復制提取文字后,我就很少折騰 OCR 工具了。
因為一個辦公時必須打開的微信,就已經(jīng)能夠滿足日常 OCR 的需求了。。。
當然,微信不夠看,需要上強度的時候,手里備一個 14 版的 ABBYY,備一個白描,備一個夸克,備一個千百 OCR 肯定沒毛病。
但,像 Umi-OCR 這樣的開源項目,有沒有更廣泛的用法呢?我在小眾軟件論壇上看見個帖子,把 Umi-OCR 玩出了新高度。
簡單說,作者寫了個腳本,把 Umi-OCR 和大名鼎鼎的 Everything 聯(lián)系了起來。你可以利用 Umi-OCR 的識別,然后實現(xiàn)搜圖片里文字的效果。
正常的截圖沒啥好測試的,畢竟 Umi-OCR 識別效果實打?qū)嵉暮?,不過為了讓搜圖更給力,我去網(wǎng)上下載了 2000 多張表情包,表情包質(zhì)量都是這樣的:
下面我們來聊聊這個腳本該怎么用。
具體操作
腳本的實現(xiàn)思路就像我前面說的那樣,用進化了的 Umi-OCR 先去識別當前文件夾下的每一張圖并輸出成 TXT 文本,然后腳本把文本收集起來,當你打開 Everything 后,即可用腳本的快捷鍵去文搜圖。
所以在使用腳本前,我們需要在 Umi-OCR 上做一些設(shè)置,具體的設(shè)置是紅框框里的那些——
1、勾選遞歸是為了找出所有的圖片
2、獨立 txt 是為了一張圖對應一個文本
3、不含文字不輸出,不會創(chuàng)建多余文本
4、段落合并,整句搜索更準確
所以設(shè)置下來是這個樣子。
然后,用 Umi-OCR 批量識別你存放圖片的文件夾,拖拽文件夾到工具內(nèi)即可。
2000 多張表情包,大概花了 48 秒左右,速度這里,因為 Umi-OCR 識別是走本地的,當然會和硬件以及圖片上文字數(shù)掛鉤,2000 多張 PDF 純文字截圖花的時間肯定也不是 48 秒,這里提一下,免得大家誤會。。。
此時,存放圖那個目錄下,就會生成與圖片同名的文本文件。
該去配置腳本了,解壓后的腳本是這個樣子,先去找「setting」的配置文件,打開方式選記事本就行。
配置文件很簡單,長下面這個樣子,簡單說就是文件目錄前如果加 0,那么腳本會找當前目錄下的圖片;文件目錄前如果加 1,那么會遞歸找到目錄下所有文件夾的圖片。
前兩行是腳本作者自帶的示例,刪了,留我們自己的文件目錄即可,千萬記得保存推出。
運行「收集 txt」腳本,你會發(fā)現(xiàn)圖片目錄里的文本沒了。
實際上被轉(zhuǎn)移到了「案記」的目錄下。
做好了這些準備工作,再啟動「案記鎖圖」腳本,開啟 Everything,快捷鍵「Ctrl+Alt+F」即可完成文搜圖。
Everything 搜文件有多快,腳本搜圖速度就有多快,全部都是本地完成,沒有風險。
為啥敢這么說,打包前的 AHK 腳本代碼不是在那嗎,文本打開瞅一眼,沒有任何泄露風險的代碼。
如果不放心,可以根據(jù)這個本文思路,自行打包,或者安裝個 AutoHotkey 直接用。。。
總結(jié)
其實拋開這個腳本不談,進化后的 Umi-OCR 也是值得被分享的,如何取舍就看大家的需求了,我把這篇文章涉及到的鏈接都放這里。
Umi-OCR 項目地址:https://github.com/hiroi-sora/Umi-OCR
Umi-OCR 作者提供的藍奏云:https://hiroi-sora.lanzoul.com/s/umi-ocr
我存了一份多語言版的藍奏云,這是 GitHub 上有,但限于大小,作者提供的藍奏云里缺少的部分,如果要體積更小的通用版(中、英),去作者那里下就行。
多語言版:https://www.123pan.com/s/LyaDVv-RXECd.html
小眾軟件帖子:https://meta.appinn.net/t/topic/43188
你可以去帖子里下載腳本,我也存了份藍奏云,大伙看著選就行。
藍奏云:https://wwul.lanzoue.com/i9mI60v0c9dg
大體上這篇就這么多內(nèi)容了,我發(fā)現(xiàn) OCR 工具還真的是一年一寫,今年暫定的 C 位仍是 Umi-OCR,希望后面有更強更好用的選擇。
你的點贊就是對我最大的支持,有緣下篇見咯,over。
聯(lián)系客服