九色国产,午夜在线视频,新黄色网址,九九色综合,天天做夜夜做久久做狠狠,天天躁夜夜躁狠狠躁2021a,久久不卡一区二区三区

打開APP
userphoto
未登錄

開通VIP,暢享免費電子書等14項超值服

開通VIP
去年最好用的OCR工具又進化了!

去年的時候 Umi-OCR 還不是傳統(tǒng)意義上「截圖-識別-提取文字」的實時工具,而是需要你本地有截圖,再用 OCR 識別引擎進行識別。

彼時還是 1.2 版本的 Umi-OCR,主打的特點是:開源、免費、本地、批量、精準、高效。

當時我做的有測試,比如這樣一份表格截圖。

8 秒后 Umi-OCR 識別的效果喜人,所有鏈接都可以直接復制到瀏覽器正常打開:

哪怕增加難度,從網(wǎng)上找了個手機拍的照片,有對焦不準發(fā)虛的問題,也有右下角的陰影。

耗時 6 秒,Umi-OCR 仍然可以很好的識別出來,小小的遺憾是錯了一個字。

不過,上面這些只是 Umi-OCR 一年前的效果,前兩天我又去 GitHub 上瞅了瞅,不僅僅是 Star 翻了好幾倍,在過去這一年里,作者一直堅守在一線,從未斷過優(yōu)化迭代。

現(xiàn)在的 Umi-OCR 支持了快捷鍵截圖:

同樣的內(nèi)容,識別速度從過去的 6 秒變成了 0.43 秒,而且這次識別率更高。

過去只支持中英兩種語言的 Umi-OCR,現(xiàn)在不用手動 DIY,只要你下的是多國語言版。

在設(shè)置里,可以選擇識別語言,可以配置識別文字段落,還有各種可能會用到的選項,對了,Umi-ORC 現(xiàn)在支持命令行調(diào)用了,擴展屬性喜 +1。

簡單說就是,實用、好用、值得用,有本地 OCR 需要的小伙伴可以試試看,不知道當初被安利的小伙伴,有沒有用上最新版。

不過有一說一,OCR 工具雖然有用,但對于大多數(shù)人來說,它不是什么高頻需求,尤其是微信圖片可以直接復制提取文字后,我就很少折騰 OCR 工具了。

因為一個辦公時必須打開的微信,就已經(jīng)能夠滿足日常 OCR 的需求了。。。

當然,微信不夠看,需要上強度的時候,手里備一個 14 版的 ABBYY,備一個白描,備一個夸克,備一個千百 OCR 肯定沒毛病。

但,像 Umi-OCR 這樣的開源項目,有沒有更廣泛的用法呢?我在小眾軟件論壇上看見個帖子,把 Umi-OCR 玩出了新高度。

簡單說,作者寫了個腳本,把 Umi-OCR 和大名鼎鼎的 Everything 聯(lián)系了起來。你可以利用 Umi-OCR 的識別,然后實現(xiàn)搜圖片里文字的效果。

正常的截圖沒啥好測試的,畢竟 Umi-OCR 識別效果實打?qū)嵉暮?,不過為了讓搜圖更給力,我去網(wǎng)上下載了 2000 多張表情包,表情包質(zhì)量都是這樣的:

下面我們來聊聊這個腳本該怎么用。

具體操作

腳本的實現(xiàn)思路就像我前面說的那樣,用進化了的 Umi-OCR 先去識別當前文件夾下的每一張圖并輸出成 TXT 文本,然后腳本把文本收集起來,當你打開 Everything 后,即可用腳本的快捷鍵去文搜圖。

所以在使用腳本前,我們需要在 Umi-OCR 上做一些設(shè)置,具體的設(shè)置是紅框框里的那些——

1、勾選遞歸是為了找出所有的圖片

2、獨立 txt 是為了一張圖對應一個文本

3、不含文字不輸出,不會創(chuàng)建多余文本

4、段落合并,整句搜索更準確

所以設(shè)置下來是這個樣子。

然后,用 Umi-OCR 批量識別你存放圖片的文件夾,拖拽文件夾到工具內(nèi)即可。

2000 多張表情包,大概花了 48 秒左右,速度這里,因為 Umi-OCR 識別是走本地的,當然會和硬件以及圖片上文字數(shù)掛鉤,2000 多張 PDF 純文字截圖花的時間肯定也不是 48 秒,這里提一下,免得大家誤會。。。

此時,存放圖那個目錄下,就會生成與圖片同名的文本文件。

該去配置腳本了,解壓后的腳本是這個樣子,先去找「setting」的配置文件,打開方式選記事本就行。

配置文件很簡單,長下面這個樣子,簡單說就是文件目錄前如果加 0,那么腳本會找當前目錄下的圖片;文件目錄前如果加 1,那么會遞歸找到目錄下所有文件夾的圖片。

前兩行是腳本作者自帶的示例,刪了,留我們自己的文件目錄即可,千萬記得保存推出。

運行「收集 txt」腳本,你會發(fā)現(xiàn)圖片目錄里的文本沒了。

實際上被轉(zhuǎn)移到了「案記」的目錄下。

做好了這些準備工作,再啟動「案記鎖圖」腳本,開啟 Everything,快捷鍵「Ctrl+Alt+F」即可完成文搜圖。

Everything 搜文件有多快,腳本搜圖速度就有多快,全部都是本地完成,沒有風險。

為啥敢這么說,打包前的 AHK 腳本代碼不是在那嗎,文本打開瞅一眼,沒有任何泄露風險的代碼。

如果不放心,可以根據(jù)這個本文思路,自行打包,或者安裝個 AutoHotkey 直接用。。。

總結(jié)

其實拋開這個腳本不談,進化后的 Umi-OCR 也是值得被分享的,如何取舍就看大家的需求了,我把這篇文章涉及到的鏈接都放這里。

Umi-OCR 項目地址:https://github.com/hiroi-sora/Umi-OCR

Umi-OCR 作者提供的藍奏云:https://hiroi-sora.lanzoul.com/s/umi-ocr

我存了一份多語言版的藍奏云,這是 GitHub 上有,但限于大小,作者提供的藍奏云里缺少的部分,如果要體積更小的通用版(中、英),去作者那里下就行。

多語言版:https://www.123pan.com/s/LyaDVv-RXECd.html

小眾軟件帖子:https://meta.appinn.net/t/topic/43188

你可以去帖子里下載腳本,我也存了份藍奏云,大伙看著選就行。

藍奏云:https://wwul.lanzoue.com/i9mI60v0c9dg

大體上這篇就這么多內(nèi)容了,我發(fā)現(xiàn) OCR 工具還真的是一年一寫,今年暫定的 C 位仍是 Umi-OCR,希望后面有更強更好用的選擇。

你的點贊就是對我最大的支持,有緣下篇見咯,over。

本站僅提供存儲服務,所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊舉報
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
完全離線的OCR圖片轉(zhuǎn)文字識別工具Umi
盤點7個黑科技開源項目,值得收藏
OCR工具見多了,但今天這個效果真的驚艷!
強烈推薦4個文檔處理神器,辦公秒殺
Umi
牛批plus,這次百度和B站一起被搞!會員再見吧,爽翻!
更多類似文章 >>
生活服務
熱點新聞
分享 收藏 導長圖 關(guān)注 下載文章
綁定賬號成功
后續(xù)可登錄賬號暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點擊這里聯(lián)系客服!

聯(lián)系客服