Mac用戶的福音:OCR新神器,一鍵轉(zhuǎn)換屏幕上的任意文本
在機(jī)器學(xué)習(xí)和計(jì)算機(jī)視覺領(lǐng)域,光學(xué)字符識別(optical character recognition, OCR)長期以來都是人們研究的重要主題之一。OCR 很簡單,就是將文檔照片或場景照片轉(zhuǎn)換為機(jī)器編碼的文本。
關(guān)于 OCR 的工具,機(jī)器之心此前也介紹過不少,如 2020 年頻頻登上 Github Trending 日榜月榜的開源項(xiàng)目 PaddleOCR,目前該項(xiàng)目已經(jīng)獲得 12.6k star 量。此外還有曠視研究院與華中科大聯(lián)合研發(fā)的基于分割的場景文字識別方法 TextScanner,不僅可以正確讀取字符數(shù)據(jù),還在一系列相關(guān)文字基準(zhǔn)數(shù)據(jù)集上取得了當(dāng)前最佳性能。
近日,GitHub 上又出現(xiàn)了一個(gè)非常火的 OCR 工具 macOCR,短短一天時(shí)間,就收獲了近800贊。macOCR 是一個(gè)開源命令行應(yīng)用程序,用戶可以使用它將屏幕上的任何文本轉(zhuǎn)換為剪貼板上的文本。

項(xiàng)目地址:https://github.com/schappim/macOCR
當(dāng)你調(diào)用 ocr 命令時(shí),一個(gè)類似于光標(biāo)的「屏幕捕獲」(screen capture)就會出現(xiàn)。如此一來,邊框內(nèi)的任何文本都將轉(zhuǎn)換為純文本。
項(xiàng)目作者提供了如下動(dòng)圖展示,將圖片文本轉(zhuǎn)換為了文本。

對于 macOCR 命令行應(yīng)用程序,網(wǎng)友給予了高度評價(jià)。網(wǎng)友 @mromanuk 表示:「我很沮喪的是,一直以來沒有簡單的方法來提取 Mac 圖片中的文本。現(xiàn)在 macOCR 彌補(bǔ)了這一空白!這一功能應(yīng)該在 MacOS 中集成或隨時(shí)可用。」

安裝使用
用戶使用的操作系統(tǒng)需要是 macOS Catalina 及以上版本。
用戶可以選擇編譯以下 repo 中的代碼,或者下載預(yù)先構(gòu)建的二進(jìn)制(分為蘋果 Silicon 處理器和英特爾處理器)并放在自己的路徑中。
蘋果 Silicon 處理器安裝代碼:
- curl -O https://files.littlebird.com.au/ocr.zip;
- unzip ocr.zip;
- sudo cp ocr /usr/local/bin;
英特爾處理器安裝代碼:
- curl -O https://files.littlebird.com.au/ocr-EPiReQzFJ5Xw9wElWMqbiBayYLVp.zip;
- unzip ocr-EPiReQzFJ5Xw9wElWMqbiBayYLVp.zip;
- sudo cp ocr /usr/local/bin;
當(dāng)首次運(yùn)行 macOCR app 時(shí),用戶可能需要「允許該 app 訪問你的屏幕」,示意圖如下:

項(xiàng)目作者
macOCR 的創(chuàng)建者是 Marcus Schappi,現(xiàn)為 Chick Global 的 CEO 和聯(lián)合創(chuàng)始人。他還曾是 Little Bird Electronics 和 Geek Ammo 等其他其他幾家公司的聯(lián)合創(chuàng)始人。
Schappi 曾在澳大利亞巴克學(xué)院、悉尼科技大學(xué)以及悉尼大學(xué)就讀。其中,在攻讀悉尼科技大學(xué)工程創(chuàng)新、機(jī)電一體化及創(chuàng)業(yè)學(xué)士學(xué)位期間,他沒有獲得該學(xué)位。但由于其創(chuàng)建的海嘯預(yù)警軟件吸引了媒體的廣泛關(guān)注,他最終被悉尼大學(xué)研究生項(xiàng)目錄取,攻讀設(shè)計(jì)科學(xué)碩士(設(shè)計(jì)計(jì)算及計(jì)算)。
Schappi 在軟件開發(fā)、移動(dòng)應(yīng)用以及 IOS 開發(fā)等方面具有嫻熟的技能。
目前,他的 GitHub 主頁上有多個(gè)項(xiàng)目,比如 macOCR、kod-website、dropcam 等。






























