机器之心报道
编辑:杜伟
Mac 平台上的 OCR 文字识别方法有很多,比如 iText、OCRKit 等。本文介绍的 macOCR 命令行应用程序使 Mac 用户有了一个新选择。
在机器学习和计算机视觉领域,光学字符识别(optical character recognition, OCR)长期以来都是人们研究的重要主题之一。OCR 很简单,就是将文档照片或场景照片转换为机器编码的文本。
关于 OCR 的工具,机器之心此前也介绍过不少,如 2020 年频频登上 Github Trending 日榜月榜的开源项目 PaddleOCR,目前该项目已经获得 12.6k star 量。此外还有旷视研究院与华中科大联合研发的基于分割的场景文字识别方法 TextScanner,不仅可以正确读取字符数据,还在一系列相关文字基准数据集上取得了当前最佳性能。
近日,GitHub 上又出现了一个非常火的 OCR 工具 macOCR,短短一天时间,就收获了近800赞。macOCR 是一个开源命令行应用程序,用户可以使用它将屏幕上的任何文本转换为剪贴板上的文本。
项目地址:https://github.com/schappim/macOCR
当你调用 ocr 命令时,一个类似于光标的「屏幕捕获」(screen capture)就会出现。如此一来,边框内的任何文本都将转换为纯文本。
项目作者提供了如下动图展示,将图片文本转换为了文本。
对于 macOCR 命令行应用程序,网友给予了高度评价。网友 @mromanuk 表示:「我很沮丧的是,一直以来没有简单的方法来提取 Mac 图片中的文本。现在 macOCR 弥补了这一空白!这一功能应该在 MacOS 中集成或随时可用。」
安装使用
用户使用的操作系统需要是 macOS Catalina 及以上版本。
用户可以选择编译以下 repo 中的代码,或者下载预先构建的二进制(分为苹果 Silicon 处理器和英特尔处理器)并放在自己的路径中。
苹果 Silicon 处理器安装代码:
英特尔处理器安装代码:
当首次运行 macOCR app 时,用户可能需要「允许该 app 访问你的屏幕」,示意图如下:
项目作者
macOCR 的创建者是 Marcus Schappi,现为 Chick Global 的 CEO 和联合创始人。他还曾是 Little Bird Electronics 和 Geek Ammo 等其他其他几家公司的联合创始人。
Schappi 曾在澳大利亚巴克学院、悉尼科技大学以及悉尼大学就读。其中,在攻读悉尼科技大学工程创新、机电一体化及创业学士学位期间,他没有获得该学位。但由于其创建的海啸预警软件吸引了媒体的广泛关注,他最终被悉尼大学研究生项目录取,攻读设计科学硕士(设计计算及计算)。
Schappi 在软件开发、移动应用以及 IOS 开发等方面具有娴熟的技能。
目前,他的 GitHub 主页上有多个项目,比如 macOCR、kod-website、dropcam 等。
参考链接:https://news.ycombinator.com/item?id=27242392
CVPR 2021 线下论文分享会
6月12日,北京望京凯悦酒店。CVPR 2021 线下论文分享会将设置Keynote、论文分享和Poster环节。
其中Keynote环节已确认4位嘉宾:京东探索研究院院长、京东集团副总裁陶大程,香港中文大学信息工程系副教授、商汤科技联合创始人林达华,厦门大学南强特聘教授、博士生导师纪荣嵘,华为中央研究院诺亚方舟计算视觉实验室主任许春景。
作为一场开放的学术交流活动,我们也欢迎 CVPR 2021 的论文作者们作为嘉宾参与论文分享与 Poster 展示,请在报名页面提交演讲主题、论文介绍等信息,我们将与你联系沟通相关事宜。