[App Sharing] 已把better ocr推入better v23
Tofloor
poster avatar
fuuko
deepin
2023-08-09 19:39
Author

事情是这样的,昨天(2023.8.8)官方不是新建了个用户交流群嘛,结果大晚上 11 点有人在喊啥时候截图下的 OCR 能在英文环境下识别中文。shocked

作为一个准 AI 从业人员,我向来是比较关注这类 AI 应用的实现的,我注意到官方早早的就把这个问题解决并把源码发布在 github 了,只是没推送。。。对。。。困扰了国内外用户很久的 OCR 无法在英文环境下识别中文的问题,官方早解决了,但不知道为啥一直没推送doubt

其实仔细翻看源码仓库 https://github.com/linuxdeepin/deepin-ocr ,你会发现这其实是个产品设计缺陷:因为技术原因无法使用单一的深度学习模型解决全语种的识别,于是官方划分成了三个不同的模型,分别针对简体中文+英文英文增强识别繁体中文+英文的场景,而在非中文环境下正是无脑调用英文增强识别模型,甚至连 UI 上都没个切换的入口,最后就给用户造成了极大的困惑,这锅官方的产品经理得背好了。joy

当然如标题所述,本次仅仅是扒了官方的源码,并推入了星火商店的 better v23 而已,无法对这些包的质量做出保证,只能说在我自己的机器上运行得很好smirk

然后除了能自由切换模型外,通过查看官方在dtkmultimedia下的日志信息,这个版本的 deepin-ocr 还有如下新特色:

  • 解放 NCNN 的动态推理能力,长图和超大图(尺寸超过 960 * 960)的识别效果会有一定的提升
  • 解放 NCNN 的 GPU 推理能力,当用户机器的显卡驱动和 vulkan 驱动正确设置时,会优先调起显卡进行推理
  • 解放 OCR 的二次开发能力和插件接入能力,允许用户自定义 OCR 的 backend,或进行 OCR 软件的二次开发(需要查阅官方 github 下的文档,相关 dev 的包已经推入 better v23 仓库)

当然,我目前在本地发现的问题也是有的,比如识别转圈的时候文字有重影,识别速度似乎没之前快,不过这俩都是虚拟机环境,不知道实体机下是啥样的(v23 还没 release,也不敢摁实体机上)doubt

参考资料

  1. 开启 better v23 源的方法:https://bbs.deepin.org/post/257738 ,打开后即可使用 sudo apt install deepin-ocr 来安装这个玩意儿

  2. 实机效果截图

    Screenshot_20230809_113806.png

Reply Favorite View the author
All Replies
阿尼樱奈奈
Moderator
2023-08-09 19:41
#1

like

Reply View the author
神末shenmo
deepin
Spark-App
2023-08-09 19:41
#2

好耶~

Reply View the author
熊爷不是好惹的
deepin
2023-08-09 20:42
#3

agree

Reply View the author
yanjuner
Super Moderator
2023-08-09 21:59
#4

好耶~

Reply View the author
晚秋(lateautumn)
Moderator
2023-08-09 23:11
#5

谢谢分享,下载中applaud

Reply View the author
秋胜春朝
deepin
2023-08-10 05:13
#6

like

Reply View the author