已把better ocr推入better v23- Community - Deepin Technology

[App Sharing] 已把better ocr推入better v23

Apps Section 812 views · 6 replies ·

fuuko

deepin

2023-08-09 19:39

Author

事情是这样的，昨天（2023.8.8）官方不是新建了个用户交流群嘛，结果大晚上 11 点有人在喊啥时候截图下的 OCR 能在英文环境下识别中文。

作为一个准 AI 从业人员，我向来是比较关注这类 AI 应用的实现的，我注意到官方早早的就把这个问题解决并把源码发布在 github 了，只是没推送。。。对。。。困扰了国内外用户很久的 OCR 无法在英文环境下识别中文的问题，官方早解决了，但不知道为啥一直没推送

其实仔细翻看源码仓库 https://github.com/linuxdeepin/deepin-ocr ，你会发现这其实是个产品设计缺陷：因为技术原因无法使用单一的深度学习模型解决全语种的识别，于是官方划分成了三个不同的模型，分别针对简体中文+英文、英文增强识别、繁体中文+英文的场景，而在非中文环境下正是无脑调用英文增强识别模型，甚至连 UI 上都没个切换的入口，最后就给用户造成了极大的困惑，这锅官方的产品经理得背好了。

当然如标题所述，本次仅仅是扒了官方的源码，并推入了星火商店的 better v23 而已，无法对这些包的质量做出保证，只能说在我自己的机器上运行得很好

然后除了能自由切换模型外，通过查看官方在dtkmultimedia下的日志信息，这个版本的 deepin-ocr 还有如下新特色：

解放 NCNN 的动态推理能力，长图和超大图（尺寸超过 960 * 960）的识别效果会有一定的提升
解放 NCNN 的 GPU 推理能力，当用户机器的显卡驱动和 vulkan 驱动正确设置时，会优先调起显卡进行推理
解放 OCR 的二次开发能力和插件接入能力，允许用户自定义 OCR 的 backend，或进行 OCR 软件的二次开发（需要查阅官方 github 下的文档，相关 dev 的包已经推入 better v23 仓库）

当然，我目前在本地发现的问题也是有的，比如识别转圈的时候文字有重影，识别速度似乎没之前快，不过这俩都是虚拟机环境，不知道实体机下是啥样的（v23 还没 release，也不敢摁实体机上）

参考资料

开启 better v23 源的方法：https://bbs.deepin.org/post/257738 ，打开后即可使用 sudo apt install deepin-ocr 来安装这个玩意儿
实机效果截图

Reply Like 7 Favorite View the author

All Replies

阿尼樱奈奈

Moderator

2023-08-09 19:41

#1

Reply Like 0 View the author

神末shenmo

deepin

Spark-App

2023-08-09 19:41

#2

好耶~

Reply Like 0 View the author

熊爷不是好惹的

deepin

2023-08-09 20:42

#3

Reply Like 0 View the author

yanjuner

Super Moderator

2023-08-09 21:59

#4

好耶~

Reply Like 0 View the author

晚秋（lateautumn）

Moderator

2023-08-09 23:11

#5

谢谢分享，下载中

Reply Like 0 View the author

秋胜春朝

deepin

2023-08-10 05:13

#6

Reply Like 0 View the author

Popular Ranking

Change

Popular Events