事情是这样的,昨天(2023.8.8)官方不是新建了个用户交流群嘛,结果大晚上 11 点有人在喊啥时候截图下的 OCR 能在英文环境下识别中文。
作为一个准 AI 从业人员,我向来是比较关注这类 AI 应用的实现的,我注意到官方早早的就把这个问题解决并把源码发布在 github 了,只是没推送。。。对。。。困扰了国内外用户很久的 OCR 无法在英文环境下识别中文的问题,官方早解决了,但不知道为啥一直没推送
其实仔细翻看源码仓库 https://github.com/linuxdeepin/deepin-ocr ,你会发现这其实是个产品设计缺陷:因为技术原因无法使用单一的深度学习模型解决全语种的识别,于是官方划分成了三个不同的模型,分别针对简体中文+英文、英文增强识别、繁体中文+英文的场景,而在非中文环境下正是无脑调用英文增强识别模型,甚至连 UI 上都没个切换的入口,最后就给用户造成了极大的困惑,这锅官方的产品经理得背好了。
当然如标题所述,本次仅仅是扒了官方的源码,并推入了星火商店的 better v23 而已,无法对这些包的质量做出保证,只能说在我自己的机器上运行得很好
然后除了能自由切换模型外,通过查看官方在dtkmultimedia下的日志信息,这个版本的 deepin-ocr 还有如下新特色:
当然,我目前在本地发现的问题也是有的,比如识别转圈的时候文字有重影,识别速度似乎没之前快,不过这俩都是虚拟机环境,不知道实体机下是啥样的(v23 还没 release,也不敢摁实体机上)
参考资料
开启 better v23 源的方法:https://bbs.deepin.org/post/257738 ,打开后即可使用 sudo apt install deepin-ocr 来安装这个玩意儿
实机效果截图
好耶~
谢谢分享,下载中
Popular Ranking
Popular Events
事情是这样的,昨天(2023.8.8)官方不是新建了个用户交流群嘛,结果大晚上 11 点有人在喊啥时候截图下的 OCR 能在英文环境下识别中文。
作为一个准 AI 从业人员,我向来是比较关注这类 AI 应用的实现的,我注意到官方早早的就把这个问题解决并把源码发布在 github 了,只是没推送。。。对。。。困扰了国内外用户很久的 OCR 无法在英文环境下识别中文的问题,官方早解决了,但不知道为啥一直没推送
其实仔细翻看源码仓库 https://github.com/linuxdeepin/deepin-ocr ,你会发现这其实是个产品设计缺陷:因为技术原因无法使用单一的深度学习模型解决全语种的识别,于是官方划分成了三个不同的模型,分别针对简体中文+英文、英文增强识别、繁体中文+英文的场景,而在非中文环境下正是无脑调用英文增强识别模型,甚至连 UI 上都没个切换的入口,最后就给用户造成了极大的困惑,这锅官方的产品经理得背好了。
当然如标题所述,本次仅仅是扒了官方的源码,并推入了星火商店的 better v23 而已,无法对这些包的质量做出保证,只能说在我自己的机器上运行得很好
然后除了能自由切换模型外,通过查看官方在dtkmultimedia下的日志信息,这个版本的 deepin-ocr 还有如下新特色:
当然,我目前在本地发现的问题也是有的,比如识别转圈的时候文字有重影,识别速度似乎没之前快,不过这俩都是虚拟机环境,不知道实体机下是啥样的(v23 还没 release,也不敢摁实体机上)
参考资料
开启 better v23 源的方法:https://bbs.deepin.org/post/257738 ,打开后即可使用 sudo apt install deepin-ocr 来安装这个玩意儿
实机效果截图