拥有完全自主的 OCR 识别引擎,这款 APP 可能是你的菜

具有完全自主的OCR识别引擎,此应用程序可能是您菜中最漂亮的应用程序。我想昨天分享

如果您不得不说“深度识别”应用程序具有什么功能,那么最大的特点就是它具有完全自主的OCR识别引擎。

此应用程序的起点是开发人员在2014年和2015年左右完成的验证码识别系统。数字验证码并不难,只需0-9十位数字,并略微旋转即可缩放。如果有粘性字符需要拆分,请使用维特比算法计算最大联合概率。

但是中文字符与验证码不同。汉字非常复杂,并且数量很大(通常超过3000个汉字),加上扭曲和缩放,样本大小非常可怕,如何将大的汉字样本放入App的App包中这是一件艰苦的事情。

因此,为了研究汉字OCR识别,开发人员尝试了N种算法。识别效果不好,或者识别速度太慢,或者样本库太大。最后一个选择是一种紧密的深度学习。层神经网络算法最终达到了较为满意的汉字识别效果。

双模式文本识别

在深度识别的早期版本中,它完全称为本地识别。 18年后,百度的在线身份识别API被引入以补充两者:

如果用户需要更好的识别,则当应用程序连接到Internet时,将调用百度的文本识别API。

如果用户认为网络标识揭示了隐私或他们经常在工作中遇到无用的网络,则该应用程序将自动调用本地OCR识别引擎。这样,该应用程序在任何情况下均无法正常运行。 双重模式选择文本在大多数情况下,我们必须选择一大段文本进行标识,您可以直接反手选择一个框来选择过去的一段文本。但是,如果我们只想选择一行或两行文本,甚至是一行文本的一部分,那么使用框选会有些尴尬。在“深度识别”应用程序中,除了可以通过裁切框选择大量文本外,还可以使用涂抹功能选择小块文本。后续版本还打算开发橡皮擦功能,以便可以删除错误的位置。

这样,农作物选择和污迹选择对应于用于选择大块文本和选择小块文本的两个不同场景。与以前的双重模式识别相似,实现了另一个功能互补。 批量识别在图片选择界面中,用户一次最多可以选择9张图片进行批量识别。识别完成后,用户可以查看每个图片的识别结果,也可以查看组合的识别结果。在合并的识别结果中,用户选择的多张图像将被合并为一张长图片,识别结果文本将被合并为单个文本,这为完整的文本校对工作提供了方便。导出功能

可以将识别的文本复制到粘贴板,可以将其翻译成其他语言。可以使用Apple的内置导出功能与其他应用共享。 “深度识别”还有两个功能。一种是识别它。完成的文本将作为文本文件保存到App随附的文件系统中。其次,可以将文本导出为docx格式。

* iOS版本已作为付费功能导出。购买有两种类型:25元买断和12元出口120次。下载应用程序以测试识别准确性和应用程序体验后,您可以决定是否要支付支持费用。

未来的计划一般来说,此应用程序的开发是为了更好地服务人民币(跨领域的,是人民的),并且没有非常严格和庞大的计划。如果您想说自己想做的事,那是三件事:

一个是取悦苹果的父亲,打包应用程序,并尝试集成苹果的新功能和新功能;

第二是在技术允许的情况下添加一些新的可实现的功能,例如连续拍摄,识别表单,文件云备份等,以尽可能改善用户体验;

第三步是研究新的核心技术(特别是暂时保密的技术),如果仍有空间的话。毕竟,旧银行正在执行该算法。

只需做一点工作,谢谢大家。 最美丽的尾巴

说到这一点,小梅推荐了许多OCR应用程序,这些应用程序是付费的,免费的,特定于功能的且功能丰富的……每个应用程序都与其开发人员相同。每个都有自己的特点和不同的特点。总有一款适合您。

您可以单击以阅读原始文本并直接搜索“ OCR”以查看我们先前建议的相关应用程序。

免费丨没有广告丨4.4 +

下载丨后台回复“ 9925”以获得小梅所说的地址

您是否经常使用OCR工具

您通常使用哪个应用?

或者如果您有任何特殊的应用程序

不可能找到它吗?

您可以留言和小梅说些什么

收款报告投诉

如果您不得不说“深度识别”应用程序具有什么功能,那么最大的特点就是它具有完全自主的OCR识别引擎。

此应用程序的起点是开发人员在2014年和2015年左右完成的验证码识别系统。数字验证码并不难,只需0-9十位数字,并略微旋转即可缩放。如果有粘性字符需要拆分,请使用维特比算法计算最大联合概率。

但是中文字符与验证码不同。汉字非常复杂,并且数量很大(通常超过3000个汉字),加上扭曲和缩放,样本大小非常可怕,如何将大的汉字样本放入App的App包中这是一件艰苦的事情。

因此,为了研究汉字OCR识别,开发人员尝试了N种算法。识别效果不好,或者识别速度太慢,或者样本库太大。最后一个选择是一种紧密的深度学习。层神经网络算法最终达到了较为满意的汉字识别效果。

双模式文本识别

在深度识别的早期版本中,它完全称为本地识别。 18年后,百度的在线身份识别API被引入以补充两者:

如果用户需要更好的识别,则当应用程序连接到Internet时,将调用百度的文本识别API。

如果用户认为网络标识揭示了隐私或他们经常在工作中遇到无用的网络,则该应用程序将自动调用本地OCR识别引擎。这样,该应用程序在任何情况下均无法正常运行。 双重模式选择文本在大多数情况下,我们必须选择一大段文本进行标识,您可以直接反手选择一个框来选择过去的一段文本。但是,如果我们只想选择一行或两行文本,甚至是一行文本的一部分,那么使用框选会有些尴尬。在“深度识别”应用程序中,除了可以通过裁切框选择大量文本外,还可以使用涂抹功能选择小块文本。后续版本还打算开发橡皮擦功能,以便可以删除错误的位置。

这样,农作物选择和污迹选择对应于用于选择大块文本和选择小块文本的两个不同场景。与以前的双重模式识别相似,实现了另一个功能互补。 批量识别在图片选择界面中,用户一次最多可以选择9张图片进行批量识别。识别完成后,用户可以查看每个图片的识别结果,也可以查看组合的识别结果。在合并的识别结果中,用户选择的多张图像将被合并为一张长图片,识别结果文本将被合并为单个文本,这为完整的文本校对工作提供了方便。导出功能

可以将识别的文本复制到粘贴板,可以将其翻译成其他语言。可以使用Apple的内置导出功能与其他应用共享。 “深度识别”还有两个功能。一种是识别它。完成的文本将作为文本文件保存到App随附的文件系统中。其次,可以将文本导出为docx格式。

* iOS版本已作为付费功能导出。购买有两种类型:25元买断和12元出口120次。下载应用程序以测试识别准确性和应用程序体验后,您可以决定是否要支付支持费用。

未来的计划一般来说,此应用程序的开发是为了更好地服务人民币(跨领域的,是人民的),并且没有非常严格和庞大的计划。如果您想说自己想做的事,那是三件事:

一个是取悦苹果的父亲,打包应用程序,并尝试集成苹果的新功能和新功能;

第二是在技术允许的情况下添加一些新的可实现的功能,例如连续拍摄,识别表单,文件云备份等,以尽可能改善用户体验;

第三步是研究新的核心技术(特别是暂时保密的技术),如果仍有空间的话。毕竟,旧银行正在执行该算法。

只需做一点工作,谢谢大家。 最美丽的尾巴

说到这一点,小梅推荐了许多OCR应用程序,这些应用程序是付费的,免费的,特定于功能的且功能丰富的……每个应用程序都与其开发人员相同。每个都有自己的特点和不同的特点。总有一款适合您。

您可以单击以阅读原始文本并直接搜索“ OCR”以查看我们先前建议的相关应用程序。

免费丨没有广告丨4.4 +

下载丨后台回复“ 9925”以获得小梅所说的地址

您是否经常使用OCR工具

您通常使用哪个应用?

或者如果您有任何特殊的应用程序

不可能找到它吗?

您可以留言和小梅说些什么

清华团队获首届全国大学生公益创业实践赛金奖