媒体点评:不用动手就能打字 讯飞输入法行业最佳拍照输入

2019-10-08??来源:互联网?

? ? 最近抖音上很多火爆的段子,办公的白领在短短几秒将长长的打印文本变为电子档,速度快得令人咂舌。更让人惊讶的是,这种高效录入工具竟然不是专门的App而是讯飞输入法。讯飞输入法在安卓9.1版中更新OCR识别引擎,进一步提升文字扫描的场景泛化能力,实测也发现新版的拍照输入识别率相较上一版提升了约30%。据悉,此项源头技术在CVPR 2019等多项文档分析与识别测试任务中均获得行业冠军,可见其背景实力的雄厚。

?

云图片

??

? ? 通常情况下,需要将图片或手写内容转换成文字时,我们需要下载专门的App进行操作(并且这样的App其实多数需要付费的),使用体验也是参差不齐。考虑到用户在这方面的使用需求越来越强烈,讯飞输入法作为文字输入工具,不仅在语音输入方面造诣颇深,其他输入方式也在不断探索。譬如基于图像识别技术打造的文字扫描,切实帮助提升输入效率。

?

云图片

??

? ? 以往需要费时费力手动录入焦急而忙碌的场面,现在只需在讯飞输入法中点击“文字扫描”功能拍一张照片,短短3-5秒钟即可生成可编辑的文本,甚至图片文字、手写字体、中英混合甚至连标点符号也都能做到精准识别,生成的电子版更方便编辑和更新,很大程度上解放了我们的双手。


云图片

??

必赢365bet官网手机? ? 一直以来,科大讯飞在手写文字识别领域已深耕多年。与将字符识别和位置关系识别分别建模的传统数学公式识别思路不同,讯飞输入法内置最新的图像识别系统正是借鉴了手写文字识别技术中基于空间注意力机制的Encoder-Decoder思想,实现了数学公式的字符和位置关系的端到端识别,同时提出了多尺度空间注意力机制以解决由字符尺寸差异较大带来的识别字符丢失问题。此外,针对不同书写者书写风格迥异的问题,提出了空间注意力引导机制和时间注意力机制,从空间和时间两个维度上提升注意力的准确度,最后融合了多种不同模态的信息提升了系统最终决策的效果。

?

云图片

? ? 基于A.I.核心技术,科大讯飞在应用领域正积极落地。特别在移动互联网领域,以讯飞输入法为代表的拍照输入做到了行业最佳。当然更重要的是,这一功能大大提升了工作效率。正所谓“时间就是金钱”,这才是讯飞输入法“文字扫描”功能的价值利益点所在。


相关国内文章

文章评论

共有 位网友发表了评论 查看完整内容