近日,讯飞输入法新版本正式上线,在随声译和快捷翻译功能里增加了日译中、韩译中、泰、越、西、法、德、俄与中文互译,合计18种翻译,这也使得讯飞输入法成为中文与外语互译最多的输入法产品。
不得不说,语音输入已经越来越受欢迎。艾媒《2019-2020中国第三方手机输入法市场监测报告》显示,29%的受访者表示2019年使用语音输入的频率明显增加,是增长最快的输入方式。
面对输入方式的变迁,讯飞输入法、百度输入法、搜狗输入法三大输入法,也一直在围绕AI技术不断加码语音输入服务,使其不断实现准确率的突破,比如讯飞输入法的语音识别准确率已经高达98%。
输入法越来越智能的背后,各家的AI技术加持至为关键。而面对每天数亿次甚至数十亿次的使用需求,今天的输入法产品已经嵌满了令人意想不到的五彩黑科技。
输入法的重担
输入法越来越智能的代价,就是要背负越来越重的使命。追溯市面上几款主流输入法产品的发展历史,可以发现这些产品已经不年轻,至少都有十年或以上的产品迭代时间。以此推算,输入法产品与移动互联网的发展同步,可以说是跟着移动互联网一路走来的。
最早的输入法,不论是设备自带输入法,还是第三方输入法,功能普遍比较简单,比如只支持9键和26键键盘输入、手写输入等非智能机时代沿袭的输入方式,主要是为了满足最普遍的用户需求。
但移动社交、移动趋势的明晰,以及智能手机的普及,彻底改变了输入法产品们的发展路径。个人用户在多元场景下不断衍生出更多的输入需求,开始特别注意到输入体验的进步,希望更快和更好,比如能否根据拼音首字母快速预测想打的字。特别是在移动社交场景下,个人用户使用输入法的频率越来越高,用户对输入法体验的感知非常明显,输入法好不好用,效率高不高,用户其实心知肚明。
这让输入法的担子越来越重,原本定位于轻服务工具的输入法,不得不开始思考如何满足不同用户不同场景下的个性化需求。于是,为巨大体量的用户大规模同步提供优质的输入服务,成为输入法产品们发展的核心目标。
愈发全能的输入法
场景和需求之变,不断倒逼着输入法产品的进化,结果就是,输入法变得越来越全能,越来越精致,越来越个性。以目前的三大输入法产品为例,十年前的它们与十年后的它们,已经“判若两人”。
一方面,不断的功能增加使得产品能够适应许多输入场景。除了传统的手写和键盘输入外,三大输入法还加入了OCR扫描、智能预测/纠错等功能。其中,OCR扫描指的是用户可以通过扫描将图片或手写稿转换成文字,而智能预测功能则可以提前根据输入拼音预测用户想打的字,智能纠错则可以根据词库、语境快速纠正用户的错误。
各种功能的丰富,使得输入法可以服务于用户的全输入过程,在输入前、中、后每个环节提供对应的服务。
另一方面,产品能力的极限突破为用户带来了全面的体验。以从语音起家的讯飞输入法为例,目前讯飞输入法已经做到了一分钟400字的输入速度,以及语音识别准确率达98%的水平,也就是说整段输入的出错率非常小,为用户带来的是极速和流畅的综合输入体验。
可以说,这些功能所达到的极限颠覆了以往低效低质的输入体验,从感官上弥补了用户对输入法的体验缺乏。
黑科技成就输入法
无论是功能上的全能,还是体验上的全能,输入法产品能够实现质变,甚至能够适应一些极限和极端的输入场景,除了产品本身的创新外,不断的技术迭代是最核心的原因。用户之所以能够只花一半的时间完成整个输入过程,都依赖于输入法们背后的黑科技。
讯飞输入法可以说是“科技成就输入法”的最佳代言人。 一方面,其背靠有20多年智能语音技术沉淀的科大讯飞,已有20万小时训练数据积累;另一方面,科大讯飞有太多的国际赛事顶尖荣誉,比如在2018年由国际计算语言学协会(ACL)下属组织主办的第十二届国际语义评测比赛(SemEval2018)中,科大讯飞斩获了基于常识的机器阅读理解全球第一;2018年的国际权威英文语音识别大赛“CHiME-6”中,科大讯飞包揽了两项第一名;2019年在ICDAR2019举办的场景文本视觉问答挑战赛ST-VQA中,科大讯飞包揽了三项冠军;2020年初在德国The 20BN-Jester Dataset手势识别评测中,科大讯飞以97.26%的准确率斩获冠军,且刷新了世界纪录……讯飞输入法背后的黑科技可以从四方面来看。
一、语音输入
语音输入讲究快速和准确,讯飞输入法之所以能达到一分钟400字、识别准确率98%的水平,主要在于其自研的“记忆增强的多通道全端到端语音识别框架”,这项技术简单来说就是能够完全将前端语音处理过程深度学习化,并使用深度卷积神经网络和后端识别模型进行混合训练,从而大大提高了语音识别的效率。
至于能够使用23种方言进行精准语音输入,一方面要靠通过多方言共享方式训练的Multi-lingual多语言建模技术,另一方面要靠GlobalPhone全球音素集,这项技术从声学层面的相似性来统一各方言的音素定义,使方言“语图谱”模型进一步精进,从而使得方言识别效果有效提升。多语种互译功能则对技术提出了更大的挑战性,以中英互译为例,讯飞输入法基于对抗样本训练方法提出了融合副语言特征的“高鲁棒性语音翻译技术”,并在模型中结合特定技术,有效提高了最终翻译结果。
二、拼音输入
在拼音输入上,讯飞输入法创新性引入了Encoder-Decoder框架,构建了新一代拼音识别引擎,极大简化了传统拼音识别模型,同时在Attention机制和长短期记忆网络的门控机制,以及Transformer等模块的共同作用下,长句输入识别效果有效提升,能够提前预测用户想输入的内容,还能有效实现智能纠错。
此外,这一模型由于采用的是序列建模,建模不再依赖词典,更易实现中英文混合建模,因而让讯飞输入法在中英混输上实现了非常出色混输表现。值得注意的是,不论是智能预测,还是智能纠错,背后都有可实时更新的百万词库。
三、手写输入
同样是手写,体验却完全不一样,这是因为讯飞输入法的手写识别可支持两万多类中文字符、52类英文字符、10类阿拉伯数字以及100多种特殊符号,这种超级识别能力的背后,是讯飞输入法的“HWR手写识别技术”,这项技术采用的是CNN卷积神经网络技术,可支持实时手写轨迹,边写边出字,而且单个字符识别仅需15ms,响应迅速无延迟。
四、扫描输入
扫描输入的技术支撑是计算机视觉,面对复杂的手写文字、中英混合文字,“OCR文字检测技术”可检测任意方向和形状的文字,“OCR文字识别技术”则可以有效缓解因环境问题造成的识别效果低下问题。
综上,基于AI和大数据的组合技术,如今的输入法不再死板坚硬,即使面对输入场景的复杂需求,也能够在不同语种、不同语境、不同语调下满足不同用户的需求。过去的输入法只能辅助,而现在,科技加持下的输入法,更像是一个“一站式”的输入管家。
输入法的智能普惠
黑科技成就了输入法,也成就了输入法的地位。根据相关报告提供的数据,以三大输入法为代表的第三方输入法,已经覆盖了超过90%的中国网民。
要是放大到整个输入法行业,可以说人人都是输入法的受益者,移动设备也好,个人电脑也好,日常交流必然离不开输入法的帮助。可以说,输入法已经成为一个互联网沟通的基础设施。而且值得庆幸的是,讯飞输入法等头部产品在技术上的进化,让这个基础设施不断产生质变,越来越智能。
应该说,像讯飞输入法这样始终痴迷于“科技驱动”的输入法产品,是输入法作为工具产品在价值上得到跃进式提升的关键,因为它们用技术无限拔高了输入法产品的价值上限。换言之,讯飞输入法们的“科技大法”一定程度上改善了整个互联网世界的沟通协作效率。
技术无上限,输入法产品也无上限。对9.04亿中国互联网网民而言,黑科技持续加持下的输入法工具,会继续为每个用户提供独一无二的使用体验,真正实现全方位的智能普惠。
文/刘旷公众号,ID:liukuang110
申请创业报道,分享创业好点子。点击此处,共同探讨创业新机遇!
虽然我国汽车芯片行业还处在发展初期,但已经迸发出无限潜力。一方面,智能汽车的发展不断带动需求增长;另一方面,政策引导下,汽车芯片企业持续抢占高地。对此,在7月5日-7日举办的2023年中国汽车论坛上,中国汽车工业协会副秘书长李邵华就做出表示,“中国将成为未来汽车芯片发展的集聚地”。车规芯片行业近日的
2023世界人工智能大会将于7月6日至8日在上海举办。云天励飞将在大会上展示自主设计开发的新一代边缘计算芯片DeepEdge10系列SoC芯片,并公布“天书”大模型的最新动态。欢迎莅临上海世博展览馆H1-C801展台参观交流!同时,云天励飞也将与中国电子、中国信通院、华为等合作伙伴,在WAIC的舞台
近日,酷学院智能产品发布会在深圳闪亮登场。近200位现场观众和近万人次在线观看,共同见证了这一激动人心的时刻。发布会上,酷学院引领大家探索企业培训学习和人才发展领域的新高度,并揭幕其全新的产品智能升级和突破。酷学院产品负责人徐晨通过形象生动、逻辑严谨的讲述,揭晓了全新的智能企业培训和人才发展平台,以
随着人工智能技术的快速发展,各行各业都受到了深刻影响,特别是中小学人工智能教育的普及,已经成为当今不可忽视的重要课程。ChatGPT等人工智能技术的出现,让我们看到了人工智能将成为未来推动科技跨越发展、生产力整体跃升的重要驱动力量之一。在这个背景下,中小学教育已经将人工智能作为重要学习内容,并将科技
什么是AgenticAI?什么是AgenticWorkflow?AgenticAI与AIAgent有什么区别?一篇文章看明白。
关于AI,百度创始人、董事长兼首席执行官李彦宏的的态度很明确:“百度要做第一个用AI把全部产品重做一遍的公司。”不是整合,不是接入,而是重做,重构。随后,百度在2023年一口气发布了包括搜索、地图、网盘、文库等应用在内的10余款AI原生应用。而2024年以来,百度在AI领域做了几件大事。先是推出ER
每一次新旧代际转换时,都会上演这样的一幕:“畅想很多,落地很少”,AI原生应用似乎也不例外。关于AI原生应用的呼声已经持续一段时间,但普通用户对“AI原生”依然陌生。除了新业态普及的周期性,AI原生应用的爆发与否还涉及另一个议题,即怎么降低AI原生应用开发的难度和门槛。刚刚结束的华为开发者大会202
文|智能相对论作者|陈泊丞这是春晚舞台西安分会场《山河诗长安》的一幕:“李白”现世,带领观众齐颂《将进酒》,将中国人骨子里的豪情与浪漫演绎得淋漓尽致。这又是浙江义乌商品市场里的另一幕:只会说几个英文单词的女老板秒变外语达人,无缝切换36国语言流畅介绍自家商品,疯狂带货。这一幕幕不可思议的画面,成就了
图片|OpenAI官网©自象限原创作者丨罗辑、程心和OpenAI分道扬镳以后,Ilya“神秘而伟大”的事业终于揭开了面纱。6月20日,前OpenAI核心创始人IlyaStuskever,在官宣离职一个月后,Ilya在社交媒体平台公开了最新的动向:将成立新的实验室Superintellgence(以下
近期,苹果发布M4芯片,号称“比当今任何AIPC的任何神经引擎都强!”紧随其后微软携“Copilot+PCs”的概念加入AIPC激战。截至目前,包括联想、惠普、华为等多家主流PC厂商在内,已经至少推出了超50款AIPC产品。AI重塑行业的机遇,谁都不想错过。对于企业来说,能否积极拥抱AIPC十分关键
如果说2023年是大模型的资格赛,融资额度决定了能否晋级,2024年已然快进到了淘汰赛的阶段。字节跳动、阿里云、百度智能云、腾讯云等先后在5月中下旬加入“价格战”,轻量级模型直接免费,主力模型的API价格普遍下调了90%以上。曾经以“烧钱”著称的大模型,迅速进入到“白菜价”时代。当时就有人提出这样的