搜狗推“个性化语音识别”，将颠覆与改变未来人机交互模式

2019-08-15 18:08 来源：A5专栏我来投稿撤稿纠错

专业机构发布《2019年语音技术》报告称，语音将成为未来十年决定性主题之一，与人工智能一起从根本上改变人与机器的关系。近日，搜狗输入法在语音输入领域率先推出“个性化语音识别”功能，突破语音识别技术瓶颈，大幅优化个人词汇录入的直接准确性，在语音输入领域实现“更懂用户”。

搜狗“个性化语音识别”打造用户专属输入法

在日常交流中，个人口头禅、惯用语经常会干扰双方的信息传达，这一问题在人机语音交互中尤为凸显。在语音输入时，往往用户只是想录入一个名称，输入结果却显示的是音同意不同的另一项结果。比如，当用户希望输入法显示人名“凭远”时，通用的语音识别往往将大众常用的“平原、品源”列在前列的候选词汇，用户的个性化内容并不在其中。除此之外，用户习惯使用的个人词汇，以及一些多音字、读音差错也会对语音识别结果造成影响。

基于以上原因，搜狗语音率先对语音识别技术进行了革新优化，推出“个性化语音识别”服务。经过本轮更新，用户只需在搜狗输入法App选择一键登录个人账户，即可体验此项服务。成功开启后，“个性化语音识别”会通过强化学习用户习惯使用的个人词汇，为每个用户建立定制化语音输入法。此后，在用户需要进行语音输入时，输入法会根据语言环境，结合上下段落语句进行分析，快速输出符合用户心意的文本内容，有效减少用户手动进行二次更改的频率。

搜狗语音又诞生“黑科技”语音识别更精准

搜狗“个性化语音识别”不仅可有效提升用户个性化词句的识别准确率，同时全自动词库学习这一特色极大保证了系统的处理及反馈速度，实现整个学习个性化特征的过程在“毫秒级别”就可以全部自动完成。

通过DTSS（Deep Transformer-based Sequence to Sequence model）的端到端声学模型、神经网络语言模型和智能标点预测等技术，搜狗输入法引入前沿深度学习技术，对语音识别进行仿真模拟和训练，有效提高语音录入在通用场景下的识别准确性，精准度已达到领先业内。“个性化语音识别”可基于用户数据分析，对用户习惯使用的个性化词组进行扫描记录，在语音输入时，优先选择用户习惯用语进行文本输出。通过此项技术革新，在保障通用识别准确性的前提下，使用户常用语的字词错误率下降40%，攻克语音识别精准化的技术难关。

掌控AI从个性化语音识别开始

手和舌头是人类最灵活的两个部分，从移动智能设备发展以来，各种触控交互无不依赖于手的操作。而当语音技术和人工智能同时走向成熟时，或许就像《2019语音技术报告》中所描述的那样：语音交互扭转了以往人机交互的存在形态，用户与设备间基于语音交互的全新关系开始搭建，与之前互联网向移动互联网过渡一样，其对底层平台的全新需求也在酝酿当中。

新时代即将来临，为应对人工智能、虚拟现实等技术的革新以及不同维度、多场景使用的需要，用户输入法的使用习惯逐渐向语音输入转移。同时，与文本输入相比，语音输入注定成为最主要的人机互动接口。优化语音识别技术，为用户提供更自然、更便利、更高效的语音录入服务，是智慧输入法的发展趋势。

随着语音识别技术的不断成熟，以及用户个性化词库的不断丰富，搜狗将聚合用户级语音个性化资源，实现“定制化语音输入法”。使每个用户基于“定制版”、“更懂自己”的搜狗语音识别的支持，在日常生活以及医疗、法律等专业领域，有效提高线上交流和人机沟通的效率及准确度，或将成为人工智能时代输入端的全局掌控者。

申请创业报道，分享创业好点子。点击此处，共同探讨创业新机遇！

相关标签: ai技术; 智能语音; 搜狗输入法

汇聚中国AI顶尖力量云天励飞参与华为AI大模型联合创新

2023年7月6日,第六届世界人工智能大会(WAIC2023)在上海开幕,“人工智能大模型”是本届大会的备受瞩目的话题,据悉,在昇腾AI大模型的创新研发中,华为联手26家行业领军企业,组建了一支协同创新的“AI明星队”,云天励飞作为中国人工智能企业的杰出代表,和互联网大厂、运营商、科研院所等优秀团队

标签：

ai技术
用友大易：迈入AI招聘2.0时代，让人力资源回归本质

这几个月来，以ChatGPT为代表的生成式AI展现出的能力令世界惊叹。自从2016年AlphaGo战胜李世石掀起了一波AI浪潮后，AI仿佛已经沉寂了很久，ChatGPT的横空出世就如同一束耀眼的光芒，让AI这个名词重回C位。过去在AI1.0时代，主要通过训练模型来实现图像识别、声音识别、语言处理等特

标签：

ai技术
新发布的PaaS2.0，能否助力涂鸦智能再起飞？

文：互联网江湖作者：志刚2023年的IoT需要一个新故事。6月29日，涂鸦智能在开发者大会上，发布了企业级战略PaaS2.0，希望通过一个平台+四大开发服务，建立起IoT生态。对于这场发布会，市场的态度是积极的。美东时间6月29日收盘，涂鸦智能美股股价上涨5.6%，来到1.87美元/股。近日股价稳定

标签：

ai技术
大模型难掩AI制药的悲伤：越过山丘，无人等候

美团曾经的二号人物王慧文对标OpenAI的创业项目光年之外，以20亿卖给美团，再度引发市场对大模型的热议。

标签：

ai技术
拾起王慧文的AI梦，美团冲向“光年之外”？

2020年底，王慧文在朋友圈写下这句话时，外界本以为这位伴随中国互联网发展而持续创业20年的人物即将告别创业舞台。但是，一个曾经多次创业，正值壮年的互联网老将心中的创业热情是难以熄灭的。

标签：

ai技术

ChatGPT、Gemini、通义千问等一众大语言模型，哪家更适合您？

随着人工智能技术的飞速发展，大语言模型(LargeLanguageModels,LLMs)在各行各业的应用日益广泛，尤其是在软件开发、数据分析、客户服务等领域。蘑菇云创客空间[445期开放夜]就以“ChatGPT、Gemini、通义千问等一众大语言模型，哪家更适合您”这样的主题，开展了一次深度的大语
体验了下钉钉AI助理，真羡慕现在的“打工人”...

对于万千打工人来说，AI不会替代我们，反而会成为工作中重要的帮手

标签：

钉钉
历时400多天，国产大模型全面赶超GPT-4？

赶超GPT-4的阶段性升级，可以看作是国产大模型有序迭代部署、不断拉近差距的标志，切莫像手机跑分那样，在过度营销的作用下，沦为被群嘲的对象。

标签：

大模型
微博COO王巍：微博已接入阿里云通义大模型，是通义最早一批外部客户

5月9日，记者获悉，微博已接入阿里云通义大模型，提升内容生产效率和社区活跃度。微博不仅是阿里云最早一批上云客户，也是阿里云通义大模型的最早客户。微博COO、新浪移动CEO王巍表示，AIGC发展速度远超想象，包括通义2.5在内，已涌现出不少大模型能力超越GPT4。同时他指出，大模型开源势不可挡。“阿里
通义灵码推出企业版，底座模型CodeQwen1.5登顶权威榜单

5月9日阿里云AI峰会，通义灵码宣布推出企业版，满足企业用户的定制化需求，帮助企业提升研发效率。通义灵码是国内用户规模第一的智能编码助手，基于SOTA水准的通义千问代码模型CodeQwen1.5研发，插件下载量已超350万。通义灵码熟练掌握Java、Python、Go、JavaScript、Type

标签：

通义千问
通义千问APP更名为通义APP，免费开放通义全栈能力

5月9日消息，通义大模型品牌升级，“通义千问APP”更名为“通义APP”，集成通义大模型全栈能力，免费为所有用户提供服务。通义APP以性能媲美GPT-4Turbo的基模为底座，并把通义实验室前沿的文生图、智能编码、文档解析、音视频理解、视觉生成等能力“Allinone”，成为每个人的全能AI助手。通

标签：

通义千问

阿里云发布通义千问2.5，性能全面赶超GPT-4 Turbo

5月9日消息，阿里云正式发布通义千问2.5，模型性能全面赶超GPT-4Turbo，成为地表最强中文大模型。同时，通义千问最新开源的1100亿参数模型在多个基准测评收获最佳成绩，超越Meta的Llama-3-70B，成为开源领域最强大模型。相比通义千问2.1版本，通义千问2.5的理解能力、逻辑推理、指

标签：

通义千问
通义大模型通过阿里云服务企业超9万，开源模型下载超700万

5月9日消息，阿里云公布最新数据，通义大模型通过阿里云服务企业超9万，通义开源模型累计下载量突破700万。通义落地应用进程加速，现已进入PC、手机、汽车、航空、天文、矿业、教育、医疗、餐饮、游戏、文旅等领域，成为最受中国企业欢迎的大模型。阿里云AI峰会现场，小米旗下的人工智能助手“小爱同学”已与阿里

标签：

通义千问
阿里云发布通义千问2.5，中文能力地表最强

通义大模型发布一周年之际，迎来重要的历史性时刻。5月9日，阿里云正式发布通义千问2.5，模型性能全面赶超GPT-4Turbo，成为地表最强中文大模型。同时，通义千问1100亿参数开源模型在多个基准测评收获最佳成绩，超越Llama-3-70B，成为开源领域最强大模型。历经一年多追赶，国产大模型终于进入

标签：

通义千问
AI PC，到底谁的梦想、谁的红利？

世界上第一台通用计算机是1946年诞生的埃尼阿克，世界上第一台便携电脑是1981年诞生的“奥斯本1号”，世界上第一部智能手机是1993年诞生的IBMSimon。它们之间看起来毫无关系，但却暗含一种关于创新的微妙潜规则——随着时间推移，产品创新对设备本身的改动越来越小，对设备能力的拓展越来越大。说人话

加载更多

搜狗推“个性化语音识别”，将颠覆与改变未来人机交互模式

相关文章

汇聚中国AI顶尖力量云天励飞参与华为AI大模型联合创新

用友大易：迈入AI招聘2.0时代，让人力资源回归本质

新发布的PaaS2.0，能否助力涂鸦智能再起飞？

大模型难掩AI制药的悲伤：越过山丘，无人等候

拾起王慧文的AI梦，美团冲向“光年之外”？

ChatGPT、Gemini、通义千问等一众大语言模型，哪家更适合您？

体验了下钉钉AI助理，真羡慕现在的“打工人”...

历时400多天，国产大模型全面赶超GPT-4？

微博COO王巍：微博已接入阿里云通义大模型，是通义最早一批外部客户

通义灵码推出企业版，底座模型CodeQwen1.5登顶权威榜单

通义千问APP更名为通义APP，免费开放通义全栈能力

阿里云发布通义千问2.5，性能全面赶超GPT-4 Turbo

通义大模型通过阿里云服务企业超9万，开源模型下载超700万

阿里云发布通义千问2.5，中文能力地表最强

AI PC，到底谁的梦想、谁的红利？

热门排行

编辑推荐