1. 创业头条
  2. 前沿领域
  3. 人工智能
  4. 正文

阿里投1亿用AI保护方言,或在下一盘语音识别的大棋

 2019-03-21 15:58  来源:A5专栏  我来投稿 撤稿纠错

  域名预订/竞价,好“米”不错过

文/东方亦落

3月20日,天猫精灵的研发部门阿里AI labs宣布,正式成立方言保护专项小组,投入1亿元对汉语方言进行保护和开发。阿里的计划是先从四川方言开始,逐渐扩散到对全国方言的语音优化工作,希望能够以此实现全国方言的覆盖。

即将出任阿里AI labs总经理的陈丽娟表示,天猫精灵作为一款语音交互产品,以技术手段赋予语言更多的功能,例如通过语音获取信息、控制其他终端等等。而该小组还将与高校、专家以及制定相关规定的机构密切合作,探索如何对方言资源进行保护性开发。

这一计划中的具体措施还包括在手机App与智能音箱终端的基础上,采用语音交互等采样方法,建立覆盖全国的动态方言数据信息网和数据库,并且在全国范围内开展对方言的语音识别、语音合成等工作,以技术手段将方言永久保存。

这是一个非常有意义的计划,在普通话的大力普及之下,方言随着时间的流逝逐渐被人们遗忘了,对于这种无形的文化遗产的保护也迫在眉睫。不过阿里投资1亿元在这个方面,其终极目的恐怕不仅是为了保护方言,更是要在语音识别市场上为自家下一盘大棋。

当前,语音识别已然成为科技前沿的技术,越来越多的公司和行业都在向这方面靠拢。2017年,全球的语音识别软件市场规模就已经达到11亿美元,随着AI等各种技术的成熟,对语音识别的市场需求也在逐年提升。预计到2025年,全球语音识别市场的整体规模将达到69亿美元。

在这个市场上,在AI方面具备优势的阿里占据了先机。去年,阿里针对如今的互联网环境推出了“AI鉴黄师”。它每天能够处理10亿张图片,还能识别方言,这是其他AI工具做不到的。

在语音方面,阿里也有多年积累的经验,而且有YunOS语音识别技术。这些使得阿里的语音AI技术在今年2月入选了MIT(麻省理工学院)2019“全球十大突破性技术”。

MIT认为,阿里巴巴已拥有比谷歌更优秀的AI语音技术,它能够完成复杂的人类对话功能,甚至还能明白人类潜在的意图。在此之前,不少所谓的AI产品并没有真正做到智能,不过随着技术的进展,这种状况正在逐步改善。

在中国,消费者正在习惯使用阿里巴巴的AI语音助手,例如通过电话协调快递的运送,甚至还能与用户还价。去年双十一期间,阿里的智能客服机器人“阿里小蜜”承担了大部分的咨询量,相当于70万人工客服同时工作。

可以说,AI语音助手已经渗透到人们生活中的方方面面,出行、家居、医疗等都包括其中。阿里在具备雄厚的语音实力的基础上,对方言进行保护和开发,很可能是想进一步丰富自家的语音识别体系,毕竟方言在如今的语音市场中是很大的痛点。如果阿里能够攻克这一痛点,那么在语音识别市场中将拥有更多的机会。

不过从整体的技术方面来看,AI的发展仍处于初期,技术层面还有瓶颈需要突破。也正因如此,阿里才努力在语音识别方面寻求更多的机会,以便为未来进行更为长远的规划。

申请创业报道,分享创业好点子。点击此处,共同探讨创业新机遇!

相关文章

  • 阿里刚换帅,京东忙换将:新时代号角吹响

    6月26日早间,京东物流在港交所发布公告称,京东物流CEO余睿因个人身体原因辞任执行董事、首席执行官及授权代表,原京东产发CEO胡伟将担任京东物流CEO。同时,据《科创板日报》报道,京东集团将新成立创新零售部,将整合七鲜、拼拼等业务成为独立业务单元,这一业务将深入零售线下业务布局,探索创新模式。由此

  • 阿里巴巴变革,盒马“一马当先”

    随着数字经济成为当前经济社会发展的“新宠”,诸多数字企业也开始走上了发展的快车道。而作为国内互联网大厂的阿里巴巴集团,为了打造数字经济时代的商业、金融、物流、云计算和大数据等新一代商业基础设施,就于前不久启动了“1+6+N”的组织变革,宣布云智能、菜鸟、盒马、阿里国际数字商业等多个业务集团和公司,都

    标签:
    阿里巴巴
  • 阿里重回创业时代

    文/零度出品/节点商业组6月20日,阿里巴巴控股集团董事会主席兼CEO张勇通过全员信宣布,阿里1+6+N的全新业务集群基本成型,各业务集团董事会已开始运行,多个业务的上市和融资计划也已开展,控股集团将主要承担创新孵化大本营角色。3个月前,阿里宣布了“1+6+N”的组织结构,即在阿里巴巴集团之下,设立

    标签:
    阿里巴巴
  • 阿里组织变革新阶段:蓄力拉弓,一箭向前

    自3月28日宣布“1+6+N”分拆、5月18日宣布分业务启动独立融资或上市计划以来,阿里持续推动着这场史无前例的组织变革落地,谋求更高质量发展。6月20日,阿里巴巴控股集团董事会主席兼CEO张勇通过全员信宣布,他将于今年9月10日卸任现有董事会主席兼CEO职务,转而全心担任阿里云智能集团董事长兼CE

    标签:
    阿里巴巴
  • 阿里巴巴:改革稳定靠人,锐意进取也靠人

    逍遥子,扶摇直上九万里。

    标签:
    阿里巴巴
  • OpenAI发布GPT-4o 能读取人类情绪

    近日,OpenAI宣布推出其最新旗舰生成式AI模型GPT-4o。相较于GPT-4Trubo,GPT-4o速度更快、价格也更便宜据悉,ChatGPT可以读取人类的情绪,但读取过程有一点困难。OpenAI,是一家位于美国旧金山的人工智能研究公司,现由营利性公司OpenAILP及非营利性母公司OpenAI

    标签:
    chatgpt
  • ChatGPT、Gemini、通义千问等一众大语言模型,哪家更适合您?

    随着人工智能技术的飞速发展,大语言模型(LargeLanguageModels,LLMs)在各行各业的应用日益广泛,尤其是在软件开发、数据分析、客户服务等领域。蘑菇云创客空间[445期开放夜]就以“ChatGPT、Gemini、通义千问等一众大语言模型,哪家更适合您”这样的主题,开展了一次深度的大语

  • 体验了下钉钉AI助理,真羡慕现在的“打工人”...

    对于万千打工人来说,AI不会替代我们,反而会成为工作中重要的帮手

    标签:
    钉钉
  • 历时400多天,国产大模型全面赶超GPT-4?

    赶超GPT-4的阶段性升级,可以看作是国产大模型有序迭代部署、不断拉近差距的标志,切莫像手机跑分那样,在过度营销的作用下,沦为被群嘲的对象。

    标签:
    大模型
  • 微博COO王巍:微博已接入阿里云通义大模型,是通义最早一批外部客户

    5月9日,记者获悉,微博已接入阿里云通义大模型,提升内容生产效率和社区活跃度。微博不仅是阿里云最早一批上云客户,也是阿里云通义大模型的最早客户。微博COO、新浪移动CEO王巍表示,AIGC发展速度远超想象,包括通义2.5在内,已涌现出不少大模型能力超越GPT4。同时他指出,大模型开源势不可挡。“阿里

  • 通义灵码推出企业版,底座模型CodeQwen1.5登顶权威榜单

    5月9日阿里云AI峰会,通义灵码宣布推出企业版,满足企业用户的定制化需求,帮助企业提升研发效率。通义灵码是国内用户规模第一的智能编码助手,基于SOTA水准的通义千问代码模型CodeQwen1.5研发,插件下载量已超350万。通义灵码熟练掌握Java、Python、Go、JavaScript、Type

    标签:
    通义千问
  • 通义千问APP更名为通义APP,免费开放通义全栈能力

    5月9日消息,通义大模型品牌升级,“通义千问APP”更名为“通义APP”,集成通义大模型全栈能力,免费为所有用户提供服务。通义APP以性能媲美GPT-4Turbo的基模为底座,并把通义实验室前沿的文生图、智能编码、文档解析、音视频理解、视觉生成等能力“Allinone”,成为每个人的全能AI助手。通

    标签:
    通义千问
  • 阿里云发布通义千问2.5,性能全面赶超GPT-4 Turbo

    5月9日消息,阿里云正式发布通义千问2.5,模型性能全面赶超GPT-4Turbo,成为地表最强中文大模型。同时,通义千问最新开源的1100亿参数模型在多个基准测评收获最佳成绩,超越Meta的Llama-3-70B,成为开源领域最强大模型。相比通义千问2.1版本,通义千问2.5的理解能力、逻辑推理、指

    标签:
    通义千问
  • 通义大模型通过阿里云服务企业超9万,开源模型下载超700万

    5月9日消息,阿里云公布最新数据,通义大模型通过阿里云服务企业超9万,通义开源模型累计下载量突破700万。通义落地应用进程加速,现已进入PC、手机、汽车、航空、天文、矿业、教育、医疗、餐饮、游戏、文旅等领域,成为最受中国企业欢迎的大模型。阿里云AI峰会现场,小米旗下的人工智能助手“小爱同学”已与阿里

    标签:
    通义千问
  • 阿里云发布通义千问2.5, 中文能力地表最强

    通义大模型发布一周年之际,迎来重要的历史性时刻。5月9日,阿里云正式发布通义千问2.5,模型性能全面赶超GPT-4Turbo,成为地表最强中文大模型。同时,通义千问1100亿参数开源模型在多个基准测评收获最佳成绩,超越Llama-3-70B,成为开源领域最强大模型。历经一年多追赶,国产大模型终于进入

    标签:
    通义千问

编辑推荐