近日,国际消费类电子产品展览会(International Consumer Electronics Show,简称CES)在美国的拉斯维加斯举办,展会上各种新奇的技术让人叹为观止!潮流的5G、自动驾驶、3D打印、人工智能、无人机、机器人、智能家居……一一亮相,世界各地的科技人士汇聚到这座世界闻名的城市,参加这场一年一度的科技盛宴!其中,中国造机器人成了展会的一大亮点,北京旷视科技有限公司展台边人头攒动,获得了不少掌声!
图:旷视科技3D人体姿态识别技术亮相CES展会
原来,旷视科技展示的是一种叫3D实时人体姿态识别技术,模特站在指定区域,做出各种各样的人体动作后,屏幕上的虚拟人物居然迅速也跟着做出了一模一样的动作,而且动作灵活,转起来一点都不含糊,跟着模特,左手右手一个慢动作。
有参展人士表示:“电影《环太平洋》将动漫中的机甲搬到了荧屏,引发了机甲热潮。而旷视科技在CES上展示的3D人体姿态识别技术,则让炫酷机甲走向现实成为了可能!”
那么旷视科技是如何让虚拟人物跟着人的动作运动的呢?展台一旁的显示屏揭示了这个秘密。显示屏上展示了人体的骨骼节点,骨骼移动的时候利用AI技术追踪节点,再以此控制机器人的动作,最终呈现出来的就是现场看到的场景了!因此,这项3D人体姿态识别技术又叫人体骨骼点柔性追踪,屏幕上的节点就是旷视科技深度学习后找到的人体骨骼关键点,它可以支持多人场景实时追踪。
图:旷视科技3D人体姿态识别技术过程展示
只是,人体的骨骼千变万化,每个人的穿着、姿态、视角等都大不相同,这个3D识别技术还能追踪到吗?当然!这项“聪明的技术”全都做到了。
我们了解到,这项技术是旷视科技与MTK联合研发的,基于MTK提供的大规模 Human Pose 数据集。对于复杂的人体动作,3D人体姿态识别技术能够捕捉到更微小的动作,精准度和速度全面提升!或许以后我们不仅可以在体感游戏、3D试衣、动作追踪、行为检测、自动驾驶、人体建模等众多场景中看到旷视科技这项神奇的AI技术,更有可能如《环太平洋》一样,用自身动作操控炫酷机甲!
3D总有一种神奇的魔力,在现场,旷视科技另一个3D sensing 解决方案同样备受关注。像3D解锁、红外预览、3D建模等都是这个方案中的尖端3D算法。据介绍,该方案在室内的Depth精度从20cm到1.2m距离范围,实测数据超越IPhone X!在室外拍照时,10万 Lux强光下,实拍人脸的深度图效果也不输IPhone X。而且成本比同类方案更低,妥妥的性价比之王。这项解决方案则是多被用在手机解锁和支付认证、3D手势识别、人脸或头部建模、AR应用上。
如今,越来越多的人工智能技术被应用到我们的日常生活中,智能手机的人脸识别解锁、人像背景虚化、智能人像光效、智能手势识别、3D Pose、AI美体、Super IQ等 AI技术让我们有了更便捷的体验,连机器人也已经从想象成为现实,这正是旷视科技这家人工智能企业坚持的初心,让 AI 通过手机为人们工作、生活和娱乐等方方面面持续带来惊喜的改变。给踏踏实实做技术的企业点赞!
申请创业报道,分享创业好点子。点击此处,共同探讨创业新机遇!
2023年7月6日,第六届世界人工智能大会(WAIC2023)在上海开幕,“人工智能大模型”是本届大会的备受瞩目的话题,据悉,在昇腾AI大模型的创新研发中,华为联手26家行业领军企业,组建了一支协同创新的“AI明星队”,云天励飞作为中国人工智能企业的杰出代表,和互联网大厂、运营商、科研院所等优秀团队
这几个月来,以ChatGPT为代表的生成式AI展现出的能力令世界惊叹。自从2016年AlphaGo战胜李世石掀起了一波AI浪潮后,AI仿佛已经沉寂了很久,ChatGPT的横空出世就如同一束耀眼的光芒,让AI这个名词重回C位。过去在AI1.0时代,主要通过训练模型来实现图像识别、声音识别、语言处理等特
文:互联网江湖作者:志刚2023年的IoT需要一个新故事。6月29日,涂鸦智能在开发者大会上,发布了企业级战略PaaS2.0,希望通过一个平台+四大开发服务,建立起IoT生态。对于这场发布会,市场的态度是积极的。美东时间6月29日收盘,涂鸦智能美股股价上涨5.6%,来到1.87美元/股。近日股价稳定
2020年底,王慧文在朋友圈写下这句话时,外界本以为这位伴随中国互联网发展而持续创业20年的人物即将告别创业舞台。但是,一个曾经多次创业,正值壮年的互联网老将心中的创业热情是难以熄灭的。
C114讯5月21日消息(九九)阿里云今天抛出重磅炸弹:通义千问GPT-4级主力模型Qwen-Long,API输入价格从0.02元/千tokens降至0.0005元/千tokens,直降97%。这意味着,1块钱可以买200万tokens,相当于5本《新华字典》的文字量。这款模型最高支持1千万toke
近日,OpenAI宣布推出其最新旗舰生成式AI模型GPT-4o。相较于GPT-4Trubo,GPT-4o速度更快、价格也更便宜据悉,ChatGPT可以读取人类的情绪,但读取过程有一点困难。OpenAI,是一家位于美国旧金山的人工智能研究公司,现由营利性公司OpenAILP及非营利性母公司OpenAI
随着人工智能技术的飞速发展,大语言模型(LargeLanguageModels,LLMs)在各行各业的应用日益广泛,尤其是在软件开发、数据分析、客户服务等领域。蘑菇云创客空间[445期开放夜]就以“ChatGPT、Gemini、通义千问等一众大语言模型,哪家更适合您”这样的主题,开展了一次深度的大语
赶超GPT-4的阶段性升级,可以看作是国产大模型有序迭代部署、不断拉近差距的标志,切莫像手机跑分那样,在过度营销的作用下,沦为被群嘲的对象。
5月9日,记者获悉,微博已接入阿里云通义大模型,提升内容生产效率和社区活跃度。微博不仅是阿里云最早一批上云客户,也是阿里云通义大模型的最早客户。微博COO、新浪移动CEO王巍表示,AIGC发展速度远超想象,包括通义2.5在内,已涌现出不少大模型能力超越GPT4。同时他指出,大模型开源势不可挡。“阿里
5月9日阿里云AI峰会,通义灵码宣布推出企业版,满足企业用户的定制化需求,帮助企业提升研发效率。通义灵码是国内用户规模第一的智能编码助手,基于SOTA水准的通义千问代码模型CodeQwen1.5研发,插件下载量已超350万。通义灵码熟练掌握Java、Python、Go、JavaScript、Type
5月9日消息,通义大模型品牌升级,“通义千问APP”更名为“通义APP”,集成通义大模型全栈能力,免费为所有用户提供服务。通义APP以性能媲美GPT-4Turbo的基模为底座,并把通义实验室前沿的文生图、智能编码、文档解析、音视频理解、视觉生成等能力“Allinone”,成为每个人的全能AI助手。通
5月9日消息,阿里云正式发布通义千问2.5,模型性能全面赶超GPT-4Turbo,成为地表最强中文大模型。同时,通义千问最新开源的1100亿参数模型在多个基准测评收获最佳成绩,超越Meta的Llama-3-70B,成为开源领域最强大模型。相比通义千问2.1版本,通义千问2.5的理解能力、逻辑推理、指
5月9日消息,阿里云公布最新数据,通义大模型通过阿里云服务企业超9万,通义开源模型累计下载量突破700万。通义落地应用进程加速,现已进入PC、手机、汽车、航空、天文、矿业、教育、医疗、餐饮、游戏、文旅等领域,成为最受中国企业欢迎的大模型。阿里云AI峰会现场,小米旗下的人工智能助手“小爱同学”已与阿里