当前位置:首页 >  IDC >  云计算 >  正文

青云科技以多元算力调度管理AI基础设施,以开放生态整合AI能力

 2023-09-26 16:38  来源: 互联网   我来投稿 撤稿纠错

  域名预订/竞价,好“米”不错过

AI引发的算力需求到底有多大?各种预测数据虽然并不统一,但可以肯定的是AI和大模型又将带来新一轮的生产力的变革,在这个技术催生的市场变化中,企业的应用变得更加复杂,业态会更加丰富,底层架构单一的CPU或者GPU已经不能满足需求。总而言之,企业面临的技术和平台挑战将是空前的。

青云科技(qingcloud.com)总裁林源分析说:“从算力建设的角度去看,现在是算力集中建设的阶段。大量的算力中心如雨后春笋般出来,成本和技术是最大的挑战。如果说建设期就是盖机房、购买设备,那么中长期的运营则是更专业、更复杂的问题。这些问题都需要解决,青云也给出了自己的答案,这就是青云最新推出的AI算力调度平台。”

多元算力调度,管理AI基础设施

“在近两年运营过程中,我们总结出一些这个行业当前面临的挑战,同时它也是青云所需要解决的问题。”青云科技产品经理苗慧在分析行业挑战的同时,也给出了青云科技的解决方案。

首先,解决行业多元资源统一调度管理的问题。

在AIGC领域,行业面临的普遍问题是大文本和大量行业数据加速,不同的资源需要统一平台进行管理。比如,一个影视渲染行业的用户,需要渲染一部大电影,他们可以通过青云的平台进行分发,即时构建环境调度需要用到的渲染资源。

在AI训练方面,用户通过开源的人类自然语言模型训练图片、数据,做模型微调,再加上自己的行业知识,也能通过青云统一的多源资源调度管理平台进行分发管理。

对于管理员来说,通过青云的平台,只要通过一个管理界面、一个大屏,就能看到其分布在全国的2000台资源,3000个存储节点等等,以最少的人力大大提升管理运维效率。

二、解决AI应用的网络瓶颈。青云通过多种方式来解决网络瓶颈的问题。在高速组网方面,青云基于传统的云计算领域,增加了高速网络,并针对不同种类和型号的网卡做了网卡虚拟化和完全的子网隔离,以确保用户无论是按卡申请还是按节点申请,都能保证数据的安全隔离,保证用户之间不存在这种数据的风险。

在通信链路方面,这也是青云在AI算力调度平台着力最多的地方。青云将所有的节点、服务器、存储设备都做出了路径标签,设置最佳路径距离。通过算法,投入调度最短链路,计算最短链路,保证最好是两个节点在一个交换机内,这样不跨交换机,又减少一些数据的传输损耗。

针对AI训练,青云提供了在线训练平台。把高性能计算、GPU卡等汇集成起来,在专属的环境上,提供GPU服务器在线申请构建集群,所有的网络和环境都可一键生成。并且青云会根据行业内常用的模型和小工具,进行集成。同时,青云在每个区域都有一个小型的容器镜像中心,与镜像节点和推理服务进行内网连接,这使得训练过程更快,远比在公网上拉数据等要快得多。

第三,解决环境搭建的复杂性问题。算力中心面向众多的终端用户,这就注定了它的复杂性。在环境搭建方面,青云有两种方式为客户提供常用的镜像或者容器。

第四,解决多业务整合的瓶颈问题。青云目前已将更多的业务以松耦合的模式嵌入整合到青云云平台。

第五,解决运维平台的复杂管理问题。青云提供了更多的运营服务,尤其是算力中心服务。以国家超算济南中心为例,其后端团队,既要运维软件还要负责客户的各类运维问题,这就需要投入大量的人力还耗时耗力。青云通过一套运维平台,让其定价、打折、促销等,只需要在页面上点击按钮就可实现,而不再需要通过申请表的传统方式实现。

总结而言,青云AI算力调度平台的特性主要有:第一,基于多种芯片,包括通用CPU、英伟达GPU、信创芯片等等;第二,全生命周期的管理;第三,AIGC业务化;第四,通过业务化、自动化,让非计算机行业用户能一键运行数据、业务和模型等。

开放的生态圈,实现AI整体能力的整合

青云AI算力调度平台是算力中心运营者的关键工具,目前其服务的对象主要为现在和未来投入算力中心建设的企业——现在的投资者和未来的运营者。

青云把多年运营服务的经验融入到了产品、服务体系,并在国家超算济南中心有了成功实践。国家超算济南中心是一个包括HPC超算、传统云计算(以CPU为主)、智算(兼有国外及国产GPU)的多元计算中心。和众多算力中心一样,国家超算济南中心需要的是满足客户需求的、成熟的运营工具和平台。平台能力越强,能支撑客户的业务种类越多,客户越多,盈利模式越清晰。

青云认为未来 AI 时代,企业一定是通过算力服务、算法和模型、高价值的数据来实现智能化,这也是 AI 生态体系的价值所在。青云也清醒地认识到与不同领域的合作伙伴一起实现整体能力的整合,才能够更好地帮助企业实现 AI 真正的业务价值。

干自己最擅长的AI算力资源调度,这也与青云科技十几年来耕耘的云调度平台、IaaS一脉相承。

申请创业报道,分享创业好点子。点击此处,共同探讨创业新机遇!

相关标签
云服务

相关文章

  • 青云QingCloud 面对算力新问题有产品、更有服务

    算力作为推动人工智能产业发展的核心动力,在将数据及算法转化为最终生产力的过程中发挥着重要作用。可以说,大模型时代,AI领域正从数据和算法层面的竞争,转变为底层算力的竞争。相关机构分析显示,我国算力产业保持高速增长,其中AI算力在整个算力结构中的占比已经超过25%。我国算力总规模近五年年均增速近30%

    标签:
    云服务
  • 百望云获评ITShare数智未来创新峰会“年度数字化优秀服务商”大奖

    近日,百望云应邀出席“新能源-新制造暨汽车数智未来创新峰会”,凭借在数字化领域优秀的服务能力和丰富的落地成果,成功获评“年度数字化优秀服务商”,这也是市场对百望云在赋能企业数字化转型和产品创新领域的再度认可!在“数智创新未来”的主题下,百望云也与众多行业知名企业分享了财税数字化转型成功经验,共襄盛会

    标签:
    云服务
  • 确立“AI算力”战略重心,青云科技备战“下一个10年”

    近三年,中国云计算市场在多个维度同时发生着剧烈变化——疫情极大加速了全社会对于数字化的认知和接受程度;一系列云原生技术依托着开源和蓬勃的市场而迅速发展演变,更多产品和技术名词同时涌向市场;国际关系复杂化下的信创云浪潮扑面而来......在这样一个技术和需求都在快速演变的供需环境中,云计算市场竞争走向

    标签:
    云服务
  • 什么是更适合金融的云?青云QingCloud“解锁”全栈云强大功能

    在央行印发的《金融科技发展规划(2022-2025年)》中,“金融科技”被定位为深化金融供给侧结构性改革,加快金融机构数字化转型,增强金融服务实体经济能力的重要引擎。规划涵盖基础设施、数据、核心技术应用、创新等方面的主体内容,包括"基础设施、技术中台、业务中台、业务场景"4层建设体系,并制定了”数字

    标签:
    云服务
  • 伙伴云连续2年入选Gartner《中国分析平台市场指南》,数据分析能力遥遥领先

    伙伴云作为中国分析与商业智能平台代表性厂商,因出色的数据分析能力,入选Gartner2023《中国分析平台市场指南》(《MarketGuideforAnalyticsPlatforms,China》,以下简称“指南”),成为入选该报告中唯一一家零代码厂商。伙伴云连续2年入选Gartner《中国分析平

    标签:
    云服务

信息推荐