AI云爆发:亚太企业如何抢占AI应用全球化先机?

mysmile 5个月前 (11-13) geo 39 0
AI云爆发:亚太企业如何抢占AI应用全球化先机?

作者 | 付秋伟

引言

你是否想过,AI正在如何重塑商业未来?IDC最新《AI原生云/新型云厂商重构Agentic基础设施》报告揭示:87%的亚太企业在2024年已部署至少10个GenAI场景,2025年这一比例将飙升至94%!更惊人的是,亚太日常使用GenAI的消费者从2024年19%激增至2025年30%,企业采用率也猛增,65%的亚太企业将有超50个GenAI场景投产。IDC预测,到2028年,中等规模以上企业中将有上百个智能体协同运转。

面对这场智能革命,企业必须重新审视AI基础设施,能否应对智能体协同时代的挑战。这不仅是技术升级,更是商业模式与全球战略的深度博弈。

为助您把握先机,InfoQ特邀IDC中国研究总监卢言霞、GMI Cloud创始人兼CEO Alex Yeh,从数据与实战视角拆解报告,解读亚太AI基础设施新趋势。

以下为直播精华提炼。

1 需求爆发:AI应用全球规模化催生“AI原生云”

AI应用浪潮席卷而来,但技术栈深层的“链式反应”更具颠覆性。

IDC指出,2022-2024年,AI投资聚焦大模型训练;2025年起,市场转向推理侧,AI推理基础设施需求激增。报告显示,亚太使用AI推理基础设施的组织从2023年40%跃升至2025年84%,标志AI产业进入大规模应用阶段。

这一变革模糊了传统技术栈界限,催生了专为AI工作负载优化的新型云服务——AI Native Cloud。

什么是AI Native Cloud?IDC定义其需满足GPU高密度算力、超低延迟网络、GenAI编排与冷却等需求。

卢言霞分析:“未来企业可能有成千上万个智能体并行交互,对分布式算力和模型间传输的要求远超传统AI时代。”从通用模型到行业定制化,模型调优、RAG推理催生训推一体需求。

Alex从技术角度剖析核心壁垒:“首先是GPU集群高效调度能力。在亚太区域间调度算力,关键非硬件扩容,而是通过K8s等技术将利用率稳定在98%以上。我们自研Cluster Engine技术能在亚太四节点实时调度,甚至利用时差——亚洲夜间时,美国客户可调用亚洲算力,提升整体利用率。这种调度能避免训练中断,缩短周期,体现高效调度价值。

其次是算力适配能力。不同AI场景需求差异大:量化训练需高算力密度,视频扩散模型可用中低端显卡。统一框架适配多元场景至关重要。我们的Inference Engine产品打通硬件适配层,客户无需关注底层,直接通过API token按调用量付费,而非按卡计费,根据文本、图像、语音等模态动态调配算力,支撑‘按token计价’模式。

再次是全链路优化能力。GMI Cloud与传统云的区别在于:传统云仅提供‘卡+存储’资源,我们做分散式推理架构设计,效率更高。基于Inference Engine的调度,模型吞吐率、TTFT等指标优于传统云,这源于模型侧到硬件侧的深度调优,将算力转化为即用模型服务。”

他补充三点关键洞察,阐释AI Cloud与传统云的根本区别:第一,架构范式转变:从虚拟化到裸金属。Alex指出,传统云受虚拟化架构限制,以虚拟机提供算力,但AI计算需直接掌控硬件以避免性能损耗。AI Native公司常需裸金属,以控制整个架构,这对性能优化至关重要。

第二,服务模式变革:从远程支持到陪伴式服务。AI时代服务深度本质变化。“我们服务训练类客户需陪伴式服务,因集群问题频发,”Alex描述。这种长期陪伴要求工程师近乎驻扎客户现场,与传统云远程模式迥异。GMI Cloud建立专属SLA团队,承诺10分钟响应、1小时诊断、2小时恢复。

第三,核心竞争壁垒:全球化合规与运营。亚太数据法规碎片化,GPU资源抢手,要求云厂商具备全球合规运营能力。GMI Cloud在亚太建多个合规节点,通过本地化集群+动态调度,满足区域需求。

这三项构成传统云转型壁垒。“许多传统云厂商被旧架构限制,无法提供敏捷产品,”Alex总结。这为新兴云厂商创造机会,推动AI云崛起。GMI Cloud正推进“AI Factory”计划,落地亚洲最大万卡液冷GB300集群,并布局东南亚、日本、中东、美国等区域,支撑超大规模算力。

2 效能革命:从“算力供应商”到“价值共创伙伴”

技术革新落地企业,除提效外,成本节省是关键考核点。

亚太AI企业普遍采用多云策略,避免供应商锁定、追求性价比或满足数据本地化。但算力资源分散、管理规则不一,构成“隐性成本黑洞”。

卢言霞剖析挑战:“企业管理成本高企,因技术栈差异大——定价模式、SLA、支持方式各异。实现异构栈融合、保证兼容性,运营复杂度和成本可观。”

她指出更棘手的数据问题——GenAI应用常需从多异构数据源读取数据。当核心智能体与内部成千上万个智能体并行交互时,数据系统可能分布在多个公有云或私有基础设施中,同步协同成巨大工程挑战。接口标准化低,进一步抬高门槛。

针对痛点,Alex阐述GMI Cloud的“统一算力纳管”方案:

底层GPU硬件架构:提供高端GPU云与裸金属服务。通过生态协作获取英伟达高端资源,为高性能需求客户开放硬件层访问,消除虚拟化损耗,适配泛互联网、自动驾驶等场景。

IaaS层:Cluster Engine平台。基于K8s实现全球算力弹性调度,支持跨区域负载均衡与错峰复用,资源利用率达98%+,并通过可视化工具实时监控。

MaaS层:Inference Engine推理引擎平台。底层搭载H200芯片,集成DeepSeek、Qwen等近百模型,通过自研优化技术提升调用效率,提供统一API,支持多模态模型调用,实现“按token用量付费”。

三层架构协同形成算力价值闭环:硬件为基础,Cluster Engine实现资源流转,Inference Engine交付模型能力,破解算力分散、管理复杂、成本高企等痛点。

除多云管理挑战外,企业算力投入面临两难:“前期投入大,后期利用率低,闲置率高”。卢言霞观察,2025年上半年中国市场典型。“一些大型企业曾投入大量一体机方案,但未与应用场景挂钩。”传统AI时代,硬件作为固定资产,技术迭代快易浪费;互联网企业业务波动,AIGC APP试点时不建议过早投入硬件。

Alex分享方案:“GPU迭代从5-6年缩短至3年以内,硬件贬值风险剧增。我们提供‘租用而非购买’方式,客户签三年合同,以租用获顶尖算力,合同结束后可轻松升级最新硬件,避免资产贬值。”这对现金流敏感的新创公司具吸引力,将固定资产转为灵活运营成本。

Alex强调:“这种深度合作使GMI Cloud与客户关系从‘供应商-采购方’变为‘战略伙伴、共同成长’。”当AI算力需求从标准化转向场景化定制,传统云“卖资源”模式将变。AI基础设施进入“效果为王”阶段,云厂商竞争力取决于“为客户算力投入创造多少价值”。

3 市场转向:“推理需求爆发”衍伸行业竞合新趋势

GenAI场景加速,不仅变革技术栈,更重塑产业风向与格局。

报告显示,95%的亚太企业同时部署训练和推理基础设施。泛互联网、制造业和具身智能成为推理设施投入增速最快三大领域。泛互联网包括传统大型企业及AIGC应用,如中国企业出海的AI社交、内容生成等to C应用;制造业涵盖高端器械、医疗设备等出海企业,在海外建智能工厂带动大模型需求;具身智能领域机器人企业投入指数级增长。

Alex验证趋势:“最大需求来自泛互联网,其次是制造业。需求分三种模态:语音、视频加图像、文本。”语音包括转换、呼叫中心、陪伴应用;视频主要是电商领域,需大量图像视频制广告;文本如Copilot、会议摘要等工具。

技术层面,多模态融合成场景爆发核心。Alex预判视频领域将迎“DeepSeek时刻”,B200比H100速度提升两倍,生成5秒视频从30秒缩至400毫秒,实现即时生成,颠覆内容生产。电商、影片生成、短视频、动画、广告是亚洲热门,庞大用户基数为AI提供试验场。开源与闭源格局变化降低门槛,中尾部企业通过Finetuning快速落地。

推理需求增长重塑AI基础设施竞争格局。传统公有云与新型云厂商市场份额变化明显。卢言霞透露:“2024-2025年,GPU Cloud和新兴云厂商在GenAI基础设施市场占约15%份额。别小看这15%,对庞大市场已是重大进展。”

反常识转变:亚太算力玩家从“零和博弈”走向“竞合共生”。Alex提到,AI赛道算力短缺,“合作潜力多,大家不够用就互相借卡租卡”,泛互联网超大企业、公有云甚至与新兴AI云合作,“他们不想持续买卡,直接向我们租,我们能在小地方快速建集群,速度更快”。这种资源互补打破壁垒,算力流动更高效,为中企出海提供支撑。

对计划出海的中国AI企业,卢言霞给三点战略建议:

第一,建立负责任的AI体系,“现阶段对行业参与者至关重要”。随着GenAI能力增强,伦理风险、合规问题引全球关注,头部企业需构建全流程AI治理框架,这是门槛也是信任基础;

第二,紧盯大模型能力进化,“大模型迭代快,判断哪些能力由大模型直接提供,避免重复投入”。聚焦行业定制化差异化价值;

第三,重视AI专用基础设施建设,“传统AI时代基础设施重视不足,如今GenAI广泛部署,必须关注面向AI工作负载优化的基础设施”,尤其是训推一体、低延迟网络等核心能力,为业务落地基石。

对中国企业,只有抓住推理市场机遇,在性能、合规、成本间找到平衡,才能从“AI应用追随者”进阶为“区域规则共建者”,全球竞争中筑牢优势。

4 结语

卢言霞与Alex指出,亚太AI基础设施变革是技术与话语权的双重重构。推理基础设施渗透率提升,传统云“卖资源”模式失效,替代的是“技术栈+服务模式+全球布局”的综合较量。

技术底层,AI原生云通过裸金属架构、K8s弹性调度等,将GPU利用率提至行业领先,实现训推一体闭环优化。这推动AI应用从单任务向多场景协同演进。以GMI Cloud分布式推理架构为例,其通过PD分离、跨区域动态扩缩容等技术,稳定支撑高并发实时推理,满足多区域用户访问与智能体并行决策。

对行业,AI原生云核心价值在构建高效“能力底座”,将算力转化为直接生产力,助企业驾驭高并发推理与智能体协同。亚太正经历从“资源上云”到“智能用云”的效能革命。

行动号召:现在就是行动时刻!立即探索如何优化您的AI基础设施,抢占AI应用全球化先机。点击这里,获取完整报告解读与实战案例!

相关问答

ai云服务是做什么的?

什么是AI云服务:公有云、私有云、混合云。➤什么是人工智能云服务所谓人工智能云服务,一般也被称作是AIaaS(AIasaService,中文为“AI即服务”)。这是...

ai动态云怎么做?

制作AI动态云需要使用到多种技术和工具,包括深度学习模型、图像处理软件等。以下是一些制作AI动态云的一般步骤:数据收集和处理:首先需要收集大量的云朵图像...

人工智能云算力排名?

loudPlatform:分布式计...3、GoogleCloudPlatform:分布式计算和分布式存储方面排名第一,技术研发能力强。前3在哪个方面进行排名几乎都是没有争议的。。不...

人工智能云服务发展背景?

科技带动发展,大数据、云计算、人工智能等前沿技术都已经渗透生活的各个领域,在推动各行业完成智能化转型和新旧动能转换的进程中发挥着重要作用。尤其是在后...

5G+云+AI,云计算打造属于未来的全新模式,你怎么看?

5GAI云物联网对未来的影响随着信息技术的发展,5G、AI、云和物联网这些词汇不断地出现在新闻媒体和人们的生活中,那么这些技术的应用到底会对我们的生活产生...

云计算,大数据,人工智能,属于什么专业?申请方

云计算、大数据、人工智能属于信息领域。信息领域的电子科学与技术、信息与通信工程、控制科学与工程、计算机科学与技术都对这三个概念有所涉及。...

平安金管家ai云面试是什么?

AI云面试是入职平安之前得一个测试题,是AI智能机器人面试的,有简单介绍的平安的,有你对自己的工作有什么期待。或者之前是做什么工作的,收入多少,未来在平安...

云计算是人工智能领域的吗?

云计算主要是通过互联网为用户提供各种服务,针对于不同的用户可以提供IaaS、PaaS和SaaS三种服务。人工智能可以简单的理解为一个感知和决策的过程,发展需要三...

imc人工智能云药房干什么的?

IMC人工智能云药房是一种创新的医疗服务方式,将人工智能和云计算技术应用于药房管理和药物配送。它可以实现药物的自动配药和智能监控,提高药物使用效率和准...

白天鹅高手论坛官网[秒懂科普]旧版本APPv5.8.20-图吧地图

今年云业务收入加速增长背后的动因有哪些?今年公司的增量收入中有多少来自人工智能云业务?从长期来看,这对人工智能云业务的未来增长有何影响?此外,相比传统...

扫描二维码

手机扫一扫添加微信