传说中的6G,挑头的居然不是高通而是英伟达
日期:2025-11-09 11:43:57 / 人气:8

Cloud is where AI is born;
Device is where AI acts;
Edge will be where AI lives.
如果要在GTC DC大会上,寻找一个英伟达身上最“性感”而非最“实感”的故事,不同人或许有不同的答案,但有一个技术品牌可能真的要新加入候选人名单了。正是为了它,英伟达刚刚花费了10亿美元入股了老牌电信厂商诺基亚。它就是英伟达AI-RAN的核心技术品牌:Aerial。
Aerial,今天是一个带有点工业气息的词语。但词源来自拉丁语aerius,意指“空气的、轻盈的、高耸的”,在古时也用来形容虚幻的、轻盈优雅的美。它让人联想起另一位硅谷“帮主”OpenAI的视频产品:Sora。
Sora在日语中的本意是“空”,可以是天空,也可以是想象遥远地方时的一种心境。
无论英伟达还是OpenAI都把自己的旗舰产品指向天空,这不是一种偶然,也不仅是一种硅谷审美乐趣上的趋同。或许它们将讲述的是相似的一个东西,但现在我们先暂时按下不表。
所谓AI-RAN,用大白话理解就是在通讯基站上加入算力,让未来海量的场景计算可以不用进入云,直接在基站计算完以后就能够返回给终端的场景设备。
这样的方式有两个最显而易见的好处:
一个是节省大量的传输成本,降低云算力中心的压力。
微软CEO萨提亚·纳德拉(Satya Nadella)在前两天与OpenAI CEO山姆·奥特曼(Sam Altman)对谈时就提到了这种AGI困境:他说他的仓库里还有GPU,但没有足够的算力中心容纳,也缺少足够的电力使用。那么其实AI-RAN把算力分布式地放在全球的各个基站里,就可以成为以上的解决方案之一。
第二个则是大幅降低算力的时延。
打过在线游戏的读者都知道,有50毫秒以内的时延都属于“流畅”,但如果把这个延迟复用到自动驾驶上,高速路上将到处都是被撞烂的废铁,这也是今天高精地图方案被边缘化的重要原因。但如果将算力中心推进到用户周围,那么延迟可以降低90%以上,从毫秒级变成微秒级,大量高时延要求的场景就会跑通了。
根据目前可考的公开资料,Aerial最早出现在英伟达的资料里是在2019年洛杉矶世界移动通信大会,那时它还只是一套SDK工具,目的是支持GPU加速与软件定义的5G无线接入网。
没错,2019年,正是“何同学”拍5G视频获得三千万播放量的梦幻之年。
所以从这个角度来说,Aerial大概也能算是一个“5G原生”的工具,正是通讯带宽的快速增长让英伟达看到了一个未来世界的影子,于是Aerial诞生了。
而在过去五年时间里,5G逐渐让不少人失望,但Aerial一直在默默发育。
在这期间,Aerial的定位脱离了最初的SDK工具箱的数据,而转变为一个为“产学研”服务的平台。
2021年3月,NVIDIA在IEEE的5G分论坛上发了一篇论文《NVIDIA Aerial GPU Hosted AI-on-5G》,介绍5G连接和移动边缘计算(MEC)的NVIDIA超融合(hyper-converged)平台,那时他们的案例目标是工业4.0。
在这篇论文的摘要里,NVIDIA明确表示:
Aerial是一个为研究人员提供下一代无线和人工智能研究平台,从而实现行业转型开放平台。
As an open platform, Aerial is positioned to beindustry transformationalby providing researchers with a platform for next generation wireless and AI research.
一个月后,NVIDIA在2021 GTC大会上推出Aerial A100,即NVIDIA AI-on-5G计算平台。
Aerial A100其实是将NVIDIA Aerial软件开发套件与NVIDIA BlueField-2 A100芯片结合起来的产品,后者很大程度上脱胎自英伟达2020年刚完成收购的Mellanox的DPU产品线。虽然这是一个拼凑起来的产品,一张包括了“5T FOR 5G”解决方案、集成GPU和DPU的融合型卡,但它为AI-RAN提供了宝贵的计算平台,得到了包括谷歌云、富士通的支持。
是的,他们甚至没有在名字里放入AI——所谓5T,指的是“时间触发传输技术”(Time-Triggered Transmission Technology for Telco)。顾名思义,这其实就是要解决精确时间戳和高时钟准确性的问题,但这其实是大规模边缘计算的基础。
有趣的是,那年媒体对2021 GTC的标题是:“NVIDIA推出首款CPU,狂推ARM生态。”虽然服务器业务依然重要,但今天已经不太有人想起CPU了,更不会用ARM的视角来看待NVIDIA了。
随后Aerial迎来了一个小的高峰,这从英伟达的“技术博客”可见一斑,在2022年以后有提及Aerial的技术博客数量快速增加。
2022年到2023年间,英伟达陆续推出了DOCA GPUNetIO、Sionna库、Aerial Research Cloud等一系列加速AI-RAN的工具。
DOCA GPUNetIO让GPU绕过CPU实现直连网络,降低了时延和成本、提高了吞吐量;
Sionna库则是一个GPU加速的开源库,用于通信系统研究,官方说它可以实现“自动微分框架”,“通过整个通信系统反向传播梯度”,非常适合“神经网络集成”;
Aerial Research Cloud是第一个完全可编程的5G和6G网络研究沙盒。
但你依然可以将英伟达对Aerial做的所有事情,都重新联系回2021年的那个论文标题上:
GPU Hosted AI-on-5G
2024年是英伟达Aerial的生态大年。
2月,著名的AI-RAN Alliance成立,牵头单位是英伟达和软银,其他创始单位分别是爱立信、诺基亚、三星、T-mobile、微软、AWS、Arm、DeepSig、美国东北大学。
AI-RAN Alliance成为了英伟达希望重新改写6G定义模式的重要一步,因为它囊括了(除了华为和中兴以外)几乎最重要的通信相关的公司。其组织目标就是要让AI与RAN结合,从而让6G变成真正的AI原生网络。
3月,英伟达还推出了包含Omniverse生态系统和Aerial CUDA的6G研究平台。
而直到9月份,英伟达在GTC Paris 2024才宣布正式推出NVIDIA AI Aerial。
这是它在官方介绍中,它已经成为了一个优化无线网络和提供全新生成式AI体验的一站式平台。
英伟达官方的通讯稿里是这样介绍AI Aerial的:
NVIDIA AI Aerial平台提供了全套功能,包括高性能软件定义的RAN以及训练、模拟和推理,以便电信运营商能够参与下一代无线网络从开发到部署的所有阶段。
NVIDIA AI Aerial平台提供的功能包括:
NVIDIA Aerial CUDA加速RAN:包含使合作伙伴能够在NVIDIA加速计算平台上开发和部署高性能虚拟化RAN工作负载的软件库。
NVIDIA Aerial AI无线电框架:包含基于PyTorch和TensorFlow的软件库,用于开发和训练能够提高频谱效率并为5G和6G无线电信号处理添加新功能的模型。该框架还包含NVIDIA Sionna,该链路级模拟器可用于开发和训练基于神经网络的5G和6G无线电算法。
NVIDIA Aerial Omniverse数字孪生(AODT)是一个系统级网络数字孪生开发平台。AODT能够以物理学精度模拟无线系统,无论是单个基站,还是由大量基站组成的覆盖整个城市的综合网络都不例外。它包含软件定义的RAN(Aerial-CUDA加速RAN)和用户设备模拟器,以及物理世界的现实地形和物体属性。
这里包含了英伟达对下一个6G的很多定义和想象:
高性能的算力、神经网络的分布式网络能力、数字孪生的虚拟世界开发能力。
也从此开始,英伟达开始加速推进整个AI-RAN的生态建设的扩容,不仅与Vapor IO这类边缘计算服务商在拉斯维加斯开辟实验田,也不断开源新的工具,推进新的头部合作伙伴。
而这一系列生态动作,在2025年10月的GTC DC大会上达到了一个阶段性的峰值。
Aerial冲刺CUDA时刻
在10月GTC DC大会期间,英伟达终于对着AI-RAN暗流涌动的湖面上扔下了两个大石头:
第一,开源Aerial软件。
开源后的软件,将可以运行于包括NVIDIA DGX Spark在内的多种NVIDIA平台。
DGX Spark就是黄仁勋之前亲手交付给马斯克和李在镕的小“便当盒子”,是目前全球最小的“AI超级电脑”,可以在本地执行最高2000亿参数的AI模型推理和700亿参数的模型微调,可以说完美匹配像AI-RAN场景多元的开发生态需求,非常适合高校研究者和个人开发者参与。
第二,英伟达宣布以10亿美金入股诺基亚,达成战略合作。
入股后英伟达将占比2.9%,英伟达的AI-RAN生态产品将进入诺基亚的RAN产品组合里,双方共同推进6G的AI-RAN落地。
第三,英伟达推出了Aerial RAN Computer Pro(ARC-PRO)平台。
如果说曾经的Aerial平台还是一个带有研发起步性质的小平台,这次的ARC-PRO就是为顶级合作伙伴预备的产业级大跑道,它可以直接和基站结合,既能服务5G实现AI-RAN功能,还能帮助5G向6G的平滑过渡。介绍稿里的标题也从AI-RAN,正式切换成了“6G AI”。英伟达对这个6G AI平台的口气也变得很大,甚至在中国读者看来可能是很具有侵略性的:
“驱动美国重返电信领导地位”。
如果了解英伟达历史的读者,至此可能已经有一种似曾相识的感觉。Aerial的发展历程很像CUDA,几乎是一种关于技术的商业美学复刻。
黄仁勋力推CUDA,因为它看到GPU不止局限于游戏图像,而有通用计算能力的潜力;推Aerial,因为RAN不止是通信,还可能是未来的AI基础设施。
CUDA从高校生态起步,花了十年时间培养,最终形成了独有的生态护城河;Aerial也是从小的研发性质开发平台起步,一步步变成一个AI-RAN生态,总共花了五年时间,成为了英伟达基站算力业务的护城河。
从单点工具→通用平台→生态护城河,这是英伟达与时间的经典故事。
但如果细究,则会发现两者在商业细节上不完全相同。
这种差别不是在节奏的快慢上,Aerial是含着金钥匙出生的孩子,节奏自然更快。最大的区别是英伟达对生态伙伴的态度上。
以算法生态为例,CUDA是闭源为主,Aerial是开源为主。
在合作方面,CUDA的开放主要是积累开发者的习惯和口碑,Aerial虽然也拥抱大量中小开发者,但核心战略目标直指生态中的顶级玩家。
英伟达若要复刻CUDA时刻,第一个“北极星指标”实际上是让自己的标准与生态被“大玩家”接受。没有通信行业错综复杂的利益生态的支持,AI-RAN就无从谈起。在通用计算方面,GPU对CPU是从无到有的降维打击。但Aerial对RAN则是从无到有的合作升维。
从这个角度来说,虽然贵为5万亿美金的硅谷新宠,在通信市场里,英伟达依然在扮演“仰攻”和“说服者”的角色。
“10亿美金入股”就是其中最有力的说服方式。
诺基亚可能是今天Aerial所能找到的最完美合作伙伴。
抛开华为外的欧美国家市场,诺基亚的5G基站市场份额已经落后爱立信,且在趋势上与后者的差距越来越大。尤其在美国的基站市场,诺基亚丢单Verizo以后,一度传出仅剩的T-Mobile也将不保。与英伟达的合作或许可以帮助诺基亚在美国市场重新站稳脚跟。
2023年,诺基亚出台过一个“2030年计划”。该计划与英伟达的喜好高度吻合,它将AI放在了所有战略的第一条,将“云连续体”放在了第二条。所谓云连续体,其实就是将“云-边-端”无缝融合,背后最大的市场机会其实就是“边缘云”市场。
而如果按照英伟达的技术构想,今天的通信公司未来都可以成为新的云计算公司。这点我们放在最后细说。
最后,诺基亚是一个股权分散的上市公司,大股东系芬兰政府旗下资金,不直接干预公司经营。因此,英伟达2.9%的持股,既不会过度引发其他基站公司的抵触和担忧,也能直接对诺基亚施加影响。
对于英伟达而言,入股诺基亚有两大战略优势。
第一,6G AI的部署速度会领先行业,假如英伟达率先将部署了Aerial的基站设备推向市场,再在Aerial基础上形成应用生态,率先做成生态的增长飞轮。
这有点像安卓之于塞班、Windows Mobile等系统,先发优势会形成操作系统的重要优势。
第二,则是关于传统RAN市场格局中非常重要的投票机制:3GPP。
3GPP是全球移动通信技术标准的核心制定组织,组织内有上百个不同产业链的关键企业。3GPP在中国算半个网红,因为它曾在几年前爆发过一个科技行业非常出圈的新闻,即华为主推的Polar码和高通主推的LDPC码的“投票门”。投票过程被花边演绎,结果对某投票的企业形成了极大的公关创伤。
其实像编码提案是需要71%的投票率通过,因此并不存在严格意义的“关键少数”,而是以技术共识为主、投票为辅的决策形式。但3GPP“权力修罗场”的形象已经被深刻留在了互联网里了。
英伟达虽然有AI-RAN作为行业联盟,但3GPP才是规则的制定者。坏消息是,由于没有传统的通信业务,英伟达在其中的权重很低,存在感很弱。所以英伟达也需要一个具有生态协同能力的策动能手,而诺基亚便是在3GPP中与华为、爱立信、高通并驾齐驱的第一梯队权重的投票者,对上下游的其他投票权企业也有很深的影响力。
而今年和明年的3GPP讨论release 20和release 21刚好是5G转向6G的重要节点。
其中2025年的release 20被认为是5G-Advanced的最后一站,也是迈向6G的第一站。而大概率在明年召开的release 21则将是6G标准的第一站。英伟达需要抓住更多的时间窗口,来为自己的AI-RAN生态获得更好的站位。
谁的“6G”?
英伟达是今天RAN生态不可忽视的变量,高通也是。
如果将AI-RAN粗暴地分成AI和RAN两个维度,再将二家半导体巨头放在一起比较:显然英伟达是AI强,RAN弱;高通则是RAN积累更深,AI相对英伟达处下风。
在6G时代,高通当然也会是重要的参与者。但这涉及到一个话语权的重新争夺:
6G的本质到底是倾向于AI还是RAN?
最简单的做法是算账。
我们暂时无法给出准确的数据,但是有一些相近的数字可以参考。DGX Spark 128G的定价是3999美元,折合人民币近3万元;算力中心的大芯片A100,大内存的单卡价格在1.5万美金往上,折合10万人民币。
5G基站方面,此前有媒体通过中国移动的总5G投资和总5G基站部署量,计算出整体的基站平均部署成本大约40万人民币(含安装、土地等综合成本)。不过近几年随着产业链成熟,5G基站成本也在快速下降,有相应集采价格已经跌到16万人民币。
不过5G基站的类型包含了大基站、微基站等不同种类大小,功率和覆盖范围差异很大,所以不能一概而论。但6G的基站相应会比5G更密集,大基站空间更少,微基站更多。不过早期技术普及期,整体价格也可能会高一些。
有两件事情是确定:
第一,芯片算力会在基站业务中占据非常重要的成本比例;
第二,这个成本占比在未来是存在弹性的:
如果算力的使用频率越高,场景对算力的需求就会越大,那么芯片在基站中的成本占比也就越高。换言之,相比于RAN业务的规模,算力芯片业务的收入想象可以是很宏大的。
而黄仁勋从来没有放弃过的东西,就是对算力的“想象”。
这时我们就不得不搬出NVIDIA的另一个杀手锏级的技术品牌:Ominverse。
这个产品曾经是元宇宙热潮时候的宠儿,名字也带着元宇宙的气息(Omni是“所有”的意思,连起来就是“全宇宙”)。2021年,黄仁勋用它做了一个数字分身做发布会演讲,成了Metaverse时期的一道独特风景。
如今,Meta的时代已经远去,Omni却留了下来。
今天Omnivesre成为了英伟达与场景的重要链接器,许多跟落地相关的业务都在这里。如果你想知道,算力将在未来改变哪些场景,最简单的方法就是直接看Omniverse的业务线。
比如这次2025GTC DC披露的重头戏自动驾驶业务,背后是Omniverse为主导的团队。
英伟达宣布将要在2027年前部署超过10万台自动驾驶车队,部署NVIDIA DRIVE AGX Hyperion 10自动驾驶平台。这是除了特斯拉以外,目前最庞大的部署计划。
在L4期间,AI-RAN似乎不那么重要,但是L5几乎必须要6G以上的AI-RAN网络支持。
因为L5意味着无方向盘的无人驾驶,要在所有路况、所有时间都能够稳定运行,而如此庞大的车流网络就必须要边缘算力支持、配合高精地图的全局规划能力。
L5自动驾驶对于AI-RAN是堪称教科书级别的场景,因为它满足了AI-RAN背后三个场景强烈的需求:
超高的低时延要求、端侧难以承载的算力要求、类似“群体智能”一般的AI算力调度能力。
马斯克在近期接受采访时,有个“大胆”的预言。他说:
“未来不会有操作系统,不会有APP,你的手机只是显示像素和发出声音,它预测你最想看到和听到什么,然后实时生成,我们会尽可能地将AI集成到这个设备中……不会再有传统意义上的手机了,我们所谓的手机,实际上是一个用于AI推理的边缘节点,配备一些无线电模块进行连接。”
而服务器端的AI会与用户设备(以前被称为手机)上的AI进行通信,并生成用户想要的任何实时视频。
马斯克观点的本质,其实是AI-RAN能力和大模型能力叠加,将取代所有的终端算力。这算是最激进的一种AI-RAN的愿景,如果这个愿景实现,那么AI-RAN就是宇宙级的大生意。但许多研究机构都认同,在6G时代“云电脑”、“云手机”会从小众走向大众。而其中的“云”很可能就是AI-RAN能力加持的“边缘云”。人们不再需要花昂贵的价格占有设备,只需要在有高算力需求的时候租用即可。
不过我们如果回到现实,有两个场景是相对近在眼前的:
一个是机器人与XR设备。
目前所有的机器人都面临“端侧”对话太智障,但是“云”对话缓慢且昂贵的体验困境。智能眼镜厂商,面临的则是大算力芯片做不进小眼镜,小设备撑不起长续航的困境。但未来AI-RAN可能会成为潜在的解决方案。
一个是“元宇宙”级别的数字孪生场景。
无论是消费级的游戏应用,还是工业、手术台、能源、国防,都可以做场景的延展。
今年3月,NVIDIA出过一个数字孪生平台,正是叫Aerial Omniverse Digital Twin(AODT)。官方说,它可以实现从单个塔到城市规模的完整6G系统进行物理级准确的模拟。
读到这里,我猜你其实已经想到了AI-RAN的终局。
一个由边缘计算节点组建的超级计算机,一个地球ONLINE的超级服务器,一个AI打破世界的所有链接壁垒、又模糊掉所有边界的线上线下同构的世界。
当然,地球ONLINE还很遥远。但在此之前,你可能需要最后知道,AI-RAN可能还将改变两件事情:
一件是好的。云服务器厂商的格局可能会变化,“边缘云”会从小众需求变成一件主流的超大生意,而通信服务商则可能会天然成为新的云服务商。下一个AWS,可能未必出自亚马逊。
一件是坏的。如果你打开英伟达Aeiral页面,你会看到一个页面,写着:主权AI基础设施。
当然,算力原本也是脱敏的信息,但如果当5G通信网络都无法实现基站生意顺畅的跨国竞争,那么在AI-RAN时代,你可能更难以想象,欧美的政客会采用其他国家的基站设备。尽管华为可能是这个世界上,唯一既有AI芯片能力,又有基站能力的厂商。
这就是6G和它的AI。
它诞生在一个复杂的世界,所以也催生世界的复杂。
"
作者:杏彩娱乐
新闻资讯 News
- AI带货频频“翻车”,谁该为消费...11-09
- 硅谷AI烧钱:债务游戏谁买单?11-09
- 解析:ChatGPT 成跨境电商新...11-09
- 奶皮子糖葫芦价翻10倍:网红美食...11-09

