陈宁:AI推理芯片和智能硬件是中国实现突破的关键

2025/07/21

在过去2000年的农耕时代有四大发明,它们是引领全球的科技的巅峰。在过去300年蒸汽、电力、信息化,第一台蒸汽机打破了这个发展的规律,欧美国家靠三次工业革命快速的跃居到人类科技发展、文明发展的巅峰。

到最近过去10年,以人工智能为代表的第四次工业革命,尤其是今年年初的DeepSeek在深度思考领域的突破,以及它的开源模式,让我们看到了希望,中国的科技发展有机会依靠人工智能的算法和芯片,抓住第四次工业革命的转折点,再一次跃居到全球科技文明发展的引领的地位。

从2022年11月30日ChatGPT的横空出世,可以说过去两年多的时间中,人工智能大模型成为最高频的词汇。2022年之前,人类的科技的突破性的发展是以3~5年为周期,但是在过去两年,周期快速被压缩到了三个月的时间,模型版本的不断的迭代:大语言模型、多模态大模型、脑机接口、韧性机器人等等这些科技和随着AI版本的迭代、科技的发展,让我们目不暇接。

但是在这个快速发展的事件背后有一个规律。2022年,代表着AI的训练达到了顶峰。在过去三年的时间中,英伟达GPU训练卡一卡难求,甚至可以和黄金的价值相媲美。但是随着去年open AI O3的版本深度思考的能力,以及今年年初DeepSeek的开源。我们看到了一个趋势,2025年AI正在由训练学习的时代进入到推理和应用的时代。这是今年的一个转折点。

AI的训练就像是发电,而AI的推理和应用就是如何把电用好,以1879年为分界岭,之前我们要研究怎么造电厂、怎么发交流电、直流电,但是1879年当爱迪生对灯泡进行改良之后,我们需要研究建立商业化的输电网络,把电送到千家万户,让大家用起来,才带动了整个电力时代的第二次的工业革命。人工智能也处于这样的转折点,这也是过去半年最高频的词汇是“Agent”的原因,我们如何用过去十几年训练的各类的AI算法和大模型去赋能各行各业和消费者,只有靠Agent、MCP、AToA等等最新技术的发展。

要想用好AI、用好Token,我们需要多模态的大模型,提供更加自然的人机交互的全新方式。我们需要引入慢思考,更多的推理,让AI的模型和Agent更加聪明。我们也需要多个智能体的综合,能够让它解决更多的实际的行业的问题。

所以在AI应用大爆发的过程中,模型也变得更加复杂,需要更多的慢思考的推理能力。用户数量的激增,应用的爆发,模型推理能力的不断加强,都会带动AI推理芯片的需求的大爆发,甚至未来超越AI的训练芯片。

而在当前的国际局势下,基于国产工艺的AI推理芯片更成为市场的刚需。AI的推理芯片有云、边、端三个计算节点,甚至在终端芯片中还有手持终端和可穿戴设备两类细分的计算节点。所以,未来任何的AI Agent都是云、边、端推理任务分配的综合的解决方案,在云端一样是大算力的推理,并且突破国产工艺的限制,在边缘端,未来每一个人的家庭和办公室,都会有几十T和上百T的推理算力。未来在我们的智能手机、AIPC中都会有推理芯片,这三个计算节点紧密结合,帮助AI去重新定义我们的电子产品。未来从智能耳机、AI眼镜、可穿戴设备,到手持的AI手机、AI PC、AI IPad,再到身边的扫地机器人,到云端的大数据中心、智算中心,边缘的计算中心,甚至每一个企业的IT架构都会发生颠覆性的变化。所以,AI的推理芯片会无处不在,我们走到任何一个角落都可以像今天接入Wi-Fi和4G信号一样,无处不在的去接入AI的Token。

云天励飞2023年登入了科创板,正在打造中国的推理芯片的领军企业。经过11年的时间,2014年我们从美国回到深圳,创立了云天励飞,11年的时间我们打造了5代神经网络处理器的商用化产品。从2011年把最早的神经网络处理器NPO概念带到中国,面向深度学习,面向CNN、RNN到Transformer,到强化学习各类的AI算法,去定制一套高效的指令集。从2020年开始,我们全面和中芯国际战略合作,结合12、14纳米的国产工艺去设计处理器芯片的架构,目的就是为了结合AI的小模型、大模型、Agent各类的底层全新的计算范式去设计一套指令集、处理器的微架构和整个芯片的工艺架构、存算一体的架构,去解决高效的、高性价比的AI推理任务。从最早的人脸识别、视觉识别,到Transformer大语言模型的推理,到视频生成的多模态大模型的推理,我们经历了这样5代的商用的神经网络处理器的研发工作。
 
尤其刚才提到,2020年开始,随着国际环境的不断变化,我们全面和中芯国际合作,基于12、14纳米的国产工艺联合开发了“算力积木”这样一个创新的架构,对于国产工艺来说,很难在一颗芯片上实现300亿以上的晶体管的密度,我们在国产工艺之上,实现一颗相对小算力的芯片,把多颗小算力的芯片封装到一颗更大的芯片当中去是更大规模的算力部署,像搭积木一样实现算力的堆叠。进一步我们可以把内存和整个算力的晶圆级进行封装,突破HBM对先进工艺的限制,去实现从云端到边缘的对于大算力、大带宽的国产工艺的突破和需求。
 
11年的时间,我们沉淀了从AI推理芯片的神经网络处理器IP,到视觉语义大模型的沉淀,到软件面向各类场景的推理的灵活适配软件,再到算法芯片化、定制化设计的能力平台。

在ICOC芯片面向三大类应用场景---物联网,目前物联网AI推理芯片已经进入到中国头部硬件大厂,提供物联网视频的高密分析、家庭边缘智算处理,再到“深穹系列”,面向大厂,大算力几百T到上千T,单颗芯片大算力推理的高效的国产工艺任务,再到“深擎”,面向未来的人形机器人,已经在几万台服务机器人体内有我们AI的芯片,也承接了国家发展改革委具身智能的AI芯片的技术攻关的任务。在设备和集群,我们有边缘计算的设备、一体机和云端,包括超节点等等计算类设备去服务互联网和各个行业。
  
除了芯片的系列产品外,我们也打造了一系列AI硬件,有面向消费类的,例如:可穿戴设备、蓝牙耳机,我们出货量占到安卓平台的中国手机品牌厂商的蓝牙耳机的35%的市场份额。

未来这些可穿戴设备所有智能硬件在3~5年都会被大模型重新定义。同时,卢卡博士内部孵化的C端创业团队,把各类大模型DeepSeek,把视觉语义“天书模型”装载在一款的儿童相机中,面向2-8岁的孩子,通过大模型进行启蒙教育,为人工智能时代去培养有定义问题能力的创新一代,在今年六一儿童节也冲到抖音和京东热卖榜儿童类产品的第一名。

相信在人工智能的快速发展过程当中,在第四次工业革命开启的时间,AI的推理芯片和AI的智能硬件是中国去抓住人工智能、抓住第四次工业革命第一张入场券差异化的机会,在未来3~5年的时间,我们相信人工智能的IPhone和人工智能推理时代的英伟达,有机会出现在中国。


关闭