我叫彭雷,拥有20年互联网行业的连续创业经验。我们这一代互联网创业者,在过去20年里赶上了中国最好的创业时代,如今,我们正处于以硬科技在中美科技竞争前线展现中国创新能力的时代。接下来,我将通过以下分享,解答大脑和人工智能的关系。
我认为,大脑和人工智能本质上是一个硬币的两面。去年诺贝尔物理学奖获得者,被誉为“人工智能之父”的Geoffrey Hinton与和他齐名的“人工智能之母”李飞飞都曾表示,人工智能的发展在很大程度上受到神经科学和脑科学的启发。若没有几十年前对神经元基本生理结构的研究,就不会发现脉冲神经网络,也无法延伸出后续一系列人工智能的尝试和算法。尽管这些算法运行于冯•诺依曼架构之上,但其基本原理皆源自对大脑和神经元的研究。
然而,在过去20年甚至10年里,很多人疑惑为什么人工智能和神经科学的发展速度无法相提并论。其实这很正常,人工智能的发展受制于硅基芯片和算力的提升,而神经科学研究最大的限制是伦理问题。比如,人类不能大规模进行人体实验和动物实验,所有基础科学研究都必须符合医学伦理和患者受益的原则,所以它的迭代速度较慢。但我相信,随着对大脑的深入研究,未来一定会再次反向启发人工智能并取得新的突破。
那么,我们手机里使用的芯片或用于推理的B200芯片,和大脑究竟有什么关系?
从数量级来看,一个GPU芯片的晶体管数量大概能达到10^11个,同样,人的大脑神经元细胞数量大概也在10^11个左右,即800-1000亿个神经元。但神经元与神经元之间的连接,和晶体管与晶体管之间的连接存在数量级的差别。晶体管之间的连接可能是个位数,而神经元之间的连接可以达到10^4个。
从能耗角度来看,大家坐在这里参加会议,每个人的大脑能耗仅25瓦。可以说,早上吃一个馒头就能让大家保持一天高效工作,但GPU不行,它与大脑的能耗差距巨大。
从存储方式来看,也存在巨大差别。现在的冯•诺依曼架构是存算分离的,计算有专门的计算单元,存储有专门的存储单元。而我们的大脑是存算一体的,简单来说,800亿个神经元同时进行计算和存储。
另外,还有一个很重要的区别。在过去的架构中,硬件和软件可以分离,同一套软件可以在这个CPU上运行,也可以在那个CPU上运行。但大脑只能存在于当前这个个体中,无法复制到另一个生物体上。这是神经科学和大脑与AI在工作方式上的本质区别。
很多人问我,脑机接口对人类的研究是否能证明大脑的复杂性已经可以被硅基模拟?从数量级来看,我认为至少还差10的6次方到9次方的复杂程度。这不仅体现在突触的连接数量上,更关键的是神经可塑性这一因素。什么是神经可塑性?就是神经元之间的连接可以动态变化,而芯片里的连接一旦写入就无法更改。
在AI领域,无论是早期用于图像识别的AI算法,还是最近五年的大语言模型,包括基于Transformer架构的注意力机制,其中很多研究理论都来自于对人脑的研究。注意力机制就是神经科学中的一个概念,我们的大脑每天接收大量信息,但只有我们真正关注的信息才能被处理,很多进入不了我们注意力的信息是无法被处理的,这是一个最简单的逻辑。
接下来详细介绍一下大脑。大脑是人类最重要、最脆弱的器官,它其实就是800亿个神经元在做放电活动。人的感知、认知、情绪和触觉等各方面的感知和知觉,本质上都是电信号,并没有想象中那么复杂。当然,其中可能涉及到一些神经递质的化学信号,但大多数人认为还是电信号主导了人的所有高级能力。
大脑功能区的划分情况是:前额叶负责处理复杂决策,枕叶负责视觉,顶部运动区负责手臂及主要肌肉的控制,颞叶负责语言处理,包括语音和语义处理。神经元在不同区域的放电活动决定了人的所有表现。而脑机接口就是要打开大脑,直接采集这些神经元放电的信号。
我们可以理解为,大脑是一个经过上千万年进化、被训练好的“黑盒子芯片”,我们只能插入几个电极,尝试反向解释大脑是如何工作的。
脑机接口是一个典型的交叉学科,涉及微电子、医疗器械、芯片、材料、算法、机器人、医学、伦理、神经科学和心理学等多个领域,是一个综合性很强的交叉学科。我们希望解决的最大问题是:如何最大限度地利用大脑,同时尽可能减少对大脑的损伤,这是我们在所有设计过程中都要考虑的问题。
脑机接口按照信号采集位置可以分为侵入式与非侵入式两大类。当信号采集位置处于大脑颅骨外侧、头皮表层,通过连接头皮脑电信号,且信号采集过程隔着皮肤完成时,为非侵入式脑机接口信号采集方法;掀开皮肤,去除颅骨后会露出硬脑膜,它是介于脑组织和骨头之间的保护结构,其内部容纳着脑脊液。将信号采集装置置于硬脑膜表面进行信号采集,为半侵入式脑机接口信号采集方法;掀掉硬脑膜,将信号采集装置直接接触到神经元(大脑皮层),为侵入式脑机接口信号采集方法。神经元放电,通过插入的电极接收信号,再将信号传到外面进行解码,从而控制智能设备,这就是脑机接口的整体原理。它的复杂度在于,我们要将非常细的东西插入大脑皮层,还不能损坏它,或者说尽可能减少损伤,因为插入动作本身就会对组织造成一定伤害。
目前全球范围内脑机接口主要有三个技术路线:第一,硅基硬质电极系统。一个硅盘上面有100根硬针,它们直接插到大脑组织表面,形成100个通道。每根针可以记录1 - 2个神经元的信号,所以100根针能记录两三百个神经元信号,这是美国最早开展了20年的脑机接口技术,历史上一共植入了45个人。第二,血管电极系统。通过静脉血管,像在血管里放置支架一样,把电极放进去,隔着血管壁采集脑信号,这种方式比较微创。第三,柔性电极系统。可同时三维记录1024通道。采用这种方式,某技术植入了50个人,另一技术植入了10个人,马斯克的Neuralink植入了7个人数。
提到马斯克,我想说,我一路创业都受到马斯克的启发,这也是为什么2021年我从阿里出来后创办了脑虎科技。我认为马斯克每一次都走在时代前列,无论是做SpaceX,还是做特斯拉。2016年,他又开始做Neuralink,到如今十年时间,他投入了十几亿美金,这是非常具有前瞻性的行为。Neuralink第一个植入脑机接口的患者是在潜水事故中遭遇脊髓损伤后瘫痪的诺兰,他只需要通过大脑来控制鼠标,完成速度是正常人的80%。有了这个能力后他可以玩游戏、做一定的工作。据了解,诺兰后来在Twitter上转行做网红,开始了直播带货。
脑虎科技在国内脑机接口领域也取得了两个重要进展,实现了中国第一例运动解码和语言解码。例如,我们给华三医院一名19岁的癫痫患者植入我们的脑机接口,实现了运动控制,包括游戏控制和语言解码,中文解码速度能达到每分钟三四十个字。让一个不能说话的人以每分钟40字的速度“说话”,让一个不能控制手机的人以正常人60%的速度控制鼠标,这就是脑机接口目前做到的进展。
虽然在全球范围内,马斯克的Neuralink领先我们两三年的时间,但中国的几家侵入式脑机接口公司也在快马加鞭地追赶。
最后,讲一下未来五年,脑机接口的四大发展趋势:第一,运动恢复。人类大脑和脊髓相连,高位截瘫往往是由于脊髓断裂导致的。未来,可以在患者头部安装脑机接口,在背部安装髓机接口,让瘫痪的人重新站起来。第二,视觉重建。可通过直接刺激盲人大脑,让他们在黑暗的空间里看到白色闪点,再将这些闪点组合起来,就像构建了一个显示器。当刺激通道达到60个、600个乃至2000个时,他们能看到的图像也会越来越清晰。第三,记忆假体。通过对海马体进行刺激和调控,有可能增强人类记忆能力,甚至可能逆转阿尔茨海默病的症状,甚至有望实现记忆“外挂”这类功能。第四,具身智能。AI如果不与具身智能结合,就无法产生意识。从神经科学的角度看,人类意识源于大脑与客观世界的互动反馈。如果大脑缺乏互动则无反馈,自然无意识。当前AI主要通过文字输入和文字输出接触世界,方式过于单一。只有借助具身智能,赋予AI感觉、知觉,使其能和物理世界互动,经历碰撞、摔倒 奖励惩罚等真实互动,多模态的交互才能更好感知世界,才有可能涌现真正的意识。
我相信,就像《奇点》这本书所预测的,在未来2035-2045年,人类会走进碳基和硅基的融合。我也希望这一代中国硬科技的创业者,能够推动这件事早一天到来。