对话物灵科技顾嘉唯:灵性,是能让人工智能透出光的缝隙

2022/04/24



亚布力论坛:从依托大公司平台、成熟体系做研发到自己创业,同样都是探索人工智能技术,你如何看待这两段经历? 


顾嘉唯:我在微软研究院工作时,技术时间线认定为5—10年。也就是说,我们研究的是5年以后的技术,离真正的大规模商用是非常远的。随后,我到百度成立了深度学习实验室,那时我们界定的时间周期是18个月到5年。而大量工程类的科技公司或互联网公司会界定另外一个维度——18个月,大家要在这个时间段内去创造出好的商业化产品,使用户、营收规模和公司体量得到增长。


现在来看,十年过去了,早期在实验室研究的很多技术依旧很前沿。例如,我们曾通过控制排布在触摸屏周围隐藏线圈下方的陶瓷电片,让手指在触摸屏上摸不同的屏幕XY轴上的坐标位置时,在轴心Z轴纵向形成振动。进而,指尖的肌肤在平板电脑的玻璃表面上可以感受到按键的反馈,形成肌肉记忆,甚至互联网图片对应的材质和肌理也能通过触摸屏的触觉模拟摸出来。目前,这项触觉交互技术被称为Haptics,虽然还未完全应用到产品上,但它的潜力会逐渐放大。在未来的10—20年时间内,手机可能会被新的数字终端颠覆掉,我们叫做meta device(元宇宙设备)。在虚拟和现实结合的过程中,需要有很多触觉和感知,这项技术很有可能在那时蓬勃发展。 


所以,一个平台如果能迭代很长周期去做技术储备难能可贵。过去十年,我所在的微软研究院和百度深度学习实验室就始终在潜心探索,引领科技前沿,可以说“敢为天下先”。但对于创业公司来说,在商业落地过程中尽快争取到项目更为重要,毕竟要先活下来。


亚布力论坛:在人工智能领域,不论是从事研究还是商业,人们都在追寻前沿。你认为,“前瞻性”在这一领域意味着什么?


顾嘉唯:它就像硬币的两面。


一面要从科技创新的角度看。我认为,科技发展是推动人类发展最重要的一个因素。在任何科技发展领域,都需要有一波人不断地精进技术的边界,甚至跳出圈子去观望。从这个角度看,确实需要前瞻性和颠覆性。


另一面则与“敢为天下先”恰恰相反,我很喜欢企业家段永平说过的一句话,“敢为天下后,后中争先”。 


科技创新可能是一些公司或组织在某一阶段需要去承担的责任和义务,但拥有前沿性或引领性的技术,不代表最终就能取得商业上的成功。例如,苹果的iPhone不是世界上第一款智能手机,特斯拉的汽车也不是世界上第一辆电动汽车。在它们获得瞩目之前,其实已经有很多的科技企业和先锋者探索过相关技术了,这些探索的经验成为巨人的肩膀,让后来者可以“后中争先”。


我在微软研究院时的导师比尔·巴克斯顿(Bill Buxton)曾讲过,触摸屏技术并非是2006年智能手机iPhone发布后才有的技术,而是他在1985年发明的专利,当时这项专利应用于一个多媒体乐器产品。所以,一个成熟的好产品一定不是把一个最新的技术硬生生地塞到用户手上,而是先理解用户需求,甚至应用十多年前的技术,通过对技术的理解,把握能创造出好产品的节点。获取商业成功最关键的因素就是,在对的时间用合适的技术创造引领优势的产品。


亚布力论坛:今天,人工智能技术的边界不可控,用户对它的期待越来越高。你之前也说过,好的产品是要把用户的预期和他的体验拉平,具体应该怎么做?


顾嘉唯:其实令人尖叫的好产品必然要超预期,但这很难。我说的“超”是恰当地“超”,过往很多不好的产品就容易让用户的预期很高,但产品体验感很差。今天做AI产品最难的一点就在于,大众通过相关的电影、电视剧、科幻小说对AI产生了认知和预期,但目前的技术还在弱人工智能阶段,还很难完成电影里呈现的效果,这就容易导致用户预期高于产品体验。所以,为什么我们要强调追平,因为能做到追平就很难了。 


首先,我们要在技术边界找到一个可控的稳定场景,确保技术产品交付给用户场景后,完成好全链路的相关服务。例如,由于计算机视觉技术比语音交互技术还要成熟,我们就充分利用这点,在2017年发布的Luka系列产品上,率先开创了“无屏触控AI机器人”技术,让孩子的阅读从屏幕回归纸质书。我们用AI泛机器人技术升级了传统的点读笔、早教机、学习机,用户通过这款产品可以和任何一本书实现“翻到哪里讲哪里,哪里不会指哪里”的互动。


其次,利用灵性的人机交互体验,把用户预期和产品技术调到一个协调的状态。用情感计算、示弱的方法让用户知道,原来这个产品不一定是样样精通的智者,它可能只是一个小萌宠的智商,需要去建立沟通甚至是去呵护。对于儿童这类目标用户而言,这正好符合他们这一成长阶段的需求。


亚布力论坛:如何理解你提出的“从‘万物智能’到‘万物有灵’”这一理念? 


顾嘉唯:“物灵科技”的品牌理念来自于“万物有灵、人机共生”的哲学思想,致力于在人机共生的世界里,用AI科技产品提高人类生活品质,提升幸福感,用科技让生活更美好。我当时定义这个理念,是希望把消费电子产品升级到下一波,变得更有灵性,每一个终端都是一个有自主决策、有思考的机器人。


首先,我们要让产品能够根据对用户习惯积累的理解力,做到提前预判,这是灵性的重要体现,它一定要更懂你、更贴心。


其次,它有情感计算。也就是说,除了IQ,它还需要有EQ,不止要像一个助手,还要懂得示弱。它不会一味地以绝对聪明的姿态回答所有问题,有可能中间还会插科打诨。例如,你用智能音箱点外卖,次数多了后,它可能就不会去直接执行,而是提醒你总点外卖不健康,或者给你推荐其它食物。只有这样,用户才有可能和产品形成更高一层的信任认知,并逐渐建立起情感纽带,因为信任是一切的基础。


用万物有灵的视角看待科技,用点物赋灵的精神塑造产品,是想向大家传达出,生命感、灵性的感受其实是可以被机器产品表达的。未来的AI科技产品会跟人的关系越来越近,它可以产生温度感和角色感,而不应该只是冷冰冰的工具机器。我始终相信万物皆有缝隙,“灵性”就是人工智能那道缝隙。


亚布力论坛:你主张让机器人更具灵性,但网上有争议认为,AI不断拟人化会面临人工智能应用中的安全、隐私和伦理挑战。


顾嘉唯:首先,我们需要重新解读一下这个问题。


第一,我曾经在学术圈提出一个词叫“关系式AI智能交互技术”。我认为接下来这段时间的智能产品(在智能时代来临)与上一个阶段互联网时代最大的区别在于,上一个阶段(互联网)是信息流,下一个阶段(智联网,或者说元宇宙)是关系流。也就是说,我们会跟机器和虚拟融合的世界会发生关系性的迁移与转化。 


而关系的维度是多样的,人类可以和同伴、动物、植物都产生互动关系,所以拟人不是唯一的可能性,或者说所谓的拟人也不一定要变成什么问题都会掌握的智者。我们会逐渐面对一个过程,即物在人化的同时,人也在物化。


第二,我认为不能一概而论。世界的底层本质逻辑分为两类。一是能量体系,包括蒸汽机、内燃机、电动车机器人等。能量层本质是原子世界的交互,扫地机器人就属于这个路径,它和灰尘在物理空间上打交道。二是信息体系,包括(移动)互联网和metaverse元宇宙。手机、智能音箱,未来的meta device都在这个范畴。这两种体系下的产品是不一样的类型,所以它们的灵性和智能,需要不一样的定义。


第三,说到隐私安全,这确实潜藏着很大的挑战。坦诚说,如果我们把微软小冰、苹果siri黑暗化后会很危险,因为它很有可能去操控人的意志。科技发展的进程中这样的矛盾和挑战不可避免。Facebook在美国是倍受质疑的一家公司,十几年前,微软也受到过很多质疑。在这样的背景下,科技公司要做好自己该做的事,同时在体系内要用道德和伦理做一些限定。


亚布力论坛:从移动互联网的信息流交互到下一个阶段万物智能的关系式AI交互,它带来的最大变化会是什么?


顾嘉唯:我们先看一下苹果和微软这两家公司。苹果最牛的地方在于跨时代,它从PC时代走到了Internet时代,又走到mobile时代,甚至mobile时代由它开创。微软在PC时代是霸主,但它错过了mobile时代,可它又重新抓住了AI时代、云计算时代。


为什么我提这件事情?因为我认为人机交互的每一次革命性创新,都会带来一个巨大的范式转移。科技公司如果能追得上,就一定会迎来很大的机会,伟大公司也会在这个时间窗口期出现。


同时,在这个交互的变革当中,人的信息密度变得更高了,人被信息服务包围了。例如,在PC时代我们还需要去学习打字和电脑命令,而智能时代实现关系式交互后,机器会越来越懂你,你不需要花时间主动去学去适应,机器会反过来迎合和帮助你主动解决问题。


亚布力论坛:在关系式交互中,我们会面临什么痛点?


顾嘉唯:我所说的关系式AI智能交互技术,正在不断随着算法技术的大规模应用成为日常的互联网产品形态。现在有一种符合关系式AI交互的很初期的产品形态,比如像抖音、淘宝等平台针对性地推送你喜欢和关注的内容。它本质上就是一种关系,但还是以信息流的交互方式呈现,所以达到关系式AI智能交互还需要有一个过渡过程。


我们在理解关系式AI交互的同时,要意识到一个问题:你是否真正愿意把个人信息交出去?有时我们和朋友聊天提到某种物品时,手机随后就会推送相关广告。这种情况很常见,但有些人不太在意,因为人们被信息推荐提供的价值和便利性给满足了。但未来,当需要不断泄露更多个人信息来换取便捷服务时,我们是否需要在意它?这是一个开放式的问题。所以,痛点在于,关系式AI智能迎来的挑战和问题究竟会不会很严重。这在今天还没有被更多的人敏感地捕捉到和意识到,但我相信接下来这个问题会被解决。纵观历史,科技无论在哪个阶段在为全人类创造价值和财富的同时,总是会伴随着不同的声音。


亚布力论坛:你认为,目前人工智能技术是否已经在商业上真正落地成熟?


顾嘉唯:我理解的人工智能,本质上不是一个行业。我认为,互联网创造的最大价值是数据。在互联网基础建设之上,AI就像更先进、更高效的采矿石工具。对于数据的开采,“关系式AI智能”逐步形成价值网的更迭,以前人们用铲子去铲,但现在拥有了一台挖掘机,甚至是可以用核电驱动的开采工厂。


互联网是个行业吗?它其实是一个赋能性的行业生产力工具,只是随着科技一点点发展,它逐渐下沉为数据开采的基础设施。就像在互联网早期,有人会界定搜狐、Google是互联网公司,但现在谁不是互联网公司?同理,我认为再过5年或10年,大家就不会叫一个公司为AI公司了,未来大家都会应用人工智能,它只是能更高效利用数据的一个先进技术。



(顾嘉唯  物灵科技创始人兼CEO)