成维忠:拥抱生成式AI,拥抱大模型

2023/06/29


    我是北京中科深智的创始人成维忠,中科深智是国内在虚拟人和数字人技术方面最领先的公司,我们做了7年,做了全栈式地虚拟人、数字人技术,大家听起来可能比较陌生,可以简单把它理解成是虚拟世界的机器人。这个技术会是未来的,下一代互联网,或者元宇宙的支撑性的技术,因为我们要完成人机交互不再会像过去一样,在虚拟的世界当中操控各种各样的图形界面、各种各样的图标,大体上是人和虚拟人之间的交互。


    同时我也跟大家分享一个观点,我觉得目前整个数字化浪潮已经进入了新的时代,在过去我们讲大数据是指数据的挖掘和数据的使用。但是从今年开始已经进入到数据生成的时代,生成的数据是方方面面的,现在大家看到文字生成文字、文字生成图片,将来也会有视频,甚至将来可以生成各种各样的业务数据,这个是一个特别大的突破。

现在ChatGPT火了,所有公司都要思考在这个浪潮中我们到底要采取什么样的策略,到底要不要做这些大模型,我们在使用的时候到底怎么使用,到底会遇到什么样的问题。


    现在美国的大模型生态和中国差得比较远,美国大家看到的就是OpenAI、谷歌、META几家公司做自己的商用大模型,还有公司共了做开源的大模型,咱们国家特别多,前段时间有一个组织统计超过100亿参数的大模型国内有78个,但这也让我们思考,有没有必要这么多的公司做大模型,大模型接下来的发展从技术角度、应用角度到底怎么回事


    首先对大模型要做目标的定位,我们作为一个企业做大模型的初心和出发点是什么,OpenAI和谷歌、META都讲要做通用的AI。国内的大厂明确讲通用AI的公司在减少,这就证明这个目标难以完成。当前的状态是国内在生成文字纯语言的大模型正快速追赶,但是在多模态的大模型方面跟国外差距还比较大。也就是说,在未来通向通用AI的路上我们跟国外比是有差距的。前段时间有专家讲:全世界有三家公司做通用AI大模型就可以了,我觉得也许只有两家:中国一家,中国以外一家,就够了。


    以上是定位在通用AI角度讲的,但是从应用角度讲就复杂性高得多,最近我们跟一些保险、零售、连锁酒店的企业探讨,他们也试用了很多通用大模型发现通用大模型根本解决不了他们的需要,比如他们提出了一些问题,在实际业务中并不需要大模型到底回答问题的多样性,而是在意多长时间可以把问题准确地回答出来,交互的即时性和准确性要求非常高。一旦回答错以后会产生非常多的责任,这些通过调用通用大模型的API是解决不了的。


    在这个过程中,中国、美国两个生态不一样但趋势是一样的,在比较深度的企业服务中,调用通用大模型的API是解决不了问题的,这里面中国和美国不一样的是美国的企业现在走的路是在开源大模型基础上训练行业和企业所需要的垂直模型,这在国内生态是没有的,国内开源环境很差,所以国内出现很多大大小小的大模型是有道理的,这些企业未来就会为千千万万不是这个领域的企业做赋能。


     回到中科深智,我们当时用海外大模型做了测试,响应的时间基本8-10秒,在人机交互的时候8-10秒是灾难性的,这就是为什么ChatGPT APP出来以后只有支撑声音也没有做虚拟形象,因为他家对于文字和声音的延时没有太多感知,但虚拟人感知就非常强烈。还有很多的客户提出做私有化定制和私有化部署,甚至有的公司希望帮助训练专用的大模型。基于这样的需求,5月10日我们发了自己的大语言模型。


    我们是初创公司,做大模型本质上就是工程,花销很大,高峰时期也使用了2000张A100的显卡。站在通用AI的角度很难,但站在使用的角度来讲没有太多技术难点,所以我认为大模型发展的开源环境会越来越好,会有大量企业使用大模型做自己的大模型。所以我呼吁一定要拥抱生成式AI,拥抱大模型。


关闭