文章来源:锌产业
作者:山竹
图片来源:由无界AI生成春节期间,OpenAI又悄悄投出了一颗深水炸弹——Sora。
也就是文生视频的AI模型,相较于此前的Pika、Runway,Sora生成的60秒视频更流畅,也更逼真。
看过Sora的周鸿祎当天就表示,Sora意味着AGI(通用人工智能)实现将从10年缩短到两三年。
AGI在两三年内能走多远,现在其实还难有断言,但AGI注定依然是2024的风口,甚至来得要比2023更凶猛。
不过,关于AGI,学术界其实还有另一条截然不同的路线,一条不同于如今呼声持续高涨的大模型的技术路线。
北京大学朱松纯教授是这条技术路线的代表人物之一。
他认为,大模型不是通往AGI的终极路线,由价值驱动,能够自主定义任务、能够完成无限任务的AI模型才是。
他认为,要实现AGI,我们还有很长的路要走。
01、李约瑟之问
2010年8月,在这一年的奇点峰会上,一位三十多岁英俊小伙题为《建立AGI的系统神经学方法》的演讲这届大会见证了一个历史时刻。
这位来自英国的小伙名为Demis Hassabis,他13岁就成为国际象棋大师级棋手,17岁参与编写了拿下百万销量的《Theme Park》游戏,这也成为他后来创立游戏公司Elixir Studios的起点。
不过,这些都只不过是这个天才少年的起点,他之后最为人熟知的头衔其实是DeepMind创始人、人工智能科学家,同时也是英国政府的人工智能顾问。
就在意气风发地在奇点峰会发表关于AGI演讲的这一年,Hassabis创立了DeepMind,并将研发通用人工智能作为终极目标。
后来关于Hassabis和DeepMind的故事已经是人尽皆知。
由于研究经费的压力,DeepMind最终被迫在2014年卖身谷歌,并在两年后以下围棋的AlphaGo再次震惊世界。
也是在AlphaGo一战成名之时,后来先于DeepMind搞出生成式AI、掀翻AGI牌桌的OpenAI悄然成立。
不过,这些事关人工智能的前沿技术突破,依旧是发生在大洋彼岸,说起来多少有些让人唏嘘。
实际上,早在上个世纪,Hassabis的“同乡”学者李约瑟就曾在编著的《中国科学技术史》中提出过一个疑问——为什么工业革命没有发生在中国?
这就是著名的“李约瑟之问”(李约瑟难题)。
在这之后,我国科学泰斗钱学森在2005年又提出了另一个问题——为什么我们的学校总是培养不出杰出人才?
史称“钱学森之问”。
这两大难题,也是一直以来困扰我国科技创新发展的根本难题。
如今,在被视为第四次工业革命的“智能时代”(前三次分别为蒸汽、电气、信息)到来时,一个新的问题再次被提出:
为什么中国没能做出AlphaGo、ChatGPT来引领智能时代,而只是迎来了百模大战?
面对这一时代难题,朱松纯在接受媒体采访时指出:
“中国科研界在过去20多年里的思路是‘从跟跑到并跑,再到领跑’,长久以来的技术跟随模式,让中国很多企业难以做原始技术创新。”
通用人工智能的原始技术创新,成了朱松纯2020年回国后的主要工作。
这其中的机会在于,朱松纯认为,大模型不是通用人工智能的终极路线,学术界已经在关注的另一条路线才是。
02、乌鸦范式和“大一统”
朱松纯有两个身份为众人熟知,一个是数学家,另一个是人工智能科学家,这两个身份都是在他师从全球著名数学家David Mumford后得来的。
而David Mumford之所以在1992年选中朱松纯做自己的研究生,是因为当时朱松纯在申请哈佛研究生的自我介绍中谈到,自己读过大卫·马尔的著作,想要探寻人工智能的“大一统”理论(也就是如今为众人熟知的通用人工智能)。
这里有两个决定朱松纯命运的“巧合”:
第一个巧合是,在入学哈佛之前,朱松纯在中科大读的是计算机专业,读到马尔那本计算机视觉领域开山之作,是在偶然加入生物系研究认知科学的实验组后;
马尔虽然学术生涯不长(堪称天妒英才了),但凭借在计算机视觉领域的超高造诣,被公认为计算神经科学创始人。
计算机视觉国际大会上评选出的最佳论文就是被授予以他的名字命名的「马尔奖」,这一奖项直到如今依然是计算机视觉领域最高荣誉之一。
朱松纯是在2003年拿到的马尔奖。
第二个巧合是,当时的David Mumford正在强制重启自己的学术生涯——将自己的研究领域从纯数学领域转向人工智能领域,通用人工智能同样是这位跨界研究者的终极研究目标之一。
就这样,朱松纯跟随David Mumford一起,开启了自己的人工智能学术研究生涯。
在之后的20年里,他不仅顺利从哈佛博士毕业,还先后在斯坦福大学、俄亥俄州立大学、洛杉矶加州大学任教,并参与到美国多个顶级人工智能研究项目中,甚至曾两次担任美国视觉、认知科学、人工智能领域跨学科合作项目MURI首席科学家。
也是在参与了这一系列前沿人工智能研究项目后,当2020年回国到北大任教并组建了北京通用人工智能研究院(简称:通研院)后,朱松纯指出:
“人工智能发展,需要进入‘小数据、大任务’的‘乌鸦’范式——用大量任务,而非大量数据来塑造智能系统。”
这是朱松纯一直以来倡导的通用人工智能技术路线,基于这条技术路线,以及他以往的学术研究思路,锌产业了解到,朱松纯在通研院筹备过程中做了两项重要工作:
第一,七大实验室设置。
由于人工智能发展的断代问题,人工智能自1980年以来分化出了多个独立发展的学科,朱松纯将人工智能涵盖的大学科总结为以下六个:
计算机视觉、自然语言处理、认知与推理、机器人学、多智能体、机器学习。
从通研院官方公开信息来看,通研院前沿研究中心下设七个实验室分别是:
通用视觉实验室、自然语言实验室、认知计算与常识推理实验室、机器人实验室、多智能体实验室、机器学习实验室、仿真与交互实验室。
七大实验室的设置刚好与人工智能分化出的几大学科对应,这使得通研院的人工智能研究不局限于计算机视觉、自然语言处理。
而这,也正是朱松纯希望推行的从跨学科研究到“大一统”的通用人工智能研究体系。
第二,UV双系统理论的贯彻。
在“小数据、大任务”范式中,UV双系统是关键。
这其中,U是指包含客观物理定律和社会规范的各种势能函数的总和,V是指基于马斯洛需求理论构建起的价值函数。
这样的UV双系统贯穿朱松纯关于通用人工智能的整个研究体系,既包括通用智能体的评级标准、人工智能评测方法,也包括通用人工智能训练平台的构建。
当然,最生动形象的,还是节前在通研院成果展上展出的一个名为“通通”的小女孩。
03、人工智能的马斯洛启示
1943年,在纽约市立大学布鲁克林学院任教的马斯洛在《心理学评论》期刊上发表了一篇题为《人类动机理论》的文章,在这篇文章中,马斯洛对外提出了奠定他在心理学领域地位的「需求层次理论」。
这一理论又被称为「马斯洛需求层次理论」。
朱松纯认为,通用人工智能应该具备在复杂动态环境中能够完成无限任务、自主定义任务,且由价值驱动这三大特征。
其中,朱松纯提到的由价值驱动,是指人类在进化过程中受到环境、生物属性、激素等方面共同影响进化而来的价值体系总和,这也被马斯洛归纳为需求层次理论。
“通通”就是这样一个基于UV双系统、由价值驱动的小女孩。
从成果展上的演示来看,“通通”是一个生活在虚拟世界里的小女孩,有点像电影《流浪地球2》里的丫丫。
在官方说法中,这是一个拥有类人价值观,能自主生成任务、定义任务,并可以通过自主学习和人类教学持续成长的通用智能体。
在演示过程中,通过调节V系统中的几个价值参数,“通通”对于环境的敏感度会有所不同,根据不同的敏感度又会自主整理房间。
通过语音交互,工作人员可以与“通通”进行互动,例如向她提问“冰箱里有什么食物”时,她会打开冰箱观察后给出答案。
当让“通通”在桌面上摆出一个她不认识的英文字母时,戴上VR眼镜的工作人员可以在黑板上写出这个字母,通过示教方式,让“通通”学会这样的知识。
不过,“通通”目前的智力水平还只相当于3-4岁儿童的智力,基于这套理论要想做到堪比成年人智力水平的通用智能体,还有很长的路要走。
与现在通过暴力美学实现的大模型相比,这样的通用智能体虽稍显稚嫩,但却有着不可忽视的独特之处——自主生成任务、具备物理和社会常识、由价值驱动,以及可解释性。
而这些,也正是当下通过大模型实现的生成式AI所不具备的。
更重要的是,这也是一条不同于“跟跑”带来的“百模大战”的另一条有望通过原始技术创新,实现中国人工智能技术突破的路径。
04、穿越AGI周期
2月16日,就在我返京途中,朋友圈已经被OpenAI发布的Sora刷屏。
这几天,无论是各大媒体、KOL,还是贾扬清、谢赛宁、周鸿祎、马斯克这些学术界和产业界颇具影响力的人物,都一致认为,这是人工智能的又一次飞跃。
就科学技术发展本身而言,技术驱动的科技革命其实是一个从学术成果向产业成果转化的过程,这个过程可能需要几十年,也有可能需要上百年。
自1980年之后,以概率统计、建模学习、随机计算为基础的人工智能范式长达40多年来长足的发展,造就了2022年ChatGPT的横空出世,以及如今的AI大模型“盛世”。
这是以大模型为代表的“大数据、小任务”范式的人工智能所经历的学术成果向产业成果转化的过程,而“小数据、大任务”范式的人工智能很多问题目前依然在科研攻关阶段,未来还将有很长的路要走。
正因如此,产业上的大模型成果落地和学术上的AGI新范式持续探索的双线并行,才是更符合当下社会需要的人工智能技术发展路线。
更重要的是,“小数据、大任务”范式的通用人工智能,是绕开了“大算力、大数据、大模型”这套对基础设施有着极高要求,国内基础设施又没用足够完善的技术路线。
而在第四次工业革命来临之际,这样的技术路线,也有了些“华为”的味道。
未经允许不得转载:澳鸟-全球资讯平台 » 通往AGI的第二条路