来自 科技 2023-08-24 12:36 的文章

归去来兮辞作于陶渊明 从感知到认知,“知识方程”能否通向强人工智能

人工智能(AI)大模型的诞生,让2023年成为人类历史上一个重要年份——通用人工智能元年。这意味着以智能革命为代表的第四次工业革命已然到来,人类站到了智能时代的门槛上。

人类所经历的前三次工业革命,都令人类文明实现了新的飞跃,也对世界格局产生了深远影响。长远来看,人工智能在很多方面的智慧能力将可能超过人类,但目前通用人工智能还需迈过多道门槛,才能真正实现强人工智能。

日前,中国科学技术大学知识计算实验室提出了新的知识模型“知识方程”,并以此为基础建立新型专家系统,通过与深度学习的结合,尝试突破现有通用人工智能的技术瓶颈。

人工智能(AI)诞生至今只有短短60多年,但其发展经历了几度跌宕起伏。近年来,深度学习技术为AI带来了新的革命,其中包括我们熟悉的AlphaGo、ChatGPT等。

当前AI技术在很多任务上取得了超越人类的成效,包括人脸识别、语音识别、字符识别等,在机器翻译、问答和医疗诊断等领域也交出了令人相对满意的答卷。可以说,AI已经迈入能够大规模落地应用的阶段。

不过,当我们试图将人工智能再向前推进,就会发现要克服其现有缺陷,还有待技术模式的创新与突破。

当下大模型面临4个关键缺陷

OpenAI公司推出的ChatGPT是一个AI聊天机器人程序,更是一个人工智能自动生成内容(AIGC)的工具。作为一个对话系统,ChatGPT具备出色的多功能性,无论是畅聊多种话题、解答数学题,还是提供礼品选择建议、制定行程规划,都可从容应对。因此,从某种意义上来说,ChatGPT具备了广泛的应用潜力和灵活性,可以说是一个通用人工智能(AGI)程序。

尽管在某些方面(例如逻辑和语义理解等)的评测表明,ChatGPT并非在所有领域都比现有的最佳模型更强大,但现有的最佳模型可能只是针对特定任务而设计,而ChatGPT则是一个通用模型。

其实,多年前人们就认识到大模型的巨大潜力,但其实际发展速度仍比预想中快了许多。ChatGPT大模型甫一问世,很快就在应用层面受到极大关注。半年后,中国就涌现出了百余个大模型。

目前,大模型的应用主要分为生成式人工智能(AIGC)、大模型辅助工具、个人智能交互3类。其中,个人智能交互尤其值得关注。任何真正能促进交互的技术和产品都能产生巨大价值。这种交互不仅包括“人—人”(通过机器),也包括“人—机”,甚至包括“机—机”。而人工智能,包括大模型,有望在这方面取得颠覆性突破。

然而,目前大模型的应用之路并不如想象的那么顺利。根本原因在于,虽然大模型很强大,但仍然在技术上存在一些关键缺陷。

首先,大模型有时会犯事实性错误,也就是可靠性问题(俗称“幻觉”)。例如,它会弄错诗词作者。从原理看,大模型的答案选择基于概率,所以很难保证百分百正确。这一问题在目前许多领域的大模型中都存在,也是大模型面临的最重要的挑战之一。

第二,大模型的数学和逻辑推理能力仍然需要加强。虽然GPT-4在某些考试中表现优异,但在面对一些精心设计的逻辑推理问题时,大模型的回答与随机答案相差无几。因为在进行深度推理时,即便大模型每一步的预测准确率都高达95%,但是当推理到20步时,最终的准确率将会是0.95的20次方,即不到36%,这是一个无法令人满意的结果。

第三,大模型的形式语义理解能力有待提升。虽然大模型在一定程度上能够实现语义理解,但要想真正从意义和形式上完全理解语言背后的意义,还有很大的改进空间。

最后,大模型作为一个黑盒模型,存在一些通用弱点。比如,其可解释性、可调试的能力较弱等。

通向强人工智能或需另辟蹊径

大模型开启了通用人工智能落地应用的窗口。但正如前文所说,技术上的一些关键缺陷意味着它与通用强人工智能之间尚有很大距离。要缩短这个距离,至少有两条不同路径值得探索。

第一条路径就是继续沿着大模型现有的发展路线向前走。AI诞生不过60多年,GPT真正开始训练至今也只有5年。如果让大模型再发展5年、50年、500年,它会取得怎样的进步?这是一个值得思考的问题。

沿着现有技术路线,大模型的发展在两个关键点上会遇到一定的挑战。

其一,更多的参数。参数量的增加,会让大模型的能力提升。摩尔定律表明,计算能力每18个月到24个月翻一番,而目前大模型的参数量正以三四个月翻番的速度增长。因此,计算能力很快会跟不上模型的发展需求。而且,尽管参数量呈指数级增长,但其效果只呈线性增长。

})();