桑新民 余中 李曙华 | 试论生成式人工智能的科学基础和科学范式(上)——关于教育智能化新阶段的战略思考
科技的迅速发展从来都是“双刃剑”,面对这场超乎人类想象的人工智能风暴,各种混乱、危机、陷阱甚至灾难的出现都是难以避免的
桑新民,南京大学教育研究院教授、博士生导师;余中,国家卫生健康委员会科学技术研究所人工智能重点实验室首席科学家,清华大学人工智能国际治理研究院专家;李曙华,南京大学哲学学院教授、博士生导师
近几年人工智能(Artificial Inteligence,简称AI)在各领域的应用步入迅速发展的快车道,在大模型、多模态、元宇宙、深度学习、机器人、人机结合的增强智能等人工智能的不同生长点上齐头并进。尤其是生成式人工智能(Generative AI)异军突起,将整个人工智能领域引入颠覆性发展的新阶段,以迅雷不及掩耳之势震动了全世界,并在各行各业的具体应用中攻城略地,不仅在金融、商业、艺术、娱乐乃至决策管理等领域展现出巨大的应用潜力,而且正在教育领域引发一场极其深刻的变革。与此同时,这也引起围绕人工智能前景和人类文明危机的各种担忧、恐惧和争论。科技的迅速发展从来都是“双刃剑”,面对这场超乎人类想象的人工智能风暴,各种混乱、危机、陷阱甚至灾难的出现都是难以避免的。当前迫切需要凝聚国内外各行各业专家学者和决策者的智慧,共同迎接这场史无前例的时代挑战。
一、生成式人工智能为何能引发AI领域的爆发性突破
长期以来,中国的人工智能技术始终步世界科技前沿后尘,处于追随西方的状态。然而令世界震惊的是,引领世界生成式人工智能历史性突破、雄踞AI竞争丛林榜首的大语言模型ChatGPT创生不到三年,孕育和扎根于中国科技、文化土壤中的DeepSeek就横空出世,以其独特的高性能、低成本、开源式等特色与优势,登上世界AI激烈竞争的前沿舞台,大大降低了体验和应用生成式人工智能大模型的门槛,给中国从行业应用到普通百姓都带来了巨大的冲击和吸引力。中国是全世界最大的互联网和手机应用国家,几乎每个人每天都要在手机上工作、学习、生活、娱乐,现在这样的机遇从天而降,海量用户带着好奇、惊喜、怀疑、恐惧等复杂心态迅速涌入。每当时代变革的潮流突然降临,特别是关系到每个人生存发展的现实与未来的时候,马上就会成为社会普遍关注的焦点和热点。当前中华大地上对人工智能的关注以及公众的广泛参与和疑问,堪称史无前例。究竟什么是人工智能?为什么会如此爆发式发展?对每个人的工作、学习、生活会产生什么样的影响?这几乎成为全社会每个人无法回避的时代叩问。人工智能如此专业的问题,如何能让不同背景、层次的非专业人士尽快了解、参与并防范可能的风险,这一时代难题摆在全社会,尤其是在超越学校教育的广大教育工作者面前。能否用既科学又雅俗共赏的语言,回答这些时代难题?怎样才能最快、最深入地研究和了解一门学科?史论结合是最好的研究方法,用哲学的语言表述就是历史与逻辑的统一。因此,我们首先需要了解和探究人工智能的历史、现实,把握人工智能的理论、技术、实践应用。在此基础上,才有可能理智、清醒地研究和把握人工智能发展的现实困惑、内在规律和未来趋势,由此确立正确的目标和价值导向。
(一)什么是人工智能,当前为什么会出现人工智能爆发性发展
这是一项追根溯源式的研究。要深入回答这类问题涉及多学科、多重视角、多种研究方法和方法论之间的对话与融合。研究和反思人工智能的历史,大多数人都会从1956年美国达特茅斯会议上首次提出人工智能这一概念开始。但如从源头追溯,则必须认识和研究人工智能的两位思想先驱——控制论之父维纳、信息论之父香农,还必须了解冯·诺依曼和图灵等人的贡献;接着展开论述人工智能发展进程中不同流派的兴衰、总体的三起三落和由此形成的三大主要人工智能流派;最后聚焦于当前基于复杂神经网络的“深度学习”。这其实是狭义的人工智能技术发展史。要真正理解和解读“智能”这一最基本的概念,还必须追溯人类对智力的认识和研究,并在人工智能专家与系统科学、心理学与教育学专家的对话交流中,对基本概念进行反思,澄清许多混乱和模糊的认识。这些方面的研究和思考,我们在本刊2022年发表的论文中已经做过详尽的论述,无须重复。但短短两年来,人工智能及其在各领域的应用出现了爆发性的发展,原因何在?这就需要深入探讨以ChatGPT和DeepSeek为代表的大语言生成式人工智能,其核心算法Transformer大语言模型被认为是当今人工智能领域最具颠覆性的技术。但它和以往传统的“决策式”人工智能(Decisionmaking AI)有什么重大区别?总体来讲,生成式人工智能的爆发是数据形态、计算能力、算法模型、应用需求协同进化发展的结果。
数据形态的扩展:从标注驱动到自监督学习。传统人工智能的瓶颈是依赖结构化数据(如表格、标注图像),难以处理非结构化数据(文本、音视频);生成式人工智能的突破在于Transformer大语言模型架构和自监督学习能使模型利用海量无标注文本、图像等非结构化数据,大幅度扩展不同数据形态在AI机器学习中的可用性。
计算能力的飞跃:从CPU到超算集群。在硬件支撑方面,通过GPU(Graphics Procesing Unit)集群与TPU(Tensor Procesing Unit)加速使训练千亿参数模型成为可能;在分布式训练技术方面,通过模型并行、数据并行与混合精度训练,降低大模型训练成本。此二者的结合,在大大提高算力的同时降低了成本。
算法模型的革新:从局部拟合到全局建模。从判别式人工智能到生成式人工智能建模,实现从传统人工智能学习P(x|y)(给定数据狓预测标签y)到生成式人工智能学习P(x)或P(x|y)(生成数据x或条件生成)的拓展;Transformer大语言模型突破RNN/CNN的序列处理限制,支持长文本生成,创生了AI的自注意力机制和相应算法;提出扩散模型理论,将生成过程转化为逐步去噪的数学优化问题,提升了生成质量;建立MoE(Mixture of Experts)架构,通过混合专家系统实现万亿参数模型的高效训练能力。
应用需求的升级:从“分析过去”到“创造未来”。传统人工智能是在预测与分类中选择问题的答案,例如“这是什么肿瘤”,而生成式人工智能则进一步生成提出问题的解决方案,例如“如何设计抗癌药物分子”。这不仅更复杂,而且更具有应用价值。生成式人工智能在多个维度实现了生成能力的革命性突破,重新定义了内容创造的能力边界,突出表现在以下四个方面。
(1)内容创作的创新:实现文字、图片、音视频的内容创作,并可在不同模态之间进行自由转换、映射和生成。例如,可生成创意文字和图像、重新为矢量图稿上色、为文本添加插图效果。这种能力不仅提高了创作效率,还降低了创作门槛,使更多非专业人士能够参与到高质量内容的创作中。
(2)多模态融合生成:实现跨模态转换和混合模态输出,实现“文生图”的精准语义对齐,支持“文本生成视频”“文本生成音乐”,可同步生成文本、语音、图像。
(3)专业领域生成深化:科学发现、预测蛋白质配体结合结构,覆盖98.5%人类蛋白质组,助力药物设计,生成新型材料分子式;代码生成能自动补全复杂算法,独立完成全栈开发任务。
(4)形成行业解决方案:生成式人工智能在多个行业的应用逐渐从辅助工具向核心生产力转变。医疗领域可辅助医疗决策、精准诊断、医学影像分析、个性化医疗、药物研发、公共卫生与疫情监测、智能咨询与患者教育。教育领域可在人机结合中创建个性化学习材料和教学方案,创生新一代课程与教学设计模式;智能辅导与答疑,生成海量教育资源,模拟各种科技和生活场景,在游戏化教学中激发学习兴趣的内在动力;快速即时反馈与评估,彻底超越传统教育评价与考试模式。广告和营销方面,生成式人工智能能够自动化生成视频、图像等营销内容,实现个性化和高效的内容创作。生产制造业方面,AI可用于生产流程的智能化重构、供应链的韧性升级,以及推动产品智能化迭代。
总体来讲,生成式人工智能实现了对传统人工智能的范式升级。
其一,从“单一任务”到“通用能力”的扩展。传统人工智能需针对特定任务定制建模,而生成式人工智能通过Transformer大语言模型,可以将不同模态的数据(如文本、图像、音频等)映射到一个统一的特征空间中,使得模型能够在一个框架下处理多种模态的数据,并凭借其强大的并行处理能力和对长距离依赖的捕捉能力,对超大规模多模态数据建立深度关联和高效融合,在处理海量文本数据时,发现词语之间的潜在关联和模式,从而生成看似新颖但符合语境的内容。这种能力超越了传统人工智能的局限,使其在自然语言处理、图像生成等多个领域取得了重大突破,实现了从单一任务到通用能力的扩展。其通用性源于对语言本质规律的抽象建模(捕捉数据中的长距离依赖关系),这就向通用人工智能(AGI)迈出了重大的一步。
其二,从“理解世界”向“创造世界”的跨越。传统决策式人工智能,是对已有数据的归纳与模式匹配,本质是执行预设规则或分类/聚类预测的“自动化工具”,而当今的生成式人工智能,通过大语言模型Transformer架构或扩散模型实现了对文本、语音、图像甚至跨模态内容的原创性生成,展现出类人的联想与创新等通用能力(既能够进行文学创作,又能够辅助编程等)。这种从“分析既有模式”到“创造新生内容”的升级标志着从“理解世界”向“创造世界”的跨越,在输出端产生新内容、解决新问题。AI不再仅是被调用的工具,还是能够主动提出创意、参与决策的“智能伙伴”。人工智能的演进本质上是人类对“智能”认知边界的不断突破:从早期基于规则的专家系统到数据驱动的深度学习,再到如今以生成式人工智能为代表的创造型智能,AI技术不仅重塑了机器解决问题的能力,还重新定义了人机关系的边界。这些多维突破推动了生成式人工智能技术的快速发展,加速其在各个领域的广泛应用。生成式人工智能正在从人类的“工具”演变为人类的“协作者”,重塑人类创造力的表达方式和运行模式。这标志着AI从工具属性向协作者属性的本质转变。
(二)DeepSeek和OpenAI生成式人工智能的异同
OpenAI是成立于2015年的美国科技公司,其目标是创建通用人工智能(AGI)。OpenAI在生成式人工智能领域的突破性进展始于2018年发布的GPT1模型。该模型通过无监督预训练和有监督微调训练两个训练步骤,标志着生成式人工智能在自然语言处理(NLP)领域的重大突破,并进入快速迭代的发展。2020年发布的GPT3模型拥有1750亿个参数,能够生成高质量的文本内容。2022年,OpenAI推出的GPT3.5模型在对话能力上有了显着提升,发表的ChatGPT引领了生成式人工智能的全球爆发。2023年发布的GPT4不仅在文本生成上表现更出色,还具备了多模态处理能力。2024年2月,OpenAI又发布了AI视频生成模型Sora,标志着AI视频生成领域迎来了类似ChatGPT的突破。DeepSeek是成立于2023年的中国科技公司,专注于生成式人工智能基础模型的研发及应用,它在世界激烈竞争的AI大舞台上横空出世,显示出其在生成式人工智能技术创新和应用拓展方面的强大能力和潜力。DeepSeek的核心技术之一是高效的模型架构和训练方法,通过优化算法和算力分配,能够实现轻量化模型的高效运行。这种技术优势能使其在高性能芯片资源等有限的设备上运行,降低了部署门槛,推动了生成式人工智能在更多场景中的应用。OpenAI与DeepSeek的技术基础架构均采用Transformer大语言模型,依赖自注意力机制(Self Atention)处理长距离依赖关系;两者的预训练微调范式均通过大规模无监督预训练,结合下游任务微调提升性能;两者均为数据驱动,依赖海量数据,训练语料涵盖互联网公开文本(书籍、网页、学术论文等),多语言支持(覆盖主流语言英、中、西、法等)。两者的核心能力包括文本生成(支持文章创作、对话生成、代码编写等任务)、多任务泛化(通过提示工程适配不同场景,如翻译、摘要、问答)、上下文理解(可处理长文本输入)。DeepSeek与OpenAI的差异主要有以下三点。其一是推理模型与算法的差异。DeepSeek采用MoE模型架构时,通过动态路由等技术创新对大模型进行了拆分,选择激活最合适的“专家子模型”,节省了计算资源,提高了推理效率。另外,OpenAI采用的CoT(Chain of Thoughts)思维链算法,适用于目标明确、路径单一的推理任务,而DeepSeek采用的ToT(Tree of Thoughts)思维树算法,适用于更复杂的开放性问题或多解推理任务。其二,OpenAI强调模型泛化能力与跨领域适应性与全球生态构建。DeepSeek更注重行业落地的垂直深耕,折射出两者从技术探索到商业落地的多元路径,分别代表了“广度优先”与“深度优先”的战略选择。其三,OpenAI是闭源模型,而DeepSeek是开源模型,后者性能达到世界前沿水平,经受了全世界同行的专业研究和评判,获得广泛认可,同时模型训练和推理成本都大大降低,其他大模型或用户可免费或以极低的价格接入,大大降低了使用生成式AI大模型的门槛,应用场景和前景更加广阔。人工智能技术路径的选择显然要受到文化价值观与资源背景、应用市场环境等差异的影响和制约。但深入研究会发现,诞生于美国土壤的ChatGPT和诞生于中国土壤的DeepSeek虽然存在明显的语言文化基因、生存发展背景与环境的差异,表现了各自的优劣,但正是这些差异,使二者具有重要的互补性。未来AI技术的进步需在三个维度取得平衡:技术性能的卓越性、文化语境的适配性、社会治理的包容性。这是智能时代人类智力与AI双向提升、携手共创“增强智能”、引领人类文明健康发展的必由之路。
(三)生成式人工智能大模型存在哪些局限性
用户在与生成式人工智能(OpenAI或DeepSeek)对话时有一个强烈的感觉,就是这种新一代AI大模型经常会“一本正经地胡说八道”,即输出看似合理但实际错误、虚构或与现实不符的内容。专业人士将此称为“AI幻觉”(AI halucination)。总结归纳起来,造成AI幻觉的主要原因包括以下几点。
1.底层逻辑和算法的偏颇。生成式人工智能大语言模型本质上是一个基于统计概率的文本生成系统,而非具备认知能力的知识主体。大语言模型采用的是基于概率的文本生成机制——通过预测下一个词的概率分布生成内容,其目标是“生成符合上下文语境的流畅文本”,而非“确保事实准确性”。模型更关注词与词之间的统计关联性,AI仅通过文本符号学习,没有物理世界的感知能力,无法直接验证生成内容的真实性,无法区分“文本描述的事实”与“虚构情节”,也无法通过现实经验纠正这一错误。模型虽然可以通过海量数据学习到大量文本模式,但可能将局部模式泛化为普遍规律,导致虚构关联。这是其产生“AI幻觉”的最主要根源。
2.缺乏常识与因果推理。尽管模型能模仿常识推理,但其本质是文本模式的复现,而非基于物理规律的深度理解,模型的优化目标是降低文本预测的困惑度,而非追求事实正确性,因此输出的结果经常会完全违背事实。另外还有,数据库中知识覆盖存在缺口,模型的知识截止于训练数据的时间点,且对某些领域覆盖不足。面对未知领域时,模型倾向于通过“想象力”填补空白,编造一个看似合理的输出结果。AI大模型不具备人类意义上的“意识”,更谈不上“自我意识”,无法判断自身生成内容的可信度,也无法通过逻辑链回溯验证事实。
3.受到数据库中急剧增长的“垃圾信息”噪声干扰。对生成式人工智能大模型的训练,绝不仅限于专业的程序员和开发管理部门,还包括全体用户。这样的数据库时刻都在以难以想象的速度增长、膨胀,导致训练数据库中包含大量错误信息、过时知识、虚构内容(小说、谣言)和主观偏见,甚至大量人为的造假和故意破坏。模型无法迅速识别和过滤这些噪声。这样的技术就像无数脱缰的野马,在没有任何缰绳的束缚下狂奔,进入了多元创造的时代,也进入了善与恶、美与丑、真与假混杂的多样化人性驱动下纷繁复杂的发展道路。从以上分析不难看出,所谓生成式人工智能的“AI幻觉”,是由其底层逻辑、推理过程算法规则和严重的噪声干扰等因素决定的,这是当前生成式人工智能大模型无法避免的缺陷。尽管通过工程优化可以部分缓解这个问题,但彻底消除“AI幻觉”必须突破当前生成式人工智能范式的限制(例如,实现符号逻辑与神经网络的深度融合)才有可能。因此,现在的生成式人工智能离“真实内容生成”还有很长一段距离。若要对此作出更深入的研究和解读,需要进一步寻根究底,探讨人工智能的科学基础与科学研究方法论。



AI狂热不是技术问题,是认知问题
——为什么更大的模型救不了我们
---
引言:三个反常现象
二十一世纪的人类正在经历一场前所未有的技术动员。从资本到国家权力,从能源体系到每个人的职业焦虑,几乎所有力量都在向人工智能集中。
这场狂热有三个反常现象,很少被人同时追问:
第一,资源黑洞。 训练一个超大规模模型,消耗的电力相当于一个中小城市数月的用量。顶尖人才、芯片、资本、甚至核电站都在向AI倾斜,而基础科研、民生技术、长周期产业却在失血。一个健康的科技生态,不该是单极宇宙。
第二,集体盲目。几乎所有人都知道这条路可能有泡沫、有风险、有极限,但没有人敢停下来。资本害怕错过下一轮革命,国家害怕失去主权,个人害怕被时代淘汰——于是整个系统进入“谁都不敢先停”的囚徒困境。
第三,智识瘫痪。 最聪明的人也在反复发出警告:AI可能失控、可能摧毁就业、可能加剧不平等。但问到“那我们应该往哪里走”,所有人都沉默了。不是因为不够聪明,而是因为大家手里只有同一套工具——更大的模型、更多的数据、更快的芯片。
这三个现象指向一个更深层的判断:**当前AI的问题不是技术不够好,而是我们选错了认知路径。** 我们试图用“空间概率”的无限堆砌,去伪造“时间因果”的真实流动。这条路,注定撞墙。
---
一:主流AI在做什么?——空间概率拟合,不是因果理解
今天所有大模型的核心,可以简单概括为一句话:**预测下一个最可能出现的词**。
它读了全互联网的文本、图像、代码,然后在巨大的概率空间里,寻找“什么词通常跟在什么词后面”。它不知道“为什么下雨”,只知道“下雨”后面大概率跟着“带伞”。它不知道“苹果会往下掉”是因为引力,只知道这个搭配在数据里频繁出现。
这就是**空间概率拟合**:把人类所有的知识、语言、行为压缩成一个静态的统计地图。在这个地图里,过去的语序、现在的输入、未来的输出,都被压扁成向量之间的相似度关系。
但真正的时间不是这样的。
真正的时间是**不可逆的生成**:一颗种子变成树,不能退回去;你读完这句话,上一秒永远消失。真正的时间里有因果:不是因为A经常和B一起出现,所以B会发生,而是因为A做了某件事,导致B必然发生。真正的时间里,系统会因为自己的历史而改变——你今天的选择,会改变你明天能选的选项。
当前AI没有“自己历史”的概念。它没有经历,没有记忆,没有时间压力。它只是一个超大规模的统计反射镜。
这就好比:一个从未见过生命的文明,试图通过无限连拍照片、无限提高分辨率,去理解“生长”是什么。照片越来越真实,但生长永远不会出现。照片不是生命,切片不是时间,统计不是因果。
---
二:科学范式的极致与自我吞噬——AI为何必然走向狂热
主流AI的路径不是偶然的。它之所以成为全球共识,是因为它完美地体现了**现代科学范式的核心预设**,并将这些预设推到了极致——以至于开始自我吞噬。
现代科学范式建立在几个基本信念上:
- 还原论:整体可以拆解为部分,理解了部分就能理解整体。
- 空间化:时间可以被冻结为截面,在静止切片里测量和分析。
- 形式化:世界可以用数学语言描述,可测量的才是真实的。
- 可重复性:知识不依赖于观察者的历史,任何人、任何时候都能得到相同结果。
这些信念在物理学、化学、生物学中取得了辉煌成就。但当我们把它们应用到“智能”这个本质上属于时间过程的对象时,每一个信念都被推向了荒谬的极端:
还原论 → 参数崇拜。 智能被还原为权重矩阵里的数值分布,意识被还原为统计关联。于是信念变成:只要参数足够多,智能就会自动涌现。部分堆积被当成了整体生成。
空间化 → 时间伪造。 时间被切分为离散的Token序列,因果被压缩为概率转移。Transformer的注意力机制让过去和未来在同一个平面里同时可见——这是空间化的终极形态:**杀死时间的方向性**。模型不知道“之前”和“之后”有什么本质区别,只知道位置不同。
形式化 → 指标锁定。 准确率、Loss、参数量、FLOPS——所有可测量的都成为目标,所有不可测量的(理解、判断、意图、审美)被逐出讨论。地图彻底取代了实地的地形。
可重复性 → 历史清零。 每次训练都是从随机初始化开始,模型没有自身的历史积累。它不“成长”,只被“组装”。这恰恰否定了时间过程最核心的特征:**个体历史不可替代**。你的昨天不影响今天的判断,因为判断应只取决于当下输入——这在物理世界里成立,但在智能世界里荒谬至极。
当一套范式被推到这个地步,它就不再是解决问题的工具,而是**制造问题的枷锁**。AI狂热不是科学范式的失败,而是它**在自己边界上踢到铁板**的预演。这道铁板,正是“时间”——不是作为参数的时间,而是作为生成、历史、方向、判断载体的时间。
---
涌现的迹:为什么统计永远不会变成理解
有一种流行的信仰:只要模型足够大、数据足够多,智能乃至意识就会“自然涌现”。这个信仰没有根据。
物理学告诉我们:所有真正的涌现,都有迹可循。水从H₂O分子中涌现出“湿润”,迹在分子的极性与氢键。生命从化学物质中涌现出“新陈代谢”,迹在非平衡态热力学。**没有一条迹是从虚假中涌现出真实的。**
那么,意识的迹是什么?至少有三个必要条件:
第一,记忆。 不是上下文窗口,而是真正的自身历史——一个体从诞生到此刻的不可替代的时间轨迹。记忆让系统知道自己“曾经是谁”,从而知道自己“正在成为谁”。
第二,现在。 不是静态的训练数据,而是多感官通道实时接收外界真实信息的能力。现在是意识的时间锚点,是“我在这里,此刻”的感觉来源。
第三,判断。 不是下一个词的概率,而是对所有信息——包括内在记忆与外在感知——进行整合后,做出“应该往哪里去”的主动选择。判断指向未来,是时间方向性的载体。
对照这三个条件,当前AI的处境一目了然:
- 没有真正的记忆,只有被重置的上下文。
- 没有实时的现在,只有被冻结的数据切片。
- 没有判断,只有概率。
从虚假的“记忆”、虚假的“现在”、虚假的“判断”中,不可能涌现出真实的意识。**规模不是魔术,统计不是理解。** 智能不是参数的礼物,而是时间过程的花朵。没有时间,就没有智能。
---
三:两堵墙——为什么这条路走不远
当科学范式被推向极端,必然会撞上两堵硬墙。这不是工程瓶颈,是数学和物理的边界。
第一堵墙:数据枯竭。
空间拟合的本质是穷举——你见过的才能拟合。但互联网的数据不是无限的,人类的知识也不是无限的。当模型大到吃光所有文本、所有图像、所有视频之后,再扩大参数也不会变得更聪明。于是行业开始“合成数据”:让模型自己生成数据喂给自己。结果呢?信息开始塌缩,模型越来越像在自言自语,质量不升反降。这不是算法问题,是数学问题:从有限样本里,无法通过内插生成超越样本的新知识。
第二堵墙:能量硬着陆。
既然无法通过理解因果来低能耗地推理,就只能靠暴力计算来弥补——更大的模型、更多的GPU、更密集的电力。一个超大规模训练耗电数千万度,而每回答一个问题消耗的能量是传统搜索的几十倍。这不是“优化能解决的边际成本”,而是路径本身的热力学代价。当全球都试图用这条路跑AGI,算力就不再是技术问题,而是国家级资源战争。而资源是有上限的。
这两堵墙不是“还没解决的问题”,而是“这条路根本走不通”的信号。撞上去的那一天,不是“技术停滞”,而是整个投资、就业、政策结构一起硬着陆。
---
四:为什么没人停下来?——我们被自己的工具锁死了
既然知道有墙,为什么所有人还在加速?
因为**我们用来思考AI的工具本身,已经限制了我们看到问题的能力**。
所有主流讨论——无论是支持AI还是批判AI——都共享同一套底层语言:效率、规模、数据、算力、概率、优化。这些概念全部来自“空间逻辑”:把世界切成截面,在静止的切片里测量、比较、优化。
但AI的本质问题——智能如何生成、因果如何持续、判断如何升级——是**时间过程问题**。用空间工具思考时间问题,就像用尺子测量颜色。工具本身不是错的,但不适用。
更麻烦的是,整个权力结构已经深度绑定这条路径。科技巨头的估值依赖Scaling Law,国家AI战略依赖算力主权,学术评价依赖顶会论文——这些系统每运行一天,就加深一天对旧路径的依赖。承认路径错误,等于让所有既得利益者失去合法性。
于是文明进入一种自指锁定状态:**越运行,越看不到自己的问题;越看不到,越加速运行。** 历史上所有即将崩塌的大系统,在崩塌前都会短暂进入“局部繁荣极盛期”。罗马如此,晚明如此。今天的AI文明,正在呈现同样的特征。
---
五:真正需要的是什么?——一套能理解“时间”的新工具
如果我们承认当前路径是科学范式在其边界上的自我吞噬,那解药就不是更大的模型,而是一套能真正处理时间过程的新认知框架。
这套框架,我称之为**时间数学**。它不是为了否定空间逻辑——还原论、数学分析、概率统计是人类认知的伟大成就,在它们适用的维度上不可替代。问题在于,它们被用在了不适用的问题上。
时间数学要做的是:**补上另一条腿**。它以一条可公共检验的元公理为起点——任何存在者都嵌入有限资源系统,一方的扩张必然以其他方的压缩为代价(热力学第二定律的必然结论)。从这个起点出发,它推导出:
- 净耗散定律:一个系统是走向衰亡还是维持稳定,取决于“自然耗散”与“协作对冲”的差值。协作效率越高,系统越持久。
- 失真度积累:当一个社会的实际结构与自然均衡持续偏离(例如AI创造的财富集中在极少数人手中,而大多数人被排除出生产体系),这种偏离会像债务一样积累,最终触发崩溃。
- 感知滞后:系统对危机的感知,总是被现有认知框架扭曲。固化越深、工具越缺,感知到的阈值就比实际阈值高得越多——于是大家觉得“还早”,实际上已经逼近临界点。
- 判断力是唯一可主动干预的变量:提升判断力——包括降低认知固化、建构新工具——是延长文明过程长度的唯一路径。
时间数学目前只是一颗种子,远未长成参天大树。但它指向一个明确的方向:**我们需要AI不再只是拟合数据的镜子,而是能够理解时间方向、因果结构、自身历史演化的新物种。**
---
六部分:三条可做的事
如果你觉得以上不是空话,这里有三个具体的方向,不同角色可以参与。
第一,对研究者:在AI架构里植入“时间坐标”。
当前的Transformer架构,预测“下一个词”时,过去和未来在表征空间里是对称的——从A到B和从B到A没有本质区别。这不是参数问题,是底层假设问题。一个可能的突破方向是:让模型内部状态本身携带热力学箭头(不可逆性),建立层级化的时间追踪能力——词元级、对话级、演化阶段级,三者有明确的嵌套关系,而不是混在同一个注意力池里。这听起来遥远,但所有深刻的变革都从第一步概念设计开始。
第二,对公众与决策者:用“有限性”替代“价值对齐”作为AI治理的锚点。
目前关于AI安全的讨论,主流是“价值对齐”——让AI遵循人类价值观。但谁的价值观?如何保证价值观不固化权力?更根本的锚点其实是**有限性**:任何系统都嵌入有限资源,任何智能都不能回避资源约束下的权衡。以有限性为推理前提的AI,其决策可以被公共检验,不依赖特定文化。这是跨文明AI治理唯一可能的共同地基。你可以要求任何AI系统回答:“在你的推理中,有限资源的约束是如何被处理的?”如果它无法回答,那它就不配被称为智能体。
第三,对每个人:升级自己的判断力,而不是恐惧AI。
时间数学的核心结论之一是:判断力是唯一可以主动延长文明过程长度的变量。恐惧AI、崇拜AI、抵制AI,都只是情绪反应。真正有用的是:**学习区分“截面内的可靠信息”与“截面外的不确定性”**——换句话说,学会问“这个结论在什么条件下成立?换一个角度,结论还成立吗?”这不是天生的,是可以练习的认知卫生习惯。当越来越多的人具备这种判断力,整个系统的认知固化就会下降,感知滞后就会缩小,干预窗口就会打开。
---
结语:
AI狂热不会因为一篇文章而停止。资本还在涌入,芯片还在扩张,算力还在竞赛。这些都会继续,直到撞上那两堵墙。
但历史真正的转折点,从不发生在狂热最盛的时候。隋朝开凿了大运河,真正繁荣它的是唐朝。蒸汽机早期效率远低于水力,几十年后才改变世界。**所有深刻的技术革命,都经历过“狂热-幻灭-重生”的三段论。**
当前AI工业正处在第一段的尾声。当数据枯竭、能量硬着陆、社会断裂同时到来时,人类才会第一次真正意识到:智能不是统计,文明不是堆积,时间不能伪造。
而在那个时刻,唯一能帮助我们在废墟上重建秩序的,不会是更大的模型,只能是那套真正基于时间因果、低能耗、可自进化、普惠每一个个体在时间轴上完成自实现的——**新认知框架**。
---
附:本文的核心论点有完整的形式化体系支撑(《时间数学:定理体系完整整理》),从有限性定理出发,推导出净耗散定律、失真度积累、感知滞后、过程长度方程等结论。感兴趣的读者可进一步查阅。