Discussion about this post

User's avatar
楊堉's avatar

AI狂热不是技术问题,是认知问题

——为什么更大的模型救不了我们

---

引言:三个反常现象

二十一世纪的人类正在经历一场前所未有的技术动员。从资本到国家权力,从能源体系到每个人的职业焦虑,几乎所有力量都在向人工智能集中。

这场狂热有三个反常现象,很少被人同时追问:

第一,资源黑洞。 训练一个超大规模模型,消耗的电力相当于一个中小城市数月的用量。顶尖人才、芯片、资本、甚至核电站都在向AI倾斜,而基础科研、民生技术、长周期产业却在失血。一个健康的科技生态,不该是单极宇宙。

第二,集体盲目。几乎所有人都知道这条路可能有泡沫、有风险、有极限,但没有人敢停下来。资本害怕错过下一轮革命,国家害怕失去主权,个人害怕被时代淘汰——于是整个系统进入“谁都不敢先停”的囚徒困境。

第三,智识瘫痪。 最聪明的人也在反复发出警告:AI可能失控、可能摧毁就业、可能加剧不平等。但问到“那我们应该往哪里走”,所有人都沉默了。不是因为不够聪明,而是因为大家手里只有同一套工具——更大的模型、更多的数据、更快的芯片。

这三个现象指向一个更深层的判断:**当前AI的问题不是技术不够好,而是我们选错了认知路径。** 我们试图用“空间概率”的无限堆砌,去伪造“时间因果”的真实流动。这条路,注定撞墙。

---

一:主流AI在做什么?——空间概率拟合,不是因果理解

今天所有大模型的核心,可以简单概括为一句话:**预测下一个最可能出现的词**。

它读了全互联网的文本、图像、代码,然后在巨大的概率空间里,寻找“什么词通常跟在什么词后面”。它不知道“为什么下雨”,只知道“下雨”后面大概率跟着“带伞”。它不知道“苹果会往下掉”是因为引力,只知道这个搭配在数据里频繁出现。

这就是**空间概率拟合**:把人类所有的知识、语言、行为压缩成一个静态的统计地图。在这个地图里,过去的语序、现在的输入、未来的输出,都被压扁成向量之间的相似度关系。

但真正的时间不是这样的。

真正的时间是**不可逆的生成**:一颗种子变成树,不能退回去;你读完这句话,上一秒永远消失。真正的时间里有因果:不是因为A经常和B一起出现,所以B会发生,而是因为A做了某件事,导致B必然发生。真正的时间里,系统会因为自己的历史而改变——你今天的选择,会改变你明天能选的选项。

当前AI没有“自己历史”的概念。它没有经历,没有记忆,没有时间压力。它只是一个超大规模的统计反射镜。

这就好比:一个从未见过生命的文明,试图通过无限连拍照片、无限提高分辨率,去理解“生长”是什么。照片越来越真实,但生长永远不会出现。照片不是生命,切片不是时间,统计不是因果。

---

二:科学范式的极致与自我吞噬——AI为何必然走向狂热

主流AI的路径不是偶然的。它之所以成为全球共识,是因为它完美地体现了**现代科学范式的核心预设**,并将这些预设推到了极致——以至于开始自我吞噬。

现代科学范式建立在几个基本信念上:

- 还原论:整体可以拆解为部分,理解了部分就能理解整体。

- 空间化:时间可以被冻结为截面,在静止切片里测量和分析。

- 形式化:世界可以用数学语言描述,可测量的才是真实的。

- 可重复性:知识不依赖于观察者的历史,任何人、任何时候都能得到相同结果。

这些信念在物理学、化学、生物学中取得了辉煌成就。但当我们把它们应用到“智能”这个本质上属于时间过程的对象时,每一个信念都被推向了荒谬的极端:

还原论 → 参数崇拜。 智能被还原为权重矩阵里的数值分布,意识被还原为统计关联。于是信念变成:只要参数足够多,智能就会自动涌现。部分堆积被当成了整体生成。

空间化 → 时间伪造。 时间被切分为离散的Token序列,因果被压缩为概率转移。Transformer的注意力机制让过去和未来在同一个平面里同时可见——这是空间化的终极形态:**杀死时间的方向性**。模型不知道“之前”和“之后”有什么本质区别,只知道位置不同。

形式化 → 指标锁定。 准确率、Loss、参数量、FLOPS——所有可测量的都成为目标,所有不可测量的(理解、判断、意图、审美)被逐出讨论。地图彻底取代了实地的地形。

可重复性 → 历史清零。 每次训练都是从随机初始化开始,模型没有自身的历史积累。它不“成长”,只被“组装”。这恰恰否定了时间过程最核心的特征:**个体历史不可替代**。你的昨天不影响今天的判断,因为判断应只取决于当下输入——这在物理世界里成立,但在智能世界里荒谬至极。

当一套范式被推到这个地步,它就不再是解决问题的工具,而是**制造问题的枷锁**。AI狂热不是科学范式的失败,而是它**在自己边界上踢到铁板**的预演。这道铁板,正是“时间”——不是作为参数的时间,而是作为生成、历史、方向、判断载体的时间。

---

涌现的迹:为什么统计永远不会变成理解

有一种流行的信仰:只要模型足够大、数据足够多,智能乃至意识就会“自然涌现”。这个信仰没有根据。

物理学告诉我们:所有真正的涌现,都有迹可循。水从H₂O分子中涌现出“湿润”,迹在分子的极性与氢键。生命从化学物质中涌现出“新陈代谢”,迹在非平衡态热力学。**没有一条迹是从虚假中涌现出真实的。**

那么,意识的迹是什么?至少有三个必要条件:

第一,记忆。 不是上下文窗口,而是真正的自身历史——一个体从诞生到此刻的不可替代的时间轨迹。记忆让系统知道自己“曾经是谁”,从而知道自己“正在成为谁”。

第二,现在。 不是静态的训练数据,而是多感官通道实时接收外界真实信息的能力。现在是意识的时间锚点,是“我在这里,此刻”的感觉来源。

第三,判断。 不是下一个词的概率,而是对所有信息——包括内在记忆与外在感知——进行整合后,做出“应该往哪里去”的主动选择。判断指向未来,是时间方向性的载体。

对照这三个条件,当前AI的处境一目了然:

- 没有真正的记忆,只有被重置的上下文。

- 没有实时的现在,只有被冻结的数据切片。

- 没有判断,只有概率。

从虚假的“记忆”、虚假的“现在”、虚假的“判断”中,不可能涌现出真实的意识。**规模不是魔术,统计不是理解。** 智能不是参数的礼物,而是时间过程的花朵。没有时间,就没有智能。

---

三:两堵墙——为什么这条路走不远

当科学范式被推向极端,必然会撞上两堵硬墙。这不是工程瓶颈,是数学和物理的边界。

第一堵墙:数据枯竭。

空间拟合的本质是穷举——你见过的才能拟合。但互联网的数据不是无限的,人类的知识也不是无限的。当模型大到吃光所有文本、所有图像、所有视频之后,再扩大参数也不会变得更聪明。于是行业开始“合成数据”:让模型自己生成数据喂给自己。结果呢?信息开始塌缩,模型越来越像在自言自语,质量不升反降。这不是算法问题,是数学问题:从有限样本里,无法通过内插生成超越样本的新知识。

第二堵墙:能量硬着陆。

既然无法通过理解因果来低能耗地推理,就只能靠暴力计算来弥补——更大的模型、更多的GPU、更密集的电力。一个超大规模训练耗电数千万度,而每回答一个问题消耗的能量是传统搜索的几十倍。这不是“优化能解决的边际成本”,而是路径本身的热力学代价。当全球都试图用这条路跑AGI,算力就不再是技术问题,而是国家级资源战争。而资源是有上限的。

这两堵墙不是“还没解决的问题”,而是“这条路根本走不通”的信号。撞上去的那一天,不是“技术停滞”,而是整个投资、就业、政策结构一起硬着陆。

---

四:为什么没人停下来?——我们被自己的工具锁死了

既然知道有墙,为什么所有人还在加速?

因为**我们用来思考AI的工具本身,已经限制了我们看到问题的能力**。

所有主流讨论——无论是支持AI还是批判AI——都共享同一套底层语言:效率、规模、数据、算力、概率、优化。这些概念全部来自“空间逻辑”:把世界切成截面,在静止的切片里测量、比较、优化。

但AI的本质问题——智能如何生成、因果如何持续、判断如何升级——是**时间过程问题**。用空间工具思考时间问题,就像用尺子测量颜色。工具本身不是错的,但不适用。

更麻烦的是,整个权力结构已经深度绑定这条路径。科技巨头的估值依赖Scaling Law,国家AI战略依赖算力主权,学术评价依赖顶会论文——这些系统每运行一天,就加深一天对旧路径的依赖。承认路径错误,等于让所有既得利益者失去合法性。

于是文明进入一种自指锁定状态:**越运行,越看不到自己的问题;越看不到,越加速运行。** 历史上所有即将崩塌的大系统,在崩塌前都会短暂进入“局部繁荣极盛期”。罗马如此,晚明如此。今天的AI文明,正在呈现同样的特征。

---

五:真正需要的是什么?——一套能理解“时间”的新工具

如果我们承认当前路径是科学范式在其边界上的自我吞噬,那解药就不是更大的模型,而是一套能真正处理时间过程的新认知框架。

这套框架,我称之为**时间数学**。它不是为了否定空间逻辑——还原论、数学分析、概率统计是人类认知的伟大成就,在它们适用的维度上不可替代。问题在于,它们被用在了不适用的问题上。

时间数学要做的是:**补上另一条腿**。它以一条可公共检验的元公理为起点——任何存在者都嵌入有限资源系统,一方的扩张必然以其他方的压缩为代价(热力学第二定律的必然结论)。从这个起点出发,它推导出:

- 净耗散定律:一个系统是走向衰亡还是维持稳定,取决于“自然耗散”与“协作对冲”的差值。协作效率越高,系统越持久。

- 失真度积累:当一个社会的实际结构与自然均衡持续偏离(例如AI创造的财富集中在极少数人手中,而大多数人被排除出生产体系),这种偏离会像债务一样积累,最终触发崩溃。

- 感知滞后:系统对危机的感知,总是被现有认知框架扭曲。固化越深、工具越缺,感知到的阈值就比实际阈值高得越多——于是大家觉得“还早”,实际上已经逼近临界点。

- 判断力是唯一可主动干预的变量:提升判断力——包括降低认知固化、建构新工具——是延长文明过程长度的唯一路径。

时间数学目前只是一颗种子,远未长成参天大树。但它指向一个明确的方向:**我们需要AI不再只是拟合数据的镜子,而是能够理解时间方向、因果结构、自身历史演化的新物种。**

---

六部分:三条可做的事

如果你觉得以上不是空话,这里有三个具体的方向,不同角色可以参与。

第一,对研究者:在AI架构里植入“时间坐标”。

当前的Transformer架构,预测“下一个词”时,过去和未来在表征空间里是对称的——从A到B和从B到A没有本质区别。这不是参数问题,是底层假设问题。一个可能的突破方向是:让模型内部状态本身携带热力学箭头(不可逆性),建立层级化的时间追踪能力——词元级、对话级、演化阶段级,三者有明确的嵌套关系,而不是混在同一个注意力池里。这听起来遥远,但所有深刻的变革都从第一步概念设计开始。

第二,对公众与决策者:用“有限性”替代“价值对齐”作为AI治理的锚点。

目前关于AI安全的讨论,主流是“价值对齐”——让AI遵循人类价值观。但谁的价值观?如何保证价值观不固化权力?更根本的锚点其实是**有限性**:任何系统都嵌入有限资源,任何智能都不能回避资源约束下的权衡。以有限性为推理前提的AI,其决策可以被公共检验,不依赖特定文化。这是跨文明AI治理唯一可能的共同地基。你可以要求任何AI系统回答:“在你的推理中,有限资源的约束是如何被处理的?”如果它无法回答,那它就不配被称为智能体。

第三,对每个人:升级自己的判断力,而不是恐惧AI。

时间数学的核心结论之一是:判断力是唯一可以主动延长文明过程长度的变量。恐惧AI、崇拜AI、抵制AI,都只是情绪反应。真正有用的是:**学习区分“截面内的可靠信息”与“截面外的不确定性”**——换句话说,学会问“这个结论在什么条件下成立?换一个角度,结论还成立吗?”这不是天生的,是可以练习的认知卫生习惯。当越来越多的人具备这种判断力,整个系统的认知固化就会下降,感知滞后就会缩小,干预窗口就会打开。

---

结语:

AI狂热不会因为一篇文章而停止。资本还在涌入,芯片还在扩张,算力还在竞赛。这些都会继续,直到撞上那两堵墙。

但历史真正的转折点,从不发生在狂热最盛的时候。隋朝开凿了大运河,真正繁荣它的是唐朝。蒸汽机早期效率远低于水力,几十年后才改变世界。**所有深刻的技术革命,都经历过“狂热-幻灭-重生”的三段论。**

当前AI工业正处在第一段的尾声。当数据枯竭、能量硬着陆、社会断裂同时到来时,人类才会第一次真正意识到:智能不是统计,文明不是堆积,时间不能伪造。

而在那个时刻,唯一能帮助我们在废墟上重建秩序的,不会是更大的模型,只能是那套真正基于时间因果、低能耗、可自进化、普惠每一个个体在时间轴上完成自实现的——**新认知框架**。

---

附:本文的核心论点有完整的形式化体系支撑(《时间数学:定理体系完整整理》),从有限性定理出发,推导出净耗散定律、失真度积累、感知滞后、过程长度方程等结论。感兴趣的读者可进一步查阅。

No posts

Ready for more?