1. 引言
在西方哲学史上,“知识如何而来?”是传统哲学认识论中的一个核心问题,不同的哲学家对此仁者见仁,智者见智。根据知识的来源大相径庭,形成理性主义和经验主义两大认识论学派。其中,以笛卡尔、斯宾诺莎和莱布尼茨等为代表的理性主义者主张,知识源于理性,人类天赋知识,可经由推理来获得知识;而以培根、洛克和休谟等为代表的经验主义者则认为,一切知识皆由感觉和经验而来,并在经验中得到验证。理性主义和经验主义虽然在知识的来源上存在重大分歧,但他们都是以人类为中心而展开对自然界和社会的认识,正如普罗泰戈拉所言“人是万物的尺度”。自然而然,由人类作为认识主体而总结出的关于自然界和社会的一种带有普遍性与确定性的客观属性知识就是人类知识。
然而,以电子计算机为基础的计算科学的出现与发展,不仅使人类脑力得以延伸和增强,更是给“科学仪器仅是辅助科学研究的工具”的论断带来涟漪。尤其是随着大数据和人工智能技术在社会各个领域中的广泛应用,“人工智能驱动的科学研究大大提高了科学发现的效率和速度,推动了人类知识生产的革命性变革”[1],之所以称为“革命性变革”主要是源于人工智能不再是纯粹的工具,而是与人类共同参与到知识生产的过程中,并进而引发知识生产的范式转换。这从侧面说明:单独的人类已难以应对复杂的关于认识的新局面,其认识能力在某种程度上是有限的而不是无限的,亦即人类知识是有限度的。基于此种背景,我们拟从认识的不透明性的视角来剖析人类知识的范围与限度及其在人工智能驱动下对人类知识的超越。
2. 认识的不透明性:从人类心灵到人工智能
在认知哲学中,透明性侧重强调认知主体自身有所知心灵的各种状态,也就是说,认知主体知道他知道,主体认识对心灵而言没有什么是可隐藏的,而是透明的,我们能知晓在这个认知家园中的一切。不过,却有一些哲学家对此持有异议,最具代表性的是,在英国哲学家蒂摩西·威廉姆森(Timothy Williamson)看来,认知透明性就是一个神话,我们的认知并非透明,知识是存有限度的,并提出一系列反透明性(Opacity)论证。
然而,技术的进步使对透明性的讨论不再囿于人类心灵范畴,而是拓展到计算科学领域。至于计算科学中的透明性,“‘透明性’可能会关乎信息不可见情形,诸如,对使用者而言,计算过程或者一种应用程序是透明的”[2]。克瑞尔(Kathleen A. Creel)更是将复杂计算系统中的透明性进一步划分为功能透明性、结构透明性以及运行透明性三个维度,简单来说,功能透明性是关于算法整体功能的知识;结构透明性即如何在代码中实现算法的知识;运行透明性是在特定的实例中运行的程序知识[3]。与之相对,当前颇有影响力的美国科学哲学家保罗·汉弗莱斯(Paul Humphreys)用“认识不透明性”(Epistemic Opacity)这一术语来讨论计算科学特别是计算机模拟过程中的不透明性,并将其定义为:“如果认识主体X在t时刻不了解与这个过程相关的全部认识论要素,那么此过程在t时刻对于认识主体X而言是认识上不透明的”[4]。从上述可以看出,认识不透明性与认识主体的知识的匮乏息息相关,它反映了认识主体难以访问与实现任务的过程有关的认识论要素以至于主体不能以自身可理解的方式来掌握系统的本质。由此可见,计算科学中的认识不透明性不同于认知哲学中的不透明性,它强调应从认识的全过程出发,亦即将认识的主体、认识的客体以及认识的过程与方法等各个环节和各种因素纳入到所考虑问题的范围之内[5]。
近年来,大数据和人工智能的迅猛发展,使“认识的不透明性”成为人工智能领域的显著特征,特别是在运用多层神经网络的深度学习中变得尤为突出。尽管计算机模拟和深度学习之间存有一定的差异,这种差异性可概括如下:前者从目标的概念化开始,并由此预测“基于假设的数据”,后者则从数据的概念化开始,并由此同样地预测新的基于假设的数据;但更为重要的是,两者同时尚有一个显著的共同之处:它们皆因不透明性而得到认可,这两种情况下的过程涉及的都是计算过程,其不透明性可追溯到算法的复杂性[6]。文森特·穆勒(Vincent C. Müller)把人工智能系统中的不透明性又细分为三种类型:1) 浅层不透明性(Shallow opacity),此种不透明性源于人工智能模型作为权力的工具,比如,银行拒绝你的贷款申请,银行只是仅仅告诉你这是系统的决定,即使在银行知晓模型为什么产生如此决策的情况下,他们也不会把原因告知接受者,这样的不透明性与机构权力密切相关;2) 标准不透明性(standard opacity),它是一种相较于浅层不透明性更加不透明的类似“黑箱”式的不透明性,特定于机器学习领域中,不仅是用户与数据主体,而且与之相关的分析者也可能不知道在人工智能系统的输入和输出两端之间所进行的运行过程,整个模型犹如黑箱;3) 深度不透明性(deep opacity),即使人类专家在算法生成方面做出了最大努力,这种不透明性也不可能被消除,比如,训练算法的数据包含信息,但有多少是我们不能知道的呢?此种不透明性与信息内容和面对新方法或者额外数据的鲁棒性密切相关[7]。从以上分类来看,浅层不透明性是基于外部的人为因素而形成;深度不透明性则是本体论层面上的“原初”式不透明性;而标准不透明性即“黑箱”式的不透明性也就是本文所谈论的认识论维度上的不透明性。
3. 认识的不透明性与人类知识的关系
著名的英国哲学家迈克尔·波兰尼(Michael Polanyi)在《人的研究》一书中把人类知识划分为明述知识(explicit knowledge)和默会知识(tacit knowledge)两种类型。明述知识是指用语言或者符号能明确表述的知识;而默会知识是不能通过语言和符号等形式来充分表述但又可被人类意会到的知识,颇有“只可意会不可言传”之意蕴。
3.1. 明述知识是认识的透明性的结果
哈里·柯林斯(Harry Collins)将明述知识分为三类:第一是用语言指导的二阶规则与教导规则来表述的知识;第二是阐述物理世界因果关系或机制的科学知识;第三是通过计算机编程进而可由机器来模拟的知识[8]。
针对第一类的明述知识,以学游泳为例,教练会告诉初学者,要先练习漂浮和平衡,可能要用数小时甚至几天的时间,这是教练在提示学习游泳基本动作的难度,柯林斯将其称为二阶规则;在游泳的过程中,教练会对学员谆谆教导,头部最好不要一直在水里超过两分钟,否则容易发生溺水事故,柯林斯把诸如此类的指导称为教导规则。无论是二阶规则还是教导规则,它们皆是在语言的指导下进行,人类正是通过语言来表达关于世界的认识的,因此探讨认识及其与认识有关的问题理所当然地就会涉及语言,语言作为一种经验性的东西,为我们日常习用和熟悉,同时又是可直观把握的[9]。所以,语言是表达知识的最为常见方式,显而易见,以语言作为载具论的知识是一种初级的明述知识。
第二类的科学知识相较于第一类的语言知识而言,则属于更为高级的明述知识,因为“科学是揭示客观规律的学问,科学研究的对象具有因果性,科学规律本质上就是因果律”[10]。也就是说,科学定律比语言在认识世界方面具有更大的可靠性和精确性,它一般惯用数学公式表示,对科学研究对象的认识真正做到了定性分析和定量描述的相统一,除此之外,还能够通过逻辑推理和实证的方法对其进行论证,但是语言不仅无法精确地描述充满复杂性的科学研究对象,而且又难以运用逻辑推理和实证的方法对其进行严格验证。在简单性科学发展时期,人类通过对“小数据”的收集、整理与分析,最终归纳推导出普遍有效的科学定律,这样的科学史事件枚不胜举,例如:开普勒在处理第谷观测到的大量关于火星数据的基础上提出行星运动三大定律。20世纪中期以降,科学发展形态开始从简单性科学迈向复杂性科学阶段,与此同时,随着科学研究对象的复杂性与不确定性的日益增加,基于统计科学形成的统计式因果性逐步替代以近代科学大厦为背景而形成的机械决定论式的严格因果观,但仍然是在追寻确定性,只不过是统计意义上的确定性而已。即使大数据时代已到来,人类依旧孜孜不倦地寻求隐藏在规模庞大的“大数据”的后面的因果性,从表面上来看,人类探究的是科学对象之间的因果性,但从本质上来看,又何尝不是在追求对世界进行透明性认识之后的具有客观性与普遍性的科学知识呢?
第三类的明述知识,按照柯林斯的看法,就是让计算机对第二类的科学知识进行编码,然后设计出机器来模拟。作为人工智能领域最早的研究纲领即符号主义学派主张人工智能的工作机理是以数理逻辑为基础,人类对世界的理性认识而形成的知识都可由符号来表示,这也意味着人类智能在某种程度上能够被形式化为符号与规则,这样一来,计算机得以通过符号的表征与运算来模拟如人类那般的智能行为。比如,经典力学的集大成者牛顿用三大运动定律表示物体运动与力之间的关系,像这种用以揭示物理世界现象并以符号和数学关系为核心表述的科学知识都能被计算机以符号和规则进行编码,进而构建出拥有类人智能的机器。
概括来说,不管是作为初级的以语言为载体的知识还是作为高级的以阐释物理世界因果机制为中心的科学知识,它们都属于以人类可理解的方式加以表述的明述知识,是人类从根本上对自然界进行透明性认识的结果。
3.2. 默会知识是认识中夹带不透明性的结果
在西方近代,以“泾渭分明的主客二分图景”为核心的传统认识论遭受来自不同视角的批判,甚至一度出现“认识论之终结”的声音。为了解决近代认识论面临的窘境,哲学家们采取各不相同的方法,大体来看,主要归结为两种:一种是以采取极端态度的新实用主义者罗蒂为代表,主张全然摒弃与传统认识论相关的若干问题;另一种则是以持有温和态度的泰勒为代表,主张我们应该另辟蹊径地采用新的研究进路而不是简单粗暴地直接抛弃认识论。在这样的境况下,波兰尼引入的“默会知识”在某种程度上可视为对传统认识论的改造。
波兰尼的默会知识尽管带有高度的个人化色彩,与认知主体的情感、信念以及认知境遇等诸种个人因素密切相关,但并不妨碍默会知识具有客观性、普遍性与可靠性。因为根据波兰尼自身的看法,由于认知主体的认知活动始终与实在世界相关联,那么认知结果亦即带有个人性的默会知识从而就具有客观性;在认识实在世界的过程中,波兰尼认为人类有个人义务在普遍标准之下去提出能够反映实在世界的真实知识,这样就将个人性与普遍性融贯起来,所形成的客观知识则是超越自身主观性的普遍性知识;与此同时,在科学研究中,当科学家个人向外界宣告自己的科学新发现时,已经暗含着科学家向世人承诺此种客观普遍的知识是可靠的、有效的。
具体来讲,波兰尼的默会知识主要涵盖两种含义,第一种含义是“从动物的非言述智力发展而来的人的默会能力,以及作为其运用的默会认知,与明述知识有种类差异,非言述所能尽”([11]: p. 50),也就是“非言述所能尽”的默会知识中含有不可表达的成分,但“断言我自己具有不可表达的知识并非要否认我能谈及这种知识,而只是否认我能充分地谈论它”([12]: p. 104)。按照波兰尼的这种说法,默会知识绝不是不能用语言或符号彻底不可表达,只是不能充分表达而已,“由于我们的一切知识在根本上都具有默会性而我们永远不能说出所有我们知道的东西那样,由于意义的默会性,我们也永远不能完全知道我们所说的话中暗示着什么”([12]: p. 109),换言之,我们知道的远超过所说出来的。第二种含义是辅助项的不可确切指认性,一方面我们只是基于辅助的意义上对综合体的众细节有所了解,但在焦点意义上却又是无知的,譬如,我们尽管可以娴熟地去进行骑车与游泳等活动,可是通常不能完整地说出构成它们的全部细节;另一方面是从辅助项的功能来说,诸多细节的功能仅作为辅助项起作用,一旦把焦点聚集于此,这样一来,就无法维持原有行动,比如,钢琴家在演奏乐曲的过程中,他对手指动作只有辅助觉知,因为其注意力聚焦在乐曲上,如果他将注意力集中在手指上,乐曲难以流畅地被演奏到底甚至于中途停断([11]: pp. 61-62)。而默会知识概念后又被维特根斯坦学派赋予强弱之分,强默会知识是指不能用语言在原则上充分加以言述的知识,这与默会知识的第一种含义相对应;弱默会知识是指虽然在事实上未能用语言言说,但原则上并非不能充分表达的知识,这与默会知识的第二种含义相对应([11]: p. 18)。
归根结底,默会知识无论是基于强的意义——原则层面的尚未能用语言充分表达的知识,还是弱的意义——事实层面的用语言欠充分表达的知识,这两种维度的默会知识概念从侧面都折射出人类在认识上呈现出不透明性,无法凭借语言或符号系统完全清晰地表达对世界的透明性认识。换句话说,默会知识虽正确反映实在世界,但它却是人类认识中夹杂着某种不透明性的结果,因为人类难以通过理性思维透彻地理解与解释它,导致其不可全部外显。比如,以阴阳五行学说为理论基础的中医一般用望、闻、切、问相结合的方式诊断治疗,其中很重要的一个环节是切脉,当老中医与新学徒对同一病人进行把脉时,他们所体验到的脉搏跳动的具体情况也不尽相同即手感略有差异,但是又很难用语言明确地描述这种不同之处,由此“有一千个读者就有一千个哈姆雷特”一定程度上是对默会知识的典型写照。
4. 超越人类知识的边界
“我们对于世界所能作出的任何一种描述都决定于世界对于我们的作用,因而在这种限度内它就必然还是以人类为中心的一种描述”[13],不论是可用语言充分表述世界的明述知识抑或是不可言传的默会知识,它们皆在人类作为认识主体的基本框架内而形成,是人类构建起来的关于实在世界的认知与真理。然则,大数据和机器智能技术的飞速发展正在造就一种区别于传统人类知识的生产模式,涉及整个认识过程的主体与客体以及认知模式已发生鲜明改变。
首先,认识主体表现出进化态势:从单纯的人转变为具有主体间性的人机混合体甚至于机器和人以“双主体”形式共存。目前学界比较认可的是,机器与人类以协同的方式作为认识主体而存在,机器展现出“拟主体性”。“这里的‘拟主体性’既包括机器智能体在功能上的模仿,也包括人类主体性在机–物上的延展”[14]。以脑机接口技术为例,脑机接口是将采集到的大脑信号通过计算机加以解码并转换成可以操纵外部设备的指令,实现信息在大脑和设备之间的传递和交换。脑机接口使人的认知发生实质性改变,离开它,某种认知活动就难以进行,具有了延展认知主体的供能,这意味着脑机接口是在“延展”的向度上成就了认识主体的新的进化[15]。换言之,机器在认识层面所具有的类人性,使人类与机器之间不再是简单的认识与被认识、主体与客体等关系,而是变成人与机器间具有主体间性的结构体,两者结合形成以人–机认识系统作为新形态的认识主体[16]。这凸显出机器扮演的角色悄然发生这一重大变化:从认识论的边缘——辅助人类的工具逐渐走向认识论的中心——认识主体,形成一种新形式的非人类中心认识论。与之相应,“在知识生产领域,随着人工智能发展到基于大数据阶段,数字智能凸显了知识生产中的人机协作。正是数字智能技术的发展,在各领域带来了人机协作的知识生产范式。”[17]这暗含着人机关系的变化正在革新人类知识的生产方式,使知识生产以“人机协作”范式为主。“机器发现的知识不仅完全超出了人类的经验,也超出了人类的理性,成为人类几乎无法理解的知识。”[18]因此,从这个角度来看,机器发现的知识相较于只可意会不可言传的默会知识而言,是一种既不可意会且不可言传的“人不知而机知”的新型知识,是人类完全不透明性认识的产物。
其次,就认识客体而言,马克思主义认识论认为,客体并非是世界上客观存在的事物,而是指被纳入到主体的认识和实践活动范围内并与主体发生相互作用的客观事物。很显然,那些尚未被纳入到主体实践活动范围内的客观事物只是潜在的客体而不是现实的客体。随着科学技术的不断发展,主体实践的指向范围也在继续扩大,更多的潜在性客体成为现实性客体。以量子现象为例,它自古以来就存在于世界之中,只是局限于技术的发展,直至现代自然科学时期才成为科学研究的对象。现今,在新一代人工智能驱动科学发现——智能驱动的新范式的背景下,人工智能协同人类进行科学研究的认识对象,不再仅仅是客观世界,而是客观世界与由科学发现的对象和过程被全面表征化为的海量数据形成的“数据自然界”表征融合的客体[19]。这意味着庞大的数据集为拓展主体的认识视域奠定坚实基础,以2025年年初正式上线的DeepSeek人工智能大模型为例,它凭借数据蒸馏技术、“专家混合”架构与强化学习等核心技术,不但可降低成本,提高训练效率,而且模型整体性能变得极为卓越,从而为人工智能行业开辟出一条具有可持续性的发展路径。最为重要的是,它能够处理文本、视频与图像等不同类型的数据,同时又显示出强大的逻辑推理能力,生成高质量内容,但是,人类难以解释模型为何生成如此内容。从内部来看,大模型使用的深度学习框架中包含大量参数与诸多隐含层,人类无法清晰地把握数据在经过每一层神经网络之后,表征形式究竟发生了怎样的转变;从外部来看,整个复杂模型内部时刻处于自动化式工作状态之中,人类无从了解其内部工作原理,这些因素致使人类在认识上表现出不透明性。因之以上,人机共生系统指向的认识客体已超出人类所能够理解的认识对象的范围,以表征世界的数据化形式拓展了现实性客体的广度与深度。
最后,认知模式发生颠覆性革新。人类在不同时期通过科学研究形成的关于世界的认知模式有着明显差别,从表面上来看,主要体现为不同阶段建立起不同的科学研究范式,包括但不限于科学研究的思维方法和工具手段;而从本质上来看,则是因果性与相关性两者之间的此消彼长。第一,大数据之前的科学研究重在因果性的程度大于相关性。公元前2000年至18世纪,早期的经验科学研究范式主要采用观察和实验方法来获取对自然界的规律性认识,经由归纳法建立起事物间的因果关系。19世纪至20世纪中叶,理论科学研究范式则是以理论推导和数学模型为基础,使用逻辑推理和演绎法来解释自然现象,并且如果推理前提准确无误,那么前提与推论之间形成的因果性是确定的,具有逻辑必然性。20世纪中叶,电子计算机的出现使科学研究范式走向计算机仿真模拟阶段,主要依靠数值分析和计算机模拟来解决科学问题,通过建模仿真方法研究复杂的因果性,同时计算机模拟科学兼具经验科学和理论科学双重特征,它将经验数据和理论模型相结合用以验证因果假设。第二,大数据时代的科学研究重在相关性的程度大于因果性,但并不放弃因果性。科学发展在大数据时代步入数据密集型阶段,通过挖掘隐藏在海量数据间的规律即让“数据发声”的方式获得科学知识。相较于知道“为什么”,大数据技术更容易使人类在暴增的数据中知道“是什么”,维克托·迈尔·舍恩伯格(Viktor Mayer-Schönberger)在《大数据时代》一书中甚至直接明确提出:我们应当关注相关关系而不是因果关系。舍恩伯格的观点虽然未免有些极端,但至少显示出:数据密集型科学着重于分析数据的相关性,弱化因果性,这颠覆了传统科学研究对因果性的热衷追求。需要注意的是,相关性只是刻画事物间的表象关系,当然事物间的相关关系也有可能是虚假相关,因此倘若想从根本上实现对事物间关系的透明性认识,需要继续寻求因果性。第三,当前的科学研究注重相关性与因果性的结合。随着人工智能尤其是深度学习技术的迅速进步,人工智能逐步介入并彻底融合到科学发现的研究活动中,科学研究模式正由数据驱动范式向人工智能驱动范式转变。相比注重相关性的大数据驱动范式而言,人工智能驱动科学范式不但通过对海量数据的相关性分析提高科学发现效率,缩短科学研究周期,同时凭借自身逻辑推理进一步突破人类认知界限,而且为了降低对人工智能系统的不透明性认识,它试图构建基于因果框架约束之下的智能决策系统,是“从相关性走向相关性与因果性的有机结合,从经验主义走向了批判理性主义”[20],意欲弥合数据驱动和因果性之间的鸿沟,这对于防范人工智能幻觉,建立可信与安全的人工智能意义重大。
总的来说,日臻完善的大数据和智能技术正在造就一种以人机协同为主的新式认知框架,机器在整个知识发现的过程中成为关键的参与者,这种新式认知框架在认知效率与知识边界等方面相较于传统认知框架表现出巨大的超越性。例如,众所周知的AlphaFold2预测蛋白质结构事件,它极大地压缩了预测时间,若依靠传统实验,需花费数百万年时间才可能完成;与此同时,它自动地提取并重构数据特征,生成的知识突破了人类既有经验的限制,然而,由于此种知识的生成过程在逻辑上存在不透明性,所以还亟待人类去进行验证,一旦通过验证,人类对世界的认识能力将呈现出“跃迁”态势。