计算思维与法学的「视域融合」
作 者:许新冉 *

摘 要:信息时代的计算思维给法学发展带来了诸多挑战。计算思维包括对宏观社会规律的计算探究,也包括对个体思维的计算模拟。其核心技术路径分为符号主义与统计主义。因此,计算思维可以从多个维度与法学产生结合,形成新的问题域。尽管这种结合便于把握某些宏观的 “法学规律”,但计算操作中天然带有以均值和概率为内涵的价值筛选,这种筛选并不完全匹配法学自身侧重于个案解决的价值取向。所以,法学研究需要慎重对待计算之理由,即计算所代表的社会文化意涵。可以借助 “视域融合” 理论来妥当处理法学与计算交叉研究中 “均值 — 异常值” 的取舍困境。

关键词:计算法学 人工智能法学 信息法学 计算思维 价值衡量

纵观人类思想史,每当一股有生命力的学术思潮诞生后,其往往一如洪水猛兽般渗透扩张乃至占领其他学科的领域。上世纪 50 年代,语言分析思潮对哈特法哲学理论的影响就是一例。[1] 近几十年来,随着人类快速进入信息时代,我们似乎可以在计算思维的泛化中再次窥见这一现象。[2] 法学自然也被这一冲击所裹挟,越来越多以计算为基础的新兴方法与工具被应用到法学研究中去。[3] 但想恰当把握这些变化则殊为不易:一方面,由于学者自身的理论旨趣、经验感知与价值预设不尽相同,会从多个维度来切入此轮冲击,于是诞生了诸如 “信息法学”“计算法学”“数据法学”“未来法学”“人工智能法学” 等看上去各异但内涵紧密相连的概念;另一方面,由于技术的迅速发展变化,即便是同个概念,在不同时空下出现,对应的实指也可能完全不同。例如,“信息法学” 在早期是指法律文献的电子化研究,但后来则指技术改造法律行业的研究。[4]

不同概念的同一本质和同一概念的不同本质之间的交织,往往给研究者一种 “乱花渐欲迷人眼” 之感。因此,有必要对本文讨论的背景与对象加以交代。在本文看来,信息技术革命给日常生活带来的冲击,主要体现在社会对数字化的数据 (Numerical Data)[5] 的关注。相关从业者通过各种算法 (Algorithm)[6] 从这些数据中挖掘信息 (Information),并建构各式各样的(类)智能化系统 (Artificial Intelligence System, AI)[7],嵌入到日常生活中去。本文语境下的计算,即是指挖掘数据并通过算法模型进行加工的过程。而在此背景下,许多学者会借助一种二分结构来描述信息时代与法律的交互,即科技影响法律 (law by technology) 和法律影响科技 (law for technology) 的划分。[8] 前者强调法律运作过程被信息化的改造,如智慧司法的推进、法律科技公司的兴起等;后者强调信息化模式中的新兴法律议题,如数据确权、算法规制、智能化系统产物的权属等。但诚如苏力所言,这种 “XX 的发展对法律有影响或需求,而法律又对 XX 有规制或调整作用” 的套路表达 “往往会使我们忘记考察我们所讨论的问题本身的特殊性。”[9] 毕竟,并非任一科技的发展都能引起人文社科学者的广泛关注。以计算思维为主导的数据科学和人工智能技术定然有其独特的一面,才能形成特定的交叉研究领域。因此,本文首先对计算思维与法学交融过程进行知识社会学的梳理,通过分析计算思维的实际内涵来论述该领域形成的内在机理,并划定核心的研究问题。在此基础上,文章分别从正反两方面论述计算思维嵌入法学 [10] 中路径及限制,并指出法学和计算思维的核心差异在于前者关注个案语境,而后者关注特定概率空间下普遍现象,因此,二者无法互相取代,但可以互相结合。文章借用伽达默尔 “视域融合” 理念,讨论计算思维与法学具体的买当结合方式,重点在于如何通过对 “异常值” 的关注来对抗 “均值” 所具备之单向度的吸引力。

计算与法学交叉问题域的形成与展开

20世纪以来法学与科学的发展

对议题源起的断代直接影响着对具体问题的阐释。我们可以将法与计算结合的构想上溯到启蒙时代的思想家(如霍布斯、莱布尼茨等),但彼时其只是将 “社会本质之自然” 视作一种应具有数学(尤其是几何学)、物理学性质的设计,还停留在理论层面。[11] 只有在 20 世纪中叶以后,随着算法算力的发展,才使得这些构想有了落地的可能。而当下主流的人工智能建构思路,恰与早期启蒙思想家的构想是背道而驰的。因此,理解计算思维与法学的结合不应当脱离于相应学科的演进历程而存在。

就法学来说,20 世纪初,美国法学界掀起了法律现实主义和法律社会学运动的浪潮,前者拒绝 “形而上学的废话”,认为法学的重点是对法院将做什么的一种预测性的技术分析;后者则引入社会学的概念,如社会结构、社会分层和社会功能,来分析法律问题。这一进程使得社会学的研究方法逐渐被法律人所重视,法学开始从概念的天国走向世俗的门庭。与此同时,以美国为代表的社会学界也开始 “逐渐接受经验实证主义 (positivism) 的科学观,并且尊崇自然科学的研究策略为理想‘典范’”。[12] 此类自然科学的研究范式进一步表现为两个层面:一是用数学工具来对微观社会切片进行研究,一切经济事实都要先变成数学符号然后进行数学推理,最终将社会事实化归到整个数学体系中去;二是重视实验法等自然科学方法,社会学研究方法越来越技术化。总之,20 世纪的法学研究引入了社会学范式,而社会学研究又开始大量模仿自然科学的方法。故而,借自然科学的方法来研究法律问题,可以说是学术发展之必然。

同样,20 世纪以来,科学本身也在不断的转型。艾尔弗拉德 (Alfred Nordmann) 等人用科学的 “跨时代断裂 (epochal break)” 来形容这种变化,即科学不再是简单的对自然问题的解答,相反,越来越多需要科学去回应的问题恰恰源于科学本身的技术性应用,如全球变暖、化工污染等。故而,在理解现代科学时,更需要去理解社会、技术与 “自然” 要素之间的复杂互动。[13] 而当科学将研究视角从自然世界移向人类社会时,出现了两种路径,一是计算社会科学,该学科致力于通过大数据计算来挖掘社会运行的宏观规律;二是人工智能技术,其试图通过计算来模拟人脑的思维过程。按照乔菲 - 雷维利亚 (Cioffi-Revilla) 在世界上首本计算社会学教材《计算社会科学概述》中所言,计算范式 (Computational Paradigm) 是一种信息化的处理范式,其分为本体和方法两个层面:从本体论上看,计算社会科学强调信息处理的重要性,从信息处理的角度解释和理解个体、社会,以及二者的互动;从方法论上看,其强调通过形式化的计算、建模来理解社会的复杂性,具体包括社会模拟仿真、互联网社会实验、社会数据计算等。[14] 这也是国内对 “计算 +” 学科的常见看法,即在传统学科的研究范式中,引入数据和模型计算为主导的思维和方法。在这个语境下,计算思维主要是指丰富的数据资源 [15] 与先进的数据处理技术(往往是各类计量模型)。

而就人工智能来讲,其侧重于用数据和算法去模拟个体人的思维方式。[16] 依据具体的发展思路,可分为三派:符号主义 (Symbolicis, 又称 “逻辑主义”)、连接主义 (Connectionism,又称 “统计主义”) 和行为主义 (Actionism,又称 “控制论学派”)。[17] 对于这三个流派及其代表技术,可参考下表:

表 1:人工智能主要流派及代表技术一览
流派 代表技术或产物 当代最新发展
符号主义/逻辑主义 专家系统 知识图谱
连接主义/统计主义 神经网络 机器学习/深度学习
行为主义/控制论 机器人控制系统 强化学习

具体来说,符号主义认为人类认知思维的构成是逻辑符号和逻辑推理,因此要将人的思考过程形式化为符号、规则与运算规则,从而用计算机来模拟人的智能行为。其早期在数学定理证明上的成功使得其成为 20 世纪 80 年代的主流智能体建构思路。代表产物就是专家系统,即能从一组专门知识(如法学、医学)中推演出逻辑规则来回答相关问题的系统。但因为人的思维远非简单的逻辑推理,而且很多如价值判断之类的信息难以符号化,这些缺陷使得专家系统在 20 世纪 90 代开始式微,并直接导致了人工智能发展的第二次寒冬。统计主义则主张智能的实现应模拟人类的生理结构,即人脑的神经网络连接。该学派最早起源于 1943 年的形式化神经元模型(M-P 模型),后续罗森布拉特 (Rosenblat) 研发出感知器模型,但因其缺陷一度陷入低潮。直到 1982 年霍普菲尔网络、1986 多层感知器等多个模型使得多层神经元的训练算法成为可能。而算法训练所需的原料是数据和算力,恰随着互联网的兴起(提供海量数据)和图形处理器的发展(算力更大的芯片)使得神经网络的发展进入了黄金期,带领人工智能走出了第二次寒冬,并成为当下的人工智能的主流方向。强化学习则是关注智能体和现实环境的互动,强调智能体如何适应外界环境。而人工智能领域的 “计算”,主要讨论的是人类智能是否可以通过纯粹的数字计算加以复现。[18]

综上,在计算思维介入社会科学研究中,存在多种理解方式。从研究对象上可以分为两类,对宏观社会规律的计算和对个体人思维模式的计算。针对具体思维模式的计算,又存在统计主义和符号主义两种方式,分别侧重概率拟合和逻辑推演。

计算与法学的多元结合

也正是因为计算本身的丰富内涵,尤其在具体模型算法上的变化,使得法学与计算交叉的相关文章显得零碎且不成体系。[19] 就国内外的研究来看,似乎可以大体区分为以下几种类型的研究。首先是通过宏观计算追求社会规律的计量法学(Jurimetrics)。这一概念由里・洛文杰(Lee Loevinger)所提出,即 “通过收集大样本数据,对具有数量变化关系的法律现象进行计量研究的独立交叉学科。”[20] 国内 “计算法学” 这个概念的早期版本也侧重于此点,即 “计算法学是具有数量变化关系的法律现象作为研究的出发点,采用统计学、现代数学、计算智能等技术方法对相关数据进行研究,旨在通过实证研究评估司法的实际效果,反思法律规范立法的合理性,探究法律规范与经济社会的内在关系。”[21] 无论是这个定义,还是与之关联的 “法律统计学”(Legal Statistics)[22] 等概念,都透露出浓厚的社会实证法学思想的影响,而定量研究作为社会科学基本研究范式之一,其在中西方学术界和法学领域的历史其实相当深厚。

根据叶启政教授的考证,早在 18 世纪的欧洲就已开始使用量化的方式来对社会现象进行研究,如孔多塞在法国大革命期间即使用数学模式来研究投票行为。[23] 到了 20 世纪,随着美国社会学越来越讲求 “实用”,受自然科学的影响,统计量化方法在美国取得主导地位,其中自然包括对法律现象的研究,例如芝加哥大学的普里切特(Pritchett)通过构建计算模型分析 1937-1947 年美国最高法院的判决来研究法官政策偏好对判决结果的影响。[24] 在这样的知识背景下,“计量法学” 的出现也就不足为奇了。国内法学界也有相关的研究基础,[25] 故同样基于量化数学思维的 “计算法学” 就借着 “社会实证法学(计量法学)” 出现在中国法学界的面前。但需要指出的是,尽管 “计量” 和 “计算” 在中文语境下可以让人展开丰富的联想,甚至可能被视为同义词,但是 Quantitative 和 Computational 并不完全在同一个纬度。“计量” 所解决的主要问题是探求社会现象之间的因果联系,“计算” 所解决的问题还包括通过数据与算法去模拟智能体的行动。从这个意义上说,“计量” 的最终判断与执行权都在于人,而 “计算” 则是试图复刻出这样一个能判断与执行的 “人”。不过,尽管二者存异,但因为计算机无法处理数字外的任何输入,所以需要我们要对社会现象进行测量与量化后才可建模推理,因此量化领域的相关研究可作他山之石以供参考。

这种模拟智能体决策的计算思维与法学的结合被称为 Computational Law(也即国内计算法学的后期版本)。这一概念是由斯坦福大学的迈克尔・吉勒赛瑞(Michael Genesereth)所提出,其将计算法学视为法律信息学的分支,主要研究法律推理的自动化,落足点在于新技术对法律行业的改造。[26] 除此之外,尚有 Computational Jurisprudence、Computing Law、 Computer Law 等表达,学界已有全面讨论,在此不作赘述。[27] 但从相关讨论中不难发现,国外学者在论及计算法学时,往往将其作为法律信息学(Legal Informatics,德文 Rechtsinformatik)的下位概念或与之相对的概念。按照新近的研究,法律信息学是指由 “法律技术专家” 这类新兴工程师作为主体,研究科学技术如何影响法律行业。[28] 整体来说,国外的计算法学是在法律信息学基础上不断发展而来的一个新概念,更侧重技术对具体法律操作流程的改造,例如合同的自动化审查、自动生成等。

因而,如果用 “计算法学” 来统摄法与计算研究的话,其在不同时空下的面向是不同的,在国外早期,其指代的更多是法律自动化(即 “信息法学” 或 “人工智能法学”);在国内早期是指法律量化研究(即 “计量法学” 或 “法律统计学”);当下学界则纳入了法律对数据和算法的规制部分(即 “数据法学” 和 “算法法” 等)。

计算与法学交叉问题域的展开

那么,如何把握这种多元且复杂的概念交叉呢?笔者认为,与其早早定下一个新兴领域的边界,不如先采用一种务实的视角去收集整理该领域中涌现的、亟待解决的问题,采用一种 “问题史的方法”。[29] 如此,在 “计算” 和 “法学” 的磨合中,“问题” 作为穿梭不同领域的导游,将数据、代码、公式和法律活动串成一片 “法与计算” 的问题域,并可以通过对某些核心问题的把握与反思,逐渐沉淀出 “法与计算” 交叉研究的疆域。

就核心问题而言,其肇始于计算思维对法学的冲击,如前所述,此种冲击的丰富性在于计算思维本身的多元内涵。从计算本身侧重宏观社会规律和个体思维来看,其与法学的结合具体表现为这两个问题,即 “法律作为一种社会现象,其内在规律能否通过计算的方式加以把握” 和 “司法裁判作为特有的人类思维模式能否被计算的方式加以复现”。而要讨论这两个问题,则需要先讨论一些前置内容。

首先,如何界定 “把握 / 复现” 的标准或程度?就如有强弱人工智能一样,在讨论 “法律人工智能” 时,“具法律通识能力的智能体”(Generalist Agent) 是否该被视为讨论的对象?就笔者看来,以目前的技术水准,尚无法实现一个能完全取代人类的机械智能体。但在算法模型的加持下,其足以在某些领域 “以假乱真”。[30] 也正是因为有这些单点上的突破,使得人类开始正视人工智能的问题。就此而言,讨论这些算法模型与人类思考方式在底层逻辑上的同异之处有助于我们把握这个问题。因此,问题的重点就不在于是否真的能 “把握 / 复现”,而是技术思路中蕴含的可能性,即某些技术有没有可能达到实现 “把握 / 复现” 的目标。例如,因为机器学习技术的突破,当下在人工智能领域统计主义优于符号主义。但符号主义的发展方式也可能蕴含着下一个可能的突破,从而夺回人工智能技术的主导权。

其次,是对计算思维处理具体任务的理解。现已有了成熟的文本识别和语音转写技术,并运用在司法审判中。但这些技术并非是本文的讨论对象,因为其实质上处理的是图像或音符,仍旧是自然世界,而非人类思维。下文所欲引申的是法学研究 / 司法论证中计算对人之思维的模仿。当然,关于模仿的具体层次,则可以根据数理水平的高低分成三类:(1)不同的方法与模型能解决何种问题,产生何种效益;(2)人工智能方法如何建模并选择合适的数据与算法来解决问题;(3)这些算法模型的限度有哪些,如何优化和突破。

最后,是有关法学研究 / 司法论证中人之思维具体内涵的讨论。考虑到文章主旨,并不直接涉及法学界有关 “法律人思维” 的争议。[31] 而是假设这种思维存在,它是如何被呈现 出来的。尽管正常人类有理性和非理性两种思考路径,但就法律人呈现的思维过程而言,其给出的研究判断或司法裁判往往要经过 “法律理性” 的包装(即便起点可能是非理性的)。这种 “包装” 包括使用法学术语、符合法律规范的逻辑、采用法律论证的结构等,并最终要就议题得出一个特定结论(往往是合法 / 非法的)。而计算的要点,就在于通过各种方式来模拟法学知识生产的过程。

法学的可计算性探究

法学的任务与计算的路径

如前所述,计算思潮给学界带来最重要的冲击就是方法论上的革新,给法学带来的拓展主要在于重新思考法律知识的逻辑、结构(形式化)与量化(数字化)。又由于法学本身就较为注重逻辑与形式化,故而当代法律人工智能的一个构思进路仍然是更高阶的专家系统,或者说建构某种法律知识图谱。[33]此外,法社科研究因借用社会学方法,则更为关注量化的部分(不过此种量化的方式未必等同于人工智能的量化模式)。[34]但二者在计算化过程中面临的实际问题都是:给机器输入足够的数据化事实,机器能否输出判决结果以及论证过程。在该过程中,机器需要提取并分析信息,进而匹配相应的模型进行计算,并输出论证结果。进一步而言,所建构的法律计算模型需要满足法律推理、法律解释和论证、对判决结果的预测三个任务。

当下,让计算机器理解文本知识主要有两种路径:思路一是抽取技术(Extractions Methods),即从文本中识别主体、关系和逻辑结构,即先通过自然语言识别(Natural Language Process, NLP)或数据挖掘等技术提取主体和关系,在通过知识图谱(Knowledge Graph, KG)来组织和表现主体间的逻辑关系;思路二是通过语言预训练即通过大量的文本语料训练一个神经网络大模型,文本中的知识被隐含在参数化的向量模型中。[35]简言之,前种方法有结合特定领域知识逻辑化的过程,后者则无。

基于文本理解方法的不同,法律解释和推理的思路也不同,可以进一步分成基于制定法的推理模型、基于案例集的推理模型、预测法律结果的模型和法律论证的计算模型。[36]其中制定法、案例集的推理模型和法律论证的计算模型都属于思路一,预测结果则属于思路二。[37]但显然,我们构造智能法官的落足点并不仅是给出判决结果,而是需要给出此种判决的理由。但显然,法律有自己的论证范式,是一种“受制于特定的规则与论证形式的说理活动”,38而人工智能领域则有着更多元的论证范式。

兹举一个简化的例子,假设嫌疑人 A 犯了强奸罪,事实清楚,证据确凿,无其他加重或减轻情节,法官 B 判处其 8 年有期徒刑。法官所依赖的是《刑法》第 236 条和涵摄的推理过程。但如果按照机器的逻辑去得出某个量刑结果,一个思路是统计全国所有类似的强奸案件的量刑年份求均值。由于这些案件的量刑一定在 3~10 年这个区间内的,统计均值显然也在此区间内,我们假设均值是 5 年。那么外观上看,二者都是符合刑法中对强奸罪量刑区间的规定,只是一个源自法官的推论说理(或者说自由裁量),一个源自过往案件的平均统计。那么,5 年和 8 年到底哪个更加科学?我们无法得出确切的答案。毕竟,法官也可能存在所谓的“司法潜见”,39这就迫使法官在给自己的判决做出说理时给出更加精细化的论述理由。但我们采纳法官的理由而不是机器的理由(或者说计算的理由)的理由又是什么?为了更好的讨论这些理念上的问题,本文先对机器的理由加以探讨。

符号主义计算:法律知识图谱与法律论证模型

出于法律知识和实践活动本身的特殊性,早期法律人工智能模型比较偏爱逻辑和结构化特定法学知识。[40]最早的法律专家系统就是通过抽取制定法结构或判例结构来设计。[41]如前所述,专家系统是符号主义计算的产物。这种计算通过引入模态逻辑、道义逻辑和模糊逻辑等逻辑学新兴分支的理论,来达到价值判断的目标。[42]此类逻辑学新兴分支的特色是它们均可以视为某种类型的多值逻辑(Many-Valued Logic)。[43]在传统逻辑语境下,逻辑推理是封闭且确定的,即推理真值只能为 1 或 0(代表是与非)。而多值逻辑的创始人扬·卢卡斯维奇(Łukasiewicz)则通过引入“可能”作为第三类真值,拓宽了逻辑判断的边界。[44]同样,模态逻辑也是通过将“必然”“可能”“必须”“允许”等模态词引入逻辑体系,通过牺牲一定程度的确定性,来扩大逻辑的应用空间。这也对人工智能的应用发挥了很大作用。[45]逻辑学确实在人工智能研究中扮演着重要的角色,但从引用量和应用上看,其影响力在逐渐降低。[46]

在当代,符号主义的新进展是知识图谱技术。相较专家系统,它没有那么依赖人工,数据成本更低且能处理的数据量更大,往往以千亿或万亿计(对比传统专家系统的百万级规模)。具体来说,法律知识图谱类系统的建构需要满足下述任务:法律知识的结构化表示 (Knowledge Representation)、相关知识的存储与查询、法律知识图谱的建构与推理和法律知识图谱的应用。其中,除了数据的存储与查询是纯粹数据库技术的问题,其他几个任务都可以有特定法律知识的参与。结构化形式大体有法律 XML 语言、语义网络与 NLP 几个路径;法律知识图谱的建构与推理则与法律论证的计算模型(Computational Models of Legal Argument)密切相关;法律知识图谱的应用包括构建法律对话模型等场景。

考虑到篇幅问题,本文集中讨论法律论证的计算模型这个侧面。法律论证大体涉及演绎、归纳、权衡和类比几个维度,对此,需要经过三个步骤:

  1. 提取法律法规中构成要素并命题化和标签化(S1、S2……);
  2. 通过逻辑符号(即逻辑运算符和连接词)表达这些法律命题标签之间的关系;
  3. 关系描述后,将标签还原为法律文本。
其中逻辑符号的运算则需要将其向量化,即将离散的符号转为连续的向量并进行建模处理。但这种论证逻辑的建构都建立在现实的法律规定之上,需要人工进行绘制,是“有多少人工就有多少智能”的真实写照,也正是过于依赖人工带来的数据成本限制了法律知识库的规模和范围。更为重要问题在于,法律语言作为一种日常语言,其具有语义上和句义上的歧义和模糊性。这也是司法辩论得以进行的原因,尤其对于疑难案件来说,很可能存在多种逻辑上行得通的解释。因而,此类模型所能完成的工作至多只能是挑选出多种可能且既有的论证思路,而最终的决断仍然需要权威机构的选择。

统计主义计算:基于机器学习的预测或分类模型

基于数据集的预测基本是各类统计方法和机器学习方法[47]在法律领域的运用,该种方法与前种方法最大的区别在于,其并不关心所谓的“法律人思维”,而是把法律作为一种社会现象去研究,通过提取案例事件中相关表征特征,进行统计运算的方式。该种操作的重点是找到相应的经验资料,并将这些经验资料转化为一种可操作的形式,即“将‘概念’转化为可观察且可操作化之具外在性(甚至指标化)的变项作为探讨的对象”。[48]其更多关注的是司法的社会运作机制,而不是法条或判例中的构成要件。故而其最难满足司法可解释性的需求,甚至机器学习模型本身的一般性解释都较为困难。

简要来说,机器学习是使用数据预训练计算模型来完成一项或多项任务。不同于对某种万能算法的想象,真实的机器学习领域中,大部分工作都是将一个或多个算法组合来解决特定的任务。其大体可以分为监督学习和无监督学习两类,对应着预测和数据探索两个任务。监督学习是指由预测变量(如法官判案的量刑习惯)和结果变量(最终裁判的量刑结果)来创建模型,其可以预测新的变量(新的案件)并预测其结果(新案件的判决)。若预测的结果是一个具体的数值(如具体的刑期),则为回归模型,若预测的结果是一个类别(如是否认定了防卫过当),则为分类模型。在模型与现实的匹配过程中不断调整参数来减少预测误差,直到误差可忽略。具体的方法有随机森林、朴素贝叶斯分类器、支持向量机、 k 近邻和梯度下降等。每种方法各有优劣,但是统一都需要数据科学家去决定预测变量和 结果变量,也就是需要人的监督,进而调整模型排除过拟合等负面情况。

无监督学习则是只有数据,没有对结果变量的标记,需要模型自己去发现数据中的结构与形式。可能的任务如给法官找到所有与其正在处理之新案例相似的案例。当然,其所面临的主要问题也是如何定义“相似”,这需要我们去提取相应的元素(法学术语或可理解为“构成要件”)对其进行分组,而可能的分组集合理论上是无限的。这使得此类任务并没有一个标准的参考答案,即使是专业的人类法官也会对一些结果有不同意见。因此,验证无监督学习系统比验证有监督学习系统更困难,就好像裁判结果很难让所有人满意一样。具体的方法主要是各种聚类方法,如层次聚类、密度聚类等。

尽管此类模型也会考虑法律中的规范因素,但并不限于此,至少其不会遵循法律的论证逻辑。但正如一些学者指出的,“对论证理论最好的检验就是其预测未来的能力”。[49]在实践中,律师也会面临客户要求其做出各种预测,如法官判决的结果、不同请求权基础带来的法效果等等。而不少数据科学家们也在尝试从数据的角度去回应这一问题,[50]并催生了许多法律科技产品,如最近的 Lexis+AI™️ 等。

计算与法学的范式差异

计算思维中的不确定性

尽管符号主义和统计主义在外观上各行其道,但它们仍有一个隐秘的共同点,即均通过引入不确定性来拓展计算的适用边界。符号主义通过模态逻辑/道义逻辑来实现,而统计主义则是基于自身概率的特性。又因为统计主义在当下的影响力更广,例如最近大火的 ChatGPT 亦是通过大规模数据的对社会规律的暴力拟合,其并没有完成复杂的自主逻辑推理(其推理的表征是通过监督信号而来,通过人力标注对话中的偏好来辅助其学习,即 RLHF 算法),[51]且符号主义需要更新的技术突破,所以本文便集中审视统计主义可能存在的问题。本文以正当防卫是否过限为例,构建一个机器人法官,来更为具体地阐释相关问题。首先需要将“防卫限度”这个议题转化为可测量的变量,如下表所示:

表 2:防卫因素提取表[52]
防卫限度认定因素 因素
行为限度认定因素 双方持有武器的危险程度
双方进攻部位
双方生理条件(性别、年龄、体质、技能等)
双方行为强度
结果限度认定因素 双方轻伤、重伤、死亡人数
其他因素 防卫者是否有准备
防卫者是否位于家中
事发地点是否位于家中、办公室等私人空间
侵害者有无事先威胁、恐吓等行为
防卫者武器是否可以选择
防卫者有无退避可能性
防卫者是否为了保护财产而防卫

再进一步把相关裁判文书里的文本信息转化为数字,例如:我们可以用“赤手空拳=0”;“钝器=1”;“锐器=2”;“火器=3”的方式来划分危险程度。最后就会得到一张纯数字的表格,再用这些表格去设计统计模型来验证初始假设(如行为限度认定因素与防卫是否过限的认定结果是否最为相关)。[53]如笔者采用了回归模型去分析变量的相关性,采用了支持向量机和随机森林模型进行是否过当的分类。试验机器能否自动识别哪些情况下是正当防卫,哪些不是。为行文简洁,具体模型的运算过程和结果可参见本文附录部分,但仅从结果上说,机器分类的准确率已经很高了。

在这个流程中,存在着诸多可供深入思考的地方,如:

(1)对非物理性因素的测量是否可能。要言之,社会科学所研究之对象都具有非物理性的特征,[54]对其量化更多依靠主观概率。主观概率固然有其合理的一面,但其在某种程度上也是一种对非物理事物的“武断化”编码。如上文中笔者为何可以用 0 来表示“赤手空拳”、1 来表示“钝器”、2 来表示 “锐器”,这是否必然意味着锐器比空手更危险?但这种方法的好处在于其可操作性,但也同时绕过了对意义的追问。

(2)测量领域内的逻辑如何用以解释社会现象。例如,在社会统计学者看来,测量后 的数据可以按尺度分为定类、定序、定距、定比四种类型。[55]简而言之,数字在不同尺度下,具有的功用是不同的。在定类尺度下,其所起的作用是标签或分类;在定序或定距尺度下,其所起的作用是表示数据序列和程度之间的差别;在定比尺度下,表示所统计之物性质的数量关系。有些情况下,数字也可能兼具这些功能。但本质上,数字起着何种社会意义之功能,还是看使用者如何阐释。例如,上述对武力程度的划分,既可以是出于区分的目的,用四个不同的数字区分不同的行为,也可以是认为赤手空拳的危险性最小,钝器、锐器的危险性逐步累加。总之,量度性质的赋予因问题的不同而改变。[56]这也就意味着,选择何种统计模型去描述社会现象,基本是一个仁者见仁的事情。

(3)由测量计算衍生的数据是否存在度量单位,以及此种度量单位的性质和意义如何。衍生变量是指不同性质的度量数计算而来,如密度是由重量除以体积而得。而社会科学里的很多数据都属于无法直接测量,通过其他外在特征衍生而来的数据。例如,“犯罪可能性”的文字表述可能是一个人犯罪的概率,但这似乎只能通过他过往犯罪的次数、家庭成员有无罪犯、经济地位等来辅助观察得出(假设我们相信这些可观察的表征与犯罪可能之间存在关系的话)。那么,一方面,这种通过表征去推测的量化操作的可行性与合理性都有待商榷;另一方面,即便我们得出 A 的犯罪可能性是 25,B 是 100,并将其理解成 A 的犯罪可能是 B 的 4 倍的时候,是否是下了一个类似“60 岁的年龄是 15 岁的 4 倍”的没有社会意义的推断呢?

从上述讨论中不难看出,此种研究也并不能保证研究结论的确定性。即便是流行于社会学界较为高级的因果分析模型(如结构方程模式),也无法只从各变量间统计相关系数的关系层次来获得有意义的理论阐释。对于哪些变项应该纳入回归方程、使用何种函数等问题,也很难从数据本身获取答案,具体的计量模型如何发挥效用,还是有赖于研究者的判断。[57]实际上,在进行统计分析时,最棘手的问题就是判断哪些因素是潜藏在相关性之下的混淆因子。

“均值”与“个案”:计算与法学的思维差异

上文并非是要说明计算思维的不可靠性,实际上,现代统计学以及人工智能领域有着充足的技巧去控制和处理这些问题。但这也恰恰说明了,通过计算思维得出的结论是一种通过特定操作确定后的不确定性,这也是其无法取代人类判断的原因。尽管人类社会也充斥着不确定性,且也会使用各种方式去减少不确定性,但这些方式并不完全按照计算思维的安排而运作。毋宁说,人类的处理模式正是计算思维所模拟的对象。在使用各类智能产品时的“似是而非”感也源于此。回到前文例子,即假设嫌疑人 A 犯了强奸罪,事实清楚,证据确凿,无其他加重或减轻情节,按照《刑法》第 236 条,A 应当被判处 3~10 年有期徒刑。此时,通过统计全国所有相同案件刑期的基础上(如下表所示),得出此类案件的平均刑期为 5 年。甚至可以进一步统计出众数为 4.5 年,中位数为 4.75 年,并让机器法官随机给出这几个刑期判断,就可以达到某种“形似”的审判标准。

表 3:假设的刑期数据集
罪犯 1 2 3 4 5 6 7 8 9 10
刑期/年 4.5 5.0 5.7 4.5 3.3 4.3 6.0 6.7 5.5 4.5

但这种判断无法达到“神似”的原因在于其是一种剥离语境后的产物,这种剥离是通过“均值”[58]与“概率”这两个核心统计概念完成的。要言之,通过某种统计式的提炼,我们可以得到一些“是”的值。又因为概率的存在,其在具体值上提供一定的游离空间,使其“似”。就像这个例子中,我们让计算机法官给出的刑期范围是4.5~5 年,就足够以假乱真。但它毕竟不是真的法官,因为在个案研讨中,法官学者面临的都是具体情境,因此有着更多的“潜见”来适配具体个案。例如,法官可能考虑到辖区内近期强奸案多发而在自由裁量权的范围内判得更重,而不采用所谓计算后的刑期均值。法官也可能考虑到该强奸案中存在“没有证据证明的仙人跳“行为而判得更轻,从而也不采用计算后的刑期均值。

实际上,这种计算思维本身非常类似于法学中“类型化”的思维。从计算的视角看, 可能存在千万个变量影响一个判决的结果,统计就是要从这些变量中挖掘出有价值的变量。而法律思维诞生的过程,就是在经验和逻辑推演的基础上共同统计出的一些重要变量,并加以成文化,司法辩论则是在讨论这些重要变量的影响权重,以及要不要引入新变量等。因此,律师在打官司时更多只考虑法律下的构成要件,不会像波斯纳(Posner)所言的去关心法官早上吃了什么(尽管早餐的好坏可能真的会影响法官的判决)。但计算思维的独特之处就是在于其把早餐、天气、场地等各种因素全部考虑进去(略有夸张),并通过统计权重来解释这些因素对判决的影响。但在这个过程中,计算不天然具有某种伦理或价值上的正当性,因为其中的诸多操作过程都渗透着人的主观价值判断。选择何种概念、赋以何种属性与变项都具有特定的价值意义。所以,不管是法律人还是统计学家去建构法概念或法计算模型,其本质上都是在相互冲突的法价值间加以权衡,具体结论如何,依旧有赖于操作者的价值判断与选择。当然,或许有人会论争说现实中的判决尽管不是“同案同判”,但也是“类案类判”,不会因为价值冲突而出现完全相反的判决。这是因为如韦伯所言,法律人享有着一套共用的话语体系,“法学的规范性不来自于神学和哲学意义上的超验性法则或 第一原则,而是来自于某种群体共识。”[59]在某种价值共识内的主观判断,即便偏差,也是有迹可循的。统计模型所做的,无非是对这种价值取向的宏观把握。它本身并不代表着现 实的因果关系,也不足以作为秩序本身。其犹未欠缺的,恰恰是对异常值的处理。在统计的视野中,新兴的个案(如许霆案中对 ATM 机的认定)是均值下的误差,直接忽视就可以,剩下 99%的案件依旧能正常处理。但法律思维的独特性恰恰在于其针对个案的创造力,以及对现有价值的反思和再创造的能力,往往就是通过 1%的个案翻转了即有的规则体系,推动立法的进步。这是计算思维所无法替代的。

其次,算法结构本身就内嵌着社会的结构,所谓的“算法霸权”无非是将社会中已经存在的歧视因素换了种形式给表现出来并加以固化而已。当我们利用算法模型去计算出一个判决结论时,从社会文化内涵来说,可以说是用社会的共意,或者过往司法数据的共意去得出一个结论。在简单案件中,这种模式显然是可行且的高效的。但在复杂案件中,此种共意一定会优于法官的判断么?似也未必。激起舆情的司法判决本就可能会导致两类结果:一是被舆情所反噬,二是推动某种社会风气的改革。换句话说,计算的结论如果与法官的意见不合,其本身蕴含的是一个老生常谈的问题:多数人的观点就一定正确么?实际上,司法数据的众意、互联网用户的众意与法官集体的意见之间的价值位阶,往往是一个不断博弈的变化过程,没有一个定解。而这也是我们比机器更具优势的地方,即人可以制定规则并赋予价值,机器只能随着我们赋予的价值去迭代。计算带来的真正挑战在于,如何论证我们所选择之价值相较于计算本身蕴含之价值的优越性,这也是法学家需要承担的新论证义务。恰如耶林所言,法学的科学性是通过“对正义富有义务感、对特定法持批判态度的法官”以及“能将法官在个别案件上展现的灵巧与沉稳予以概念化呈现的理论家”[60]来实现的。

视域融合下的法与计算

如果说上文关于计算思维局限性与法学独立性的论证可以被接受的话,那么二者在保持各自特色上的进一步结合也就有了新的思考。计算思维不是不注重异常值(法学术语:个案),而是更关注均值;法学也不是不关注均值代表的类型化思考,只是也相当侧重个案分析。因此,在讨论二者结合时,不能只秉持一种 “法学为体,计算为用”的思路,即只是将计算方法作为法律或法学研究的工具。这极易使法学的计算研究陷入到套用数理模型的同质化困境中,也容易使得相关研究陷于“均值”所代表的普遍性幻境中中无法自拔。

相较来说,采用伽达默尔的“视域融合”之法,将二者混纺交织,能够生出更多新意。所谓“视域融合”指的是在两种不同的视域之间(本文指的是计算思维和法学思维),我们难以完全放弃既有的视域进入另一个视域,也不能单纯把另一个视域纳入自己的视域,这 样只会造成双向的误读。我们需要的是,从已有的视域出发,在同另一视域的接触过程中不断审视既有视域中的成见,从而扩大自己的视域乃至两个视域相互融合。[61]在这个过程中,需要遵循一定的条件和规则(即所谓学术研究的范式),对社会现象进行描述,来揭示这些事实间的意义关联,并达成“意义阐释与因果分析”的目标。 [62]从这个角度来看法学研究,不难发现法学所做的就是先从社会事实中提取出一些规范性因素,从这些规范性因素中进行逻辑整合,形成规则体系,再将这个规则去应用到现实生活中去。大量的部门法讨论,都集中在后两个步骤,即部分法的内在体系建构与司法适用的过程。

而在传统法学的视域中,学者们对于社会事实的法律化叙述,持有着特定的共识与信念。或者毋宁说,其追求一种法律的“体系整体观”,强调法律及内嵌其中价值的普遍性与确定性。在这种思维模式的主导下,其面对新的社会事实时,首先的反应是调整或适用既有的规范体系,来规制新事物。如对算法可解释权的提倡,其所设想的场景是在软件开发者与用户之间通过对算法的公开来增强二者的对等地位。但此种法律关系中至少还存在着应用下载商店平台的提供者,软件算法的审核完全可以通过国家确定特定的标准,并交由平台负责者统一审核决定是否上架。毕竟用户在使用软件时,很少会花费精力对对比各个软件的开发算法逻辑,以及也不具备相应的知识去理解对算法的解释。这使得各个软件的登陆界面的“隐私政策”基本成了一个必须同意的形式文件。即便其中有着对用户不利的条款,用户也难以发现或为了使用软件而不得不同意。至于特定的监督需求,则可通过第三方审核机构来公开相应的算法解释。因此,在信息时代的法律建构中,重点仍是从社会事实中提取规范要素,但这种提取绝非是对既有规范的简单挪用。

此外,计算思维本身也带来了方法上的革新。好的量化分析与模型建构的过程本身就 在向我们提供着关于法律的见解,同时也提供了一种标准化的操作模式,这一标准化模式 让原本诸多相互矛盾的理论有了对话的可能。如其他学者若对于笔者的操作产生质疑,就需要对“正当防卫防卫限定因素”这个母变量的定义和子测量指标进行讨论,从而逐步达成共识,反过来推进理论的发展。因而,数学语言与逻辑符号的精确性,本身就可以为我们排除很多模糊的争论。尽管前文的讨论有在为计算祛魅的意图,但更重要的是,在当代社会,我们业已可以通过恰当的计算得出一个结论(无论是立法建议还是司法裁判),与之对应的主体必须像认真对待权利一样认真对待计算——因为计算的结论有计算的理由,且这种理由有它的意义与价值。那么,我们认可或拒绝这个计算之结论的理由是什么?是计算本身的缺陷还是人文价值的必要?则需要更多的讨论。计算本身就有着“均值/社会共意”的社会意涵,只是这种价值并不因其数字化或模型化就具有天然的正当性,还需要与立法研讨和司法裁判中在个案中展现的灵巧与沉稳相呼应。这也正是“视域融合”的研究策略所彰显的,法学家在新的时代必须认识到自己既有知识结构所带有的价值成见,并对这些新兴社会事实有了精确且细致的理解后,对新的社会关系的再法价值化才有可能。

最后,法律的发展并不限于技术进步,而更在于价值的重构。当下,数据、算法和智能化系统正在积极嵌入到社会秩序的建构中去,影响着法律的形态与适用。换句话说,社会形态的变化本身就呼应着我们对法律形成、法的基本范畴、法律作用和法律适用的再思考。[63]需要指出的是,科学本身就有着意识形态的属性,这也是西方马克思主义者研究的重大课题之一。[64]更具体地说,在西方所流行的后现代思潮中,本身就蕴含着对科学的批判与反思,这些科技的负面例子包括比基尼岛、颅相学等。但在中国,对科学技术泛滥后负面效益的深度批判较少,至少在宏观层面上还是强调科技对发展的推动力。[65]人文社科的学者更应该意识到这一点,这也是所谓“新文科”建设的题中之义,即“新文科”并不是“新技术”和“文科”的简单叠加,而是借助现代科技重塑我们的价值观念和思维体系,更好地回应和阐释科技与人文社会科研之间的逻辑关联。[66]例如,在科学发展的过程中注重道德伦理以及法律上的审查,能有效减少科技滥用的负面新闻(如基因编辑)对科学本身正当性的消耗,以免陷入欧美后现代思潮中对科学本身虚无态度的困境之中。而这,就是法学能为计算视域所做的补充。

结语:“异常”作为计算思维之盲区的理论意义

由于计算思维背后是各个具体学科,本文的讨论必然会挂一漏万。但大体而言,计算思维的核心是通过预设某种“社会结构”的存在后,使用各类数理模型去验证此类结构的真实与否,并在概率允许的偏差空间内传递出一定的“自由”差异表达。进入大数据与机器学习时代后,或许在某些方法(如无监督学习)上摒弃了这些预设,但诚如前文所提及的,这些价值预设在操作的前置或后置流程中总是会悄无声息地渗入其中。这往往导致采用计算思维去处理宏观结构性规律时,个体的差异性被当作某种“异常值”,进而被有意无意地忽视了。法学作为一个处理具体个案的学科,自然会在一些方面与此种重视均值的计算思维产生抵牾之处。

需要注意的是,这种抵牾的后果并非是一种思考方式压倒另一种思考方式,而更多的是要在两种思考方式之间加以权衡。由此而言,可能的风险反而是出于便捷性的考虑,人们开始向某类“均值”式的表达去靠拢,即人越来越像机器。此种“单向度发展”的解药之一在于通过恰当的关注和把握“异常”,在必要时,以“异常”来反转所谓之“均值”的压迫。“视域融合”作为一种调和式的交叉方式,有助于避免非此即彼的思路,更好地发挥法学思维和计算思维各自的作用。可以预见,随着技术的发展,计算与法律之间的价值矛盾在现实中不仅不可避免,反而可能会愈演愈烈。不过此种纠缠在个案中究竟该如何编写,就留待每个具体情境的回应了。


* ^ 许新冉,中国社会科学院大学硕士研究生。

  1. ^ 谌洪果:《通过语言体察法律现象:哈特与日常语言分析哲学》,载《比较法研究》2006 年第 5 期。

  2. ^ 从计算社会科学、计算政治学、计算法学等术语的诞生可以一窥计算思维对人文社科领域带来的深刻冲击。

  3. ^ 有学者专门整理了计算方法在法学中的实践应用,参见 Jens Frankenreiter and Michael A. Livermore, “Computational Methods in Legal Analysis” 16 Annual Review of Law and Social Science 39 (2020).

  4. ^ S. Erdelez and S. O’Hare, “Legal Informatics: Application of Information Technology in Law” 32 Annual Review of Information Science and Technology 367 (1997).

  5. ^ 数据通常以数字的形式出现,但不尽然。例如,许多原始数据会以图片、文字或声音讯号的方式出现,但它们在被测量时,会转化为数字表示。“数字化的” 这一限定即是对 “量化过程” 的强调,而后者可以说是整个信息时代的基石。See David J. Hand, Statistics: A Very Short Introduction, Oxford University Press, 2008, pp. 4-5.

  6. ^ 对于信息和数据的具体定义与位阶关系,存在着一定的争议。本文认为,数据本身是价值无涉的数字(不过 “数字化” 的过程可能会引入价值判断),信息则是对数据处理后的结果。信息能帮助使用者消除不确定性,做出决策判断。See EJ Novotny “Transborder Data Flows and International Law: A Framework for Policy-Oriented Inquiry” (1980) 16 Stanford Journal of International Law 141–80.

  7. ^ 对于智能化的定义亦不尽相同,有的定义强调其对人类思考或行为的复现,有的定义强调其需作出理性或正确的判断(因为人的行为有非理性的一面)。本文更多强调的是其 “能做正确的事情”,即从效用上判断其所做的事情是有益的。之所以加上 “类”,是因为现在主流的人工智能发展方向,即机器学习,是对人类行为的一种暴力拟合,其产品没有独立逻辑判断的能力,而有相当一部分学者坚持 “智能化” 应当包含 “独立的逻辑推断”,故而加此限定。参见〔英〕斯图尔特・罗素:《人工智能:现代方法》,张博雅等译,人民邮电出版社 2022 年版,第一章。

  8. ^ 例如,熊明辉教授指出的 “法律人工智能” 与 “人工智能法律” 的区分。申卫星教授也采用过类似划分,不过其把 “基于科技的(法学)研究方法” 单独作为第三条路径,强调了法学和法律的区别。参见熊明辉:《从法律计量学到法律信息学》,载《自然辩证法通讯》2020 年第 6 期;于寅虎:《加快计算法学学科建设助力数字经济发展》,载《网络安全与数据治理》2023 年第 1 期。

  9. ^ 苏力:《法律与科技问题的法理学重构》,载《中国社会科学》1999 年第 5 期。

  10. ^ 如前注 8 所言,有学者认为科技对法律和法学的影响应该分开来看。其理论依据可能是德式的 “法学方法” 和 “法律方法” 之分,即法学方法是研究和预设法律的方法,主要着眼于什么是法律的本体性理论,形成一定的法律观;法律方法是应用法律的方法,致力于实现既有的法律和生成新的法律。因为纯粹的法律方法是一种特有的逻辑思维,本文在论述人工智能算法的逻辑路径是会涉及法律方法研究的讨论,但考虑到文章主要是从宏观角度对信息时代法之现象的梳理,故强调法学而非法律,后文也不做进一步的区分。参见邓永流:《法学方法抑或法律方法》,载《法哲学与法社会学论丛》2003 年第 1 卷。

  11. ^ 一个常见的例证是把莱布尼茨视为 “计算法学” 的鼻祖。但一方面,这样做有把莱布尼茨思想窄化的风险,逻辑推理机主要是早期莱布尼茨的法哲学思想;其次,早期莱布尼茨对这个问题拟采取一种逻辑推理机器的解决方式,但这种思路恰恰与当下主流的人工智能方法,即基于统计的相似拟合,是背道而驰的。See Huntington Cairns, “Leibniz’s Theory of Law” 60 Harvard Law Review 200 (1946).

  12. ^ 叶启政:《实证的迷思:重估社会科学经验研究》,生活・读书・新知三联书店 2018 年版,第 2 页。这里需要指出 “实证” 一词在法学领域的不同含义,即分析实证法学和社会实证法学,前者落足点在法律规则本身,后者则偏重影响法律规则的社会因素。下文会使用 “分析实证法学” 和 “社会实证法学” 加以区分。参见沈宗灵:《现代西方法理学》,北京大学出版社 2017 年版,第 111 页;侯猛:《实证 “包装” 法学?》,载《中国法律评论》2020 年第 4 期。

  13. ^ 〔德〕艾尔弗拉德・诺德曼等主编:《科学的转型:有关 “跨时代断裂论题” 的争论》,武天欣、蔡仲译,南京大学出版社 2021 年版,第 1-4 页。

  14. ^ See C. Cioffi-Revilla, Introduction to Computational Social Science: Principles and Applications, 2nd edn., Springer, 2017, p. 35.

  15. ^ 即曾流行的 “大数据” 概念。但严格来说,“大数据” 的核心不应是 “大”,而是一种搜集和处理大型数据集的能力,可以将其视为一种社会学意义上的技术和文化现象。大数据研究应被视为对传统社会科学研 究方法的补充,而非方法论上的终结。See Danah Boyd and Kate Crawford, “Critical Question for Big Data: Provocations for a Cultural, Technological, and Scholarly Phenomenon” 15 Information, Communication & Society 662 (2012).

  16. ^ 尼克:《人工智能简史》,人民邮电出版社 2021 年版,第 10 页。

  17. ^ 这是一种方法论上的分类,基于人工智能模型的底层运作逻辑而来,基本为主流学者所认可(除细微的表述差别外)。另一种常见的分类是只区分符号主义与连接主义,这主要是因为行为主义更多解决的是智能体和现实环境的互动问题,而前两者只聚焦于智能体本身。此种分类可参见魏斌:《法律人工智能:科学 内涵、演化逻辑与趋势前瞻》,载《浙江大学学报(人文社会科学版)》2022 年第 7 期。

  18. ^ 这一问题是由卢卡斯与怀特围绕《心灵、机器与哥德尔》(Minds, Machines and Gödel)一文而产生的争议而来。参见李建会等:《计算主义及其理论难题研究》,中国社会科学出版社 2016 年版,第 1-3 页。

  19. ^ 例如,《人工智能与法律》(Artificial Intelligence and Law)杂志近期曾对其过往三十年的文章进行了回顾,以十年为分期讨论了具体的变化:首个十年是法律案例推理 (Reasoning with Legal Cases)、法律知识表征 (Representating Legal Knowledge)、道义逻辑建模 (Modelling of Deontic Concepts);第二个十年则开始关注人工智能的本体论 (Ontology)、法律文档信息化 (Legal XML) 和对法律论证与推理的模拟;第三个十年主要关注机器学习的方法,如案件预测等。这些转变往往是随着技术热点的变化而变化,缺乏内在的联系。当然,这里的思路转换并不意味着传统方法被抛弃了,当代大型人工智能模型往往是各类技术的综合体。 但人文社科的学者较难把握具体问题中方法重心偏移对价值预设、研究思路等问题的影响。See Michał Araszkiewicz, et al., “Thirty Years of Artificial Intelligence and Law: Overview” 30 Artificial Intelligence and Law 593 (2022).

  20. ^ 熊明辉:《从法律计量学到法律信息学》,载《自然辩证法通讯》2020 年第 6 期;屈茂辉:《计量法学基本问题四论》,载《太平洋学报》2012 年第 1 期。

  21. ^ 张妮、蒲亦非:《计算法学导论》, 四川大学出版社 2015 年版,第 5 页。在二位后续撰写的《计量法学、计算法学到认知法学的演进》一文中,也遵从了这样的发展脉络,认为概念的演化主要是基于技术的发展。

  22. ^ 至于 Jurimetrics 与 Legal Statistics 之间的关系,二者都需要建立模型,但最主要的区别在于对模型的理解:计量的重点在于,当无法进行实验时,如何解决模型的内生性问题,即如何通过观测到的数据正确识别模型中的系数并进行因果推断。参见〔美〕杰弗里・M. 伍德里奇:《计量经济学导论:现代观点》,张成思等译,中国人民大学出版社 2015 年版,第一章。

  23. ^ 叶启政:《实证的迷思:重估社会科学经验研究》,生活・读书・新知三联书店 2018 年版。

  24. ^ C.H. Pritchett, “The Roosevelt Court: A Study in Judicial Politics and Values, 1937-1947” 24 Indiana Law Journal 309 (1949).

  25. ^ 相关研究可参见:左卫民:《一场新的范式革命?—— 解读中国法律实证研究》,载《清华法学》2017 年第 3 期;白建军:《基于法官集体经验的量刑预测研究》,载《法学研究》2016 年第 6 期;屈茂辉:《民法实证研究中的计量方法》,载《法学研究》2012 年第 1 期。类似研究很多,不作赘述。

  26. ^ 迈克尔・吉勒赛瑞斯(Michael Genesereth)在三次不同的场合讨论了 Computational Law 的概念,三次定义基本相同,只是所列举的具体应用场景不同。See Nathaniel Love and Michael Genesereth, Computational Law, Proceedings of the 10th International Conference on Artificial Intelligence and Law, 2005, pp. 205-206; Michael Genesereth, Computational Law: The Cop in the Backseat, White Paper, CodeX: The Stanford Center for Legal Informatics (2015); Michael Genesereth, What is Computational Law?, accessed on June 7, 2023, available at https://law.stanford.edu/2021/03/10/what-is-computational-law/。

  27. ^ Computational Jurisprudence 强调利用人工智能技术等计算工具进行法学研究;Computing Law 强调计算法学属于计算机科学与法学作为一个整体的领域;Computer Law 强调与计算机技术相关的法律问题。更为 具体的讨论可参见熊明辉:《从法律计量学到法律信息学》,载《自然辩证法通讯》2020 年第 6 期。

  28. ^ Daniel Martin Katz, Ron Dolin and Michael J. Bommarito eds., Legal Informatics, Cambridge University Press,2021, pp. 1-5. 当然,由于这本书是论文合集,在此摘录导论中的叙述,具体到章节内的单个学者观点可能存在出入。

  29. ^ 俞吾金:《问题域外的问题》,上海人民出版社 1988 年版,第 107 页。

  30. ^ 例如,OpenAI 于 2023 年 3 月发布的 GPT-4 在统一律师考试中的得分高于 90% 的人,考试题包括多项选 择和开放式的论文。See Daniel Martin Katz et al., “GPT-4 Passes the Bar Exam” (Mar. 15, 2023) (on file with Social Science Research Network)。再比如,Casetext 公司最近推出了一款名为 CoCounsel 的产品。根据该 公司的推广材料所述 “CoCounsel 可以在几分钟内完成文档审查、法律研究备忘录、证人传讯准备和合同 分 析 , 并 提 供 了 足 够 可 信 的 结 果 。” See Casetext, The Legal AI You’ve Been Waiting For, Casetext, https://casetext.com/cocounsel/.

  31. ^ 参见苏力:《法律人思维?》,载《北大法律评论》第 14 卷第 2 辑,北京大学出版社 2013 年版,第 429-469 页;孙笑侠:《法律人思维的二元论兼与苏力商榷》,载《中外法学》2013 年第 6 期。

  32. ^  此处是指吴恩达所倡导的“以数据为中心的人工智能”(Data-centric AI)的思路,毕竟对于法学家来说,参与通用大型通用语言模型(如 ChatGPT)的算法建构中去是一件困难且没必要的事情,但建构属于法学 的高质量训练数据与推理数据集,则是可供探索的领域。Daochen Zha, et al., “Data-centric Artificial Intelligence: A Survey” arXiv preprint arXiv:2303.10158 (2023).

  33. ^  王涌:《道义逻辑、人工智能与法律》,载《经贸法律评论》2020 年第 2 期。

  34. ^  季卫东教授将其分为“统计和预测模型”和“大数据挖掘与机器学习”,从一定程度上概括了这种差异。参见季卫东:《计算法学的疆域》,载《社会科学辑刊》2021 年第 3 期。

  35. ^  陈华均:《知识图谱导论》,电子工业出版社 2021 年版,第一章。

  36. ^  〔美〕凯文·D. 阿什利:《人工智能与法律解析》,邱昭继译,商务印书馆 2020 年版。

  37. ^  当然,实际操作层面往往是两种思路的综合适用,此处方法上的分类是为论述方便而采用。

  38. ^  雷磊:《规范、逻辑与法律论证》,中国政法大学出版社 2016 年版,第 259 页。

  39. ^  司法潜见是指在一定案件背景信息和长期职业习惯的影响下,司法人员在尚未结案之前对案件处理结果形成的某种定型化的心理准备和行为倾向。例如,我们假设法官 B 是一位女法官,再假设女法官出于对强奸罪的厌恶而倾向于在自由裁量权给定的区间内加以重判,其甚至不用给出更多的论证理由,因为法律规定的就是 3~10 年,她这样做就是合法的。本文是假设存在机器人法官的前提下,将二者加以对比。且理论上来说,对应这种简单案例的机器人法官并不难制作,只是统计成本问题而已。参见白建军:《司法潜见对定罪过程的影响》,载《中国社会科学》2013 年第 1 期。

  40. ^  相关尝试如 1997 年艾伦森和萨克松根据霍菲尔德的“最小矩阵”概念体系,构建法律的形式语言。参见:Allen and Saxon, “Achieving Fluency in Modernized and Formalized Hohfelde” Proceedings of the 6th International Conference on Artificial Intelligence and Law, 1997, p. 19. 凯文·D. 阿什利教授基于判例法思路开发的“海波系统”;毕胜等人基于中国法律制度构建的知识图谱模型等,参见 Sheng Bi, et al., “Building Chinese Legal Hybrid Knowledge Network” Knowledge Science, Engineering and Management: 12th International Conference Part I 12 (2019).

  41. ^  相关例子可参见代晓林:《日本法律人工智能的第一次顿挫》, 华中科技大学 2019 年硕士毕业论文。

  42. ^  对模态逻辑和道义逻辑与法学的结合可参见王涌:《道义逻辑、人工智能与法律》,载《经贸法律评论》2020 年第 2 期;对模糊逻辑与法学的结合可参见刘东亮:《法律模糊性问题的“解码”与“计算”》,载《现代法学》2023 年第 6 期。

  43. ^  当然,多值逻辑与模糊逻辑存在着一定的差异,例如模糊逻辑仅限于 0 到 1 之间的值,而多值逻辑可以包含具有任意数量的真值的逻辑系统。

  44. ^  参见 Yaroslav Shramko and Heinrich Wansing, “Truth Values” The Stanford Encyclopedia of Philosophy (Winter 2021 Edition), Edward N. Zalta (ed.), URL = .

  45. ^  参见Richmond Thomason, “Logic and Artificial Intelligence” The Stanford Encyclopedia of Philosophy (Summer 2020 Edition), Edward N. Zalta (ed.), URL = .

  46. ^  See Richmond H. Thomason, “Logic and Artificial Intelligence” in Leila Haaparanta (eds.) The Development of Modern Logic, Oxford University Press, 2009.

  47. ^  关于统计学和机器学习之间的区别,学界亦有争论。例如,有学者认为统计学强调推断或预测的置信度,而机器学习强调实际的预测效果。但本文主要讨论二者所共享之方法,其关注重点的差别并不影响其数理 方法上的相似性,故本文语境下二者是同一的。参见 https://towardsdatascience.com/the-actual-difference-between-statistics-and-machine-learning-64b49f07ea3,最后访问日期:2024 年 1 月 7 日。

  48. ^  叶启政:《从因果到机制:经验实证研究的概念再造》,群学出版有限公司 2020 年版,第 12 页。

  49. ^  A. D. Martin, et al., “Competing Approaches to Predicting Supreme Court Decision-Making” 2 Perspectives on Politics 761 (2004).

  50. ^  Daniel Martin Katz, et al., “A General Approach for Predicting the Behavior of the Supreme Court of the United States” 12(4) PLoS One (2017); Benjamin Alarie, Anthony Niblett, and Albert Yoon, “Using Machine Learning to Predict Outcomes in Tax Law” (2017) available at: https://ssrn.com/abstract=2855977.

  51. ^  Stiennon N, et al., Learning to Summarize with Human Feedback, Advances in Neural Information Processing Systems (2020).

  52. ^  该表格为笔者参照涉及正当防卫限度认定的司法解释、指导性意见等提取的相应要件整理而成。

  53. ^  这也是法律经验实证研究的基本范式。参见张永健:《法实证研究:原理、方法与应用》,新学林出版社 2019 年版;卢春龙主编:《法学统计应用教程》,高等教育出版社 2019 年版。当然,本文忽视了一些法律社会实证研究中可能存在的难点,而仅关注此方法论本身。这些难点包括:第一,裁判文书的数量不足,相较于经济领域动辄百万、千万级别的数据量,法学领域仅仅可以依赖相关的裁判文书,且相当数量的裁判文书并未进行公示;第二,司法文书规范化程度较低,法官在撰写裁判文书时有一定的自由发挥空间,因此对于部分情节,如是否认罪认罚、是否取得谅解、是否自首往往用一句“被害人有认错表现”带过,而不具体说明细节;第三,裁判书文书提供的信息有限,一些“司法潜见”不见诸于裁判文书,但可能影响案件走向;第四,能否恰当的挑选统计模型,遵循统计过程的一些操作规则等。

  54. ^  关于物理性测量何以可能,卡雷尔·贝尔卡(Karel Berka)归纳了五条特性:第一,受测事物与量具一样,是绝对定型的客体;第二,受测事物的长度与量具的长度,在测量过程中均未改变;第三,测量结果总有 误差,但基本有一定的精确度,乃代着受测事物的衍展性;第四,事物的长度及其经验可及的,至少在某个数值的范围里,且在某种直接测量程序的运用上是可测量的;第五,针对某一特质,受测事物与量具是精准地相关的。这些特性在心理和非物理性测量中难以满足。See Karel Berka, Measurement: Its Concepts, Theories and Problems, D. Reidel Publishing, 1983.

  55. ^  定类尺度是一种分类尺度,如“男性/女性”;定序尺度是按照某种顺序排列,如“小学”“初中”“高中”“大学”。定类尺度和定序尺度都不能进行数学运算,只是出于统计方便的考量。定距尺度是在定序的基础上加上间隔距离和数量差,如温度 5℃、10℃、15℃,但定距尺度没有绝对的“零点”,因而加减是有意义的,乘除是没有意义的。定比尺度就是存在这样一个零点,因而只有定比尺度下,数据才可进行加减乘除的计算。

  56. ^  这是因为数学家和社会家使用的是两套语言:数学的语言,如函数、集合、微分等,是形式化的、坚实的,数学研究则是在这一基础上拾级而上;但社会科学的研究往往源自于理论的争议与反思。其次,社会科学的基础语言,即自然语言是无穷阶的,难以形式化、混沌的。因而,社会科学与量化研究存在着先天的、不可逾越的鸿沟。恰如卡普兰(Kaplan)所言,数字被看成具有内在的科学价值。但是这种科学价值未必等于社会科学的价值。See Abraham Kaplan ed., The Conduct of Inquiry: Methodology for Behavioral Science, Routledge, 1998.

  57. ^  Freedman, David A., “Statistical Methods for Causation” in William Outhwaite & Stephen P. Turner eds., The Sage Handbook of Social Science Methodology, Sage, pp. 127-146.

  58. ^  整个参数统计即是用特征值去描述某一概率分布(如正态分布)的形态趋势。它有一些常见的度量形 式,包括:平均数(mean)、中位数(median)与众数(mode)等。因为本文在较为抽象的维度上讨论统计理念,因此对这些特征值之间的细节不做区分,以“均值”作为概括,来形容“抽象出一般规律来概括个体事件群”。参见卢春龙主编:《法学统计应用教程》,高等教育出版社 2019 年版。

  59. ^  郑戈:《法学是一门社会科学吗?》,法律出版社 2022 年版,第 29 页。

  60. ^ 〔德〕鲁道夫·冯·耶林:《法律是一门科学吗?》,李君韬译,法律出版社 2010 年版,第 81-85 页。

  61. ^ 〔德〕伽达默尔:《真理与方法》,洪汉鼎译,商务印书馆 2007 年版,第 397 页。

  62. ^  See Stephen Turner, The Cambridge Companion to Weber, Cambridge University Press, 2000.

  63. ^  雷磊:《新科技时代的法学基本范畴:挑战与回应》,载《中国法学》2023 年第 1 期。

  64. ^  马克思本人在《资本论》中对科学技术的效用给出了一对相互矛盾的结论。一方面,其承认科学技术是生产工具发展的主要原因,而生产工具的进步也推动了社会的进步,即“手推磨产生的是封建主的社会,蒸气磨产生的是工业资本家的社会”,另一方面,其也指出科学技术也会带来剥削范围的扩大,使工人沦为机器的附庸。后来恩格斯在马克思墓前的讲话更多的强调了科学技术的正面价值的肯定,而马克思对科学技术的批判被人们忽视了。参见《马克思恩格斯选集》,人民出版社 1995 年版,第 1 卷第 142 页、第 3 卷第 777 页;直到西方新马克思流派的代表人物马尔库塞再次提出了技术对人的“异化”的讨论。技术带 来了意识形态上的“工具理性”,即以数学形式进行量化和预测后果以实现目的的理性,由于可以带了效率和经济的快速增长,取得了意识形态的特性而控制影响着社会的发展,从而导致社会价值取向的单向性、唯一性。参见〔美〕马尔库塞:《单向度的人:发达工业社会的意识型态研究》,刘继译,上海译文出版社 2014 年版。哈贝马斯在其数十年之后的回应之作《作为意识形态的技术与科学》中虽然反驳了马尔库塞过于悲观的论调,但同样也指出科学技术在使用中可能出现的副作用和危险。

  65. ^  俞吾金教授曾对这一现象作出了独到且精准的分析,并指出历史唯物主义在“科学技术决定论”的影响下蜕化为一种机械的宿命论,而对“科学技术决定论”的政策纠偏效用不大。参见俞吾金:《走出“科学技术决定论”的误区:对中国现代化道路的一个反思》,载《马克思主义研究》2010 年第 6 期。

  66. ^  陈鹏:《“新文科”要培养什么样的人才》,载《光明日报》2019 年 5 月 20 日,第 08 版。

点击下载《计算思维与法学的 “视域融合”》(未编辑稿)

许新冉:《计算思维与法学的 “视域融合”》,载《法治社会》2024 年第 4 期。