1. 问题的提出
当前,信息时代已经逐渐发展到深度数据时代。以数据为给养,拥有广泛应用领域的ChatGPT、DeepSeek为代表的人工智能在数据时代的背景下进一步崛起。人工智能的核心算法已成为为各行各业赋能的关键要素,算法创新是深度数据时代技术进步的重要基础,是各行各业进行数字化转型的重要支撑[1]。近年来,人工智能技术创新不断取得新突破,相关专利申请量也不断增长,已成为新一轮科技革命和产业变革的重要驱动力量,展现出巨大发展潜力。因此,全球主要大国均把发展人工智能提升到相当的高度[2]。
人工智能算法是指用于构建和训练人工智能模型的一系列数学公式、逻辑规则和计算步骤,它旨在使计算机系统能够模拟人类的智能行为,如学习、推理、决策、感知等,以解决复杂的任务和问题。在2024年12月31日国知局颁布的《人工智能相关发明专利申请指引(试行)》中,基于人工智能算法的相关专利申请被这样定义:“将人工智能算法或模型融入发明创造中,作为对产品、方法或其改进所提出方案的内在部分。”
人工智能算法可专利性问题集中在以下两大部分,一是人工智能算法的技术性判断问题,二是人工智能算法的具体应用领域适用问题。具体的,首先,在对人工智能算法进行技术性判断的问题中,技术问题的具体性与抽象性存在模糊边界,尤其是当技术方案试图解决有关人类主观或感性的问题时,该技术问题的边界标准存在模糊;其次,在对人工智能算法的技术手段判定问题中,人工智能算法与硬件的特定技术关联,该关联程度存在不一致性[3];最后,在人工智能算法与具体应用领域耦合的问题中,耦合阈值中的紧耦合边界存在不确定性[4]。
2022年,英国Emotional Perception AI Limited (以下简称“EPL”)公司申请了一项专利,其涉及一种使用人工神经网络为用户提供媒体文件推荐的人工智能算法。例如,在音乐网站上,该系统能够根据用户已经知晓的某首曲目推荐类似风格的音乐,其优势在于能够基于人类的感知和情感状态提供推荐,而不仅仅依赖于已经标定的音乐类型或他人的相似音乐品味。英国知识产权局(以下简称“UKIPO”)最初以该申请属于“计算机程序本身”为由拒绝了EPL的专利申请,而英国高等法院在2023年11月推翻了这一决定[5]。英国专利局局长随后向上诉法院提起上诉。在2024年7月19日,上诉法院作出裁决[6],推翻了高等法院的判决并强调该判决不意味着使用人工神经网络的人工智能算法发明不能获得专利,而是必须像评估其他通过计算机实现的发明一样,具体评估其是否具有技术效果。法院还建议采用2006年Aerotel案中确立的四步法来评估此类发明是否具有技术性质的贡献。
在“一种建立废钢等级划分神经网络模型方法”发明专利权无效宣告请求案中,涉案专利名称为“一种建立废钢等级划分神经网络模型方法”(专利号:ZL201910958076.8)。该专利涉及人工智能技术在钢铁行业的应用,通过采用卷积神经网络技术进行废钢铁等级分类的特征提取和深度学习,实现了对废钢铁等级的客观准确的自动分类。该案审理的焦点在于,在涉及人工智能的发明专利创造性判断中,如何考量算法、应用场景等要素对整体技术方案的技术贡献。经审理,国家知识产权局作出第55072号无效宣告请求审查决定,维持专利权有效[7]。
当下,在人工智能算法是否具有《中华人民共和国专利法》(以下简称“《专利法》”)意义上的客体性,即是否具有可专利性上,学者主要有两种典型观点:第一种观点是全部开发论[8],该观点认为人工智能算法不属于《专利法》第二十五条所述的智力活动的规则和方法,其在计算机产业(无论是不是软件形式)已得到具体应用,应当认定人工智能算法达到了以技术手段解决技术问题并实际产生具体技术效果的标准,符合《专利法》关于“技术方案”的定义,应当给予专利权的相应保护。换言之,基于产业发展的需要,应当尽可能地扩大对人工智能算法的专利权的保护。第二种观点是个别分析式[9],即不存在一种普适的规则,所有人工智能算法都应当根据其申请专利,单独地判断其可专利性。该观点认为,人工智能算法的适用环境、条件和领域等越特殊,其可专利性判断标准也越特殊。同时,若该算法越是区别于一般算法的抽象特征,那么其脱离抽象性的概率也相对较大,进而越可能被视为专利适格客体。
两种观点的价值出发角度不同。第一种观点的价值出发角度是从宏观经济角度出发,基于市场需求与国家产业发展需要,将作为人工智能产业基础之一的算法尽可能地向无条件授予算法专利权的方向推进,即允许更具有抽象性的人工智能算法获得专利权的保护。虽然,以TRIZ理论中的技术发展曲线的角度来看,在当前人工智能产业发展的背景下人工算法的创新及其重要性还在进一步上升且远未到瓶颈期,但是,如若在人工智能算法专利的抽象性问题上进行回避,这并不一定能很好地激励相关产业在人工智能产业上的算法创新。因为,过大的算法专利保护范围,可能导致权利范围的不明确,专利授权与无效的低可预测性,甚至是过大范围算法的不当保护。同时,低门槛所导致的大量低质量人工智能算法专利申请既无益于相关产业的保护,也增加专利审查人员的审查负担,最终可能抑制人工智能算法的创新[10]。第二种观点的局限在于,当前人工智能的发展往往已经突破某一具体功能或应用的限制。以ChatGPT和DeepSeek为例,该类人工智能的算法结构不仅拥有文义语言处理功能,而且也有进行视觉分析,语音交互等其他功能。对应的,这些功能不仅可用于教育领域,甚至也可用于医疗或生产等其他领域。在面对多功能复杂人工智能算法专利申请的需求时,仅仅依靠现有的具体领域限制或硬件物理结合的标准无法满足当下算法创新申请专利保护的需求。
综合来看,两种观点各有其合理性,但也存在明显局限。全部开发论虽契合产业发展需求,但可能因保护范围过宽而阻碍后续创新;个别分析式虽更为审慎,却难以适应人工智能算法跨领域应用的复杂性。这表明,简单地“扩大保护”或“个案审查”都难以完全应对AI算法可专利性的挑战,需要在二者之间寻求更精细化的平衡路径。基于《专利法》的稳定性和政策的可预测性,针对两种观点的利弊及其局限,有必要进一步明确人工智能算法可专利性的边界。换言之,需要进一步依据《专利法》《中华人民共和国专利法实施细则》(以下简称“《细则》”)、《专利审查指南》(以下简称“《指南》”)和《人工智能相关发明专利申请指引(试行)》(以下简称“《指引》”)来明确可专利的人工智能算法边界[11]。
2. 人工智能算法技术问题中本质与目的的关系与影响
《专利法》第二条第二款所规定的“技术方案”,是指对要解决的技术问题所采取的利用了自然规律的技术手段的集合。当专利中的一项权利要求展现了对特定技术问题适用利用了自然规律的手段,并由此达到了符合相应自然规律的技术效果,则可判定该权利要求所涉及的解决方案是符合《专利法》标准的技术方案。对人工智能算法专利而言,其中的技术问题不是诸如商业问题等其他问题。《细则》第二十三条第二款规定,独立权利要求应当从整体上反映发明或实用新型的技术方案,记载解决技术问题的必要技术特征,即整体性原则。整体性原则是判断一个专利的解决方案是否属于技术方案的要求,它使得判断基准从单独的权利要求延展至整个专利文件。同样,这种体系性的判断依然存在于专利技术方案的技术问题,技术手段与技术效果三者之间。
对技术问题的判断,离不开从技术手段与技术效果的角度分析。算法本质是解决问题的一种方式,它的运算机理是用数学语言建构数学模型来描述实际现象[12]。在解决涉及以人类的主观感受为反馈标的(如“提升用户体验”)的技术问题时,算法可专利性问题中的技术问题判断矛盾便会凸显,人工智能算法专利在解决此类技术问题时矛盾亦然。进一步的,当被用于尝试解决人类的主观问题的人工智能算法所触及的问题主观性越强,该人工智能算法的可专利性便越模糊。换句话说,若将解决技术问题的目的与该技术问题本身区分得越明确,该人工智能算法的可专利性便越高。解决技术问题的发明,源于创作者赋予的任务[13]。该任务,便是解决技术问题背后的目的。
在2023版《指南》第二部分第九章中有两个专利申请案例涉及人的主观反馈,判断相应申请是否属于技术方案的案例。
第一,例6“一种电子券使用倾向度的分析方法”的人工智能算法专利是典型的与商业方法存在交叠的专利示例。该专利申请文件的技术问题是电子券使用倾向度的问题分析,而非用户对某类电子券推送的精准度感觉“准不准”的主观感受问题。本案例中,人工智能算法扎根于用户行为,从所述用户样本数据中提取用户行为特征,所述用户行为包括:浏览网页、搜索关键词、加关注、加入购物车、购买以及使用电子券进行分析,其本质是一种客观的数据分析与模型训练,是典型的技术问题。提升用户的电子券使用率,亦或者是让用户觉得电子券推送的精确度上升了,是解决该技术问题所要达成的目的之一,也是对算法数据训练和处理的判断指标。因此,该案例若仅凭申请文件标题是比较容易让审查员错误判断该专利申请文件不涉及技术问题的,即使其实质是一件具有技术性,是有明确技术问题的人工智能算法专利申请文件。第二,例13“一种物流配送方法”,该申请的目的涉及提高取送货双方的用户体验,其技术问题在于需要解决取送货用户需求数据并联地区物流数据架构,依据人工智能算法动态批量处理多方数据,进而实现额定物流能力限定下的最佳取送货物流效率。综合2023版《指南》的两个案例可以发现,这类案例的技术问题有主观用户体验之虚,但行技术性之实。
这个“实”并非单纯在申请文件中机械地寻找,而是要结合技术手段与技术效果,综合申请文件全文,以整体性原则的视角综合判断。否则,脱离对人工智能算法所用数据类型的标定,缺失人工智能算法具体数据架构搭建,远离各数据终端等硬件载体支撑,无论是电子券精准推送,还是物流体验提升,其专利申请的技术性都会大打折扣。但是也并不能说,只要有了体现自然规律的数据处理或有了相应具体的数据架构与硬件支撑,就一定是可专利的技术方案。前者各要素与最终专利构成技术方案之间的关系是必要关系而非充分关系。要达到充分关系,需要前者各要素,甚至其他要素自身不仅拥有相应的质,也有相应的量。这里所谓的“质”和“量”会在下文的技术手段部分继续列举和探讨。
在EPL与UKIPO案件中,涉案专利涉及一件人工神经网络音乐推荐算法(或软件)专利。案件争议焦点除了该申请专利中的人工智能算法是否属于计算机程序外,最大的焦点便是该人工神经网络音乐推荐算法是否具有技术效果。如若该专利是在中国大陆地区进行申请,则争议焦点之一可能便是该申请文件的音乐推荐问题是否属于技术问题。与《指南》的两个案例不同,该英国上诉案件中人工智能所需处理的数据更具有主观性:音乐类型标签分类、音乐聆听历史,音乐标签不明时的音乐乐理分析等。虽然乐理分析具有固定的范式及其规律可循[14],但该分析严格意义上来说并不属于自然规律,而是属于有较强主观性的艺术规律,甚至更抽象的文化规律。当数据来源于此类非典型自然规律时,判断该专利是否属于中国专利法保护的技术方案,便要开始结合数据结构,硬件结合等其他因素进行整体性考量。比如对音乐数据、用户行为数据等数据及其分析具有了确切技术含义,使得基于音乐领域技术人员的理解,能够知晓该算法的执行直接体现出利用自然规律解决某一技术问题的过程,且获得了技术效果,那么该专利在中国获得授权的概率就会大大加强。如若无法在其他方面,尤其是“利用自然规律”上无法完成解释论闭环,那么该专利则易落入不可专利的范畴中。
通过对比《指南》中的案例与EPL案可以发现,技术问题的判断不能仅因其涉及主观因素就简单否定。关键在于要将算法解决的主观性目的(如音乐推荐)与其实现的客观技术任务(如数据处理与分析)相分离。当算法通过利用自然规律的技术手段完成了特定的技术任务,即使其最终目的是服务于主观感受,仍可能构成专利法意义上的技术问题。不能仅仅因为其中某类因素涉及人的主观成分(如EPL与UKIPO案中的音乐分析与推荐问题)就断然认为该问题不属于技术问题,进而认定该专利申请不具有可专利性。
3. 人工智能算法技术手段判定与归类
在专利申请中,技术手段是构成技术方案的核心要素之一,它指的是为了解决特定技术问题而采用的具体方法、步骤或结构。2023版《指南》这样描述技术手段:技术手段通常是由技术特征来体现的。
2023版《指南》明确了如何判断深度学习、分类、聚类等人工智能算法的改进是否构成技术方案。在进行判断时,应着重考察算法改进是否与计算机系统的内部结构存在技术上的关联性。如果算法改进与计算机硬件之间存在技术层面的联系,使得计算机硬件不再仅仅是程序运行的载体,而是解决了提升硬件运算效率或执行效果的技术问题,并实现了计算机系统内部性能的优化,则该改进方案可被视为技术方案[3]。
在当今以复杂计算机软件和大型工业机械为主流产品的应用环境下,一款产品从基础研究迈向实际应用,通常需要经过多个技术层级以及众多配件供应商的参与。因此,处于中间环节的人工智能算法兼具抽象思维和技术方案的双重特性。传统机械工程领域的专利审查标准的演变,为智能时代人工智能算法专利适格性的判断提供了应对变革的参考[15]。但区别于机械类专利的是,人工智能算法的可专利性不仅需要在一般抽象算法上形成与其不同的表现形式,而且需要去抽象化,即在产品的具体化上做出实质性的体现。这种体现,最典型的形态之一便是《指引》中所述的“与计算机系统的内部结构存在特定技术关联”,其内在的实质是上文所述的“利用自然规律的技术手段”。
人工智能算法利用了作为物理载体的计算机系统的内部结构并不一定能体现特定技术关联。体现特定技术关联意味着人工智能算法不仅在量的层面从开始抽离出抽象层次,而且还需要在质的层面达到特定而非一般的技术关联。无论是崔国斌的“物质状态改变”理论,还是邱福恩教授的“计算机实施”赋予算法技术性理论,抑或刘强教授的“软件 + 硬件”组合理论,这些理论的共性在于需要连接物理外在因素(如计算机硬件、可存储介质等物理客观存在)去寻求技术性评价。以下通过两个示例进行阐述[3]。
示例1:现有的神经网络占用大量存储空间,若用户在移动设备上安装多个包含神经网络的应用,可能会导致设备存储空间不足,进而出现运行缓慢甚至宕机等问题。为此,本方案提出一种神经网络压缩方法:该技术首先获取一个已经完成训练的神经网络,接着从网络的各层中挑选出至少一层作为待压缩的目标层级。按照待压缩层级在神经网络中所处位置的深度(从深层到浅层)依次进行处理。具体步骤如下:首先根据待压缩层级所包含的参数总数来确定裁剪比例,然后结合裁剪比例和设定的参数值阈值,从该层级的参数中筛选出需要裁剪的部分。裁剪完成后,利用机器学习方法和预先准备好的训练样本对网络进行再次训练。经过对所有选定的待压缩层级完成上述操作后,最终得到的神经网络即为压缩后的版本,并将其进行存储。该方案通过压缩参数减少存储占用,提升设备运行速度,解决了存储空间不足的问题。这种改进与计算机存储空间密切相关,优化了硬件性能,属于技术方案。
示例2:针对现有神经网络压缩方法的不足,本文提出一种基于重训练的剪枝量化方法。该方法首先载入已训练的神经网络模型,对其权重和数据同时进行剪枝与量化处理,然后基于处理后的权重和数据对模型进行更新和迭代重训练。重训练完成后,通过测试集评估模型性能,并根据压缩比等指标筛选出最优的剪枝量化模型,从而提高神经网络的推理速度。该方案主要优化了神经网络的结构和参数,与计算机系统内部结构无直接技术关联。虽然模型运行速度有所提升,但这仅是压缩简化后的自然结果,并未直接改善计算机系统的内部性能。
上述两个案例是涉及人工智能算法的案例。从其内容的表述可以发现二者的核心均是通过训练数据后的结果表达参数,有选择性地裁剪部分数据,再进行下一步的其他运算或输出。但在人工智能算法的数据收集和处理,以及其与硬件是否存在特定技术关联上,二者并不相同。具体的,前者的特定技术关联体现在算法对数据多层式的裁剪处理,无论是中途的缓存暂存还是最终输出,均特定关联了设备的内存;对比之下,后者并未在算法与存储介质直接构建语义上的联系,而仅仅是在算法效率上进行描述,即典型的Scaling Law的AI模型预训练框架下的计算。质言之,二者的核心价值均体现在Scaling Law模型下的设备性能最佳性价比表现,即在设备性能有限,不影响设备综合运行速度限制条件下的运算最佳效能,这也是当前大量电学领域专利产品或方法的改进方向。
上述两个案例中,从Scaling Law模型函数可知,在内存有限且使用不影响用户正常体验的限定下,即人工智能所能支配的系统性能与资源投入是一定的情况下,该函数的极值(即运算最佳性能比)也是可计算且一定的。但即便是在数学抽象层面有完美的表达,示例2缺乏了该人工智能算法与计算机系统的内部结构的关联后,明显落入了《专利法》第二十五条第二款的反向排除范围内。即使当下有众多学者主张人工智能算法不同于一般算法,因为基于劳动价值理论,其从抽象数学模型到实际系统搭建与运用都远远超出了一般智力活动与方法的劳动价值,进而达到了工程级的劳动量级,这显著区别于智力规则与方法,进而应该将人工智能算法从传统的智力规则与方法中剥离出来[16]。但是基于解释论角度,在《专利法》等相关法律法规未直接采纳该类主张前,示例2所代表的抽象人工智能算法并不能从《专利法》第二十五条第二款的范围中逃逸出来。换句话说,示例1与示例2的根本差别,在于其硬件关联是“固有的”还是“名义的”。示例1的算法设计直接服务于优化内存这一硬件性能,形成了“固有功能性关联”;而示例2的硬件更像是算法运行的通用背景板,仅为“名义性关联”。可专利性的关键,就在于证明这种关联是内在且功能性的,而非表面和名义上的。
但人工智能算法与计算机系统的内部结构存在技术关联并不意味着能成功从反向排除逃逸,如若该关联程度无法达到“特定”,那么人工智能算法专利申请文件获得专利权保护依然将会存在困难具体的。在专利代理实务中,有不少涉及算法的专利申请都以诸如“一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求XXX时的主题算法”的形式作为权利要求以实现算法专利申请中的“形式性”权利要求。“可在处理器上运行的”意味着该人工智能算法与计算机内部结构存在技术关联,但并不一定能达到“特定”的程度。理论上,这类用“凑数”权利要求来实现算法与物理器械或部件结合的人工智能算法,在理论上的可专利性并不是很高。但实务中的相关算法申请则相对包容,人工智能算法专利同理,因此这类通过“凑数”而获得的算法并不少见。若严格依照理论判断该类专利申请能否成功授权,还需进一步综合判断其内部是否存在特定技术关联等因素。比如,对该人工智能算法与中央处理器的结合,仅称其包含相应的中央处理器,那么该算法与具体硬件的结合将会是较浅的。如果进一步深入地阐述其对多核中央处理器的多核并线有明显的优化效果,毫无疑问其与硬件的结合程度会更上一层楼。
4. 人工智能算法中功能与应用领域耦合的松紧阈值
《指引》中指出,人工智能算法的专利申请,需要将人工智能算法融入发明创造中,作为对产品、方法或其改进所提出方案的内在部分。其中,人工智能算法的功能,是指使用一种或多种人工智能算法或模型实现的功能,它区别于人工智能算法的领域应用。有学者认为应用领域是技术方案的具体应用或实现的具体功能[3],仅仅记录了具体应用领域的人工智能算法,并不一定能够构成专利意义上的技术方案。换句话说,在当下人工智能算法跨领域功能性越来越强的背景下,继续强调具体应用领域并不一定合适。因为以IPC编号为例,假定某算法只限定于某一IPC编号对应的具体应用领域内,那将不可避免地导致拥有该跨领域算法的发明者,像一个需要将自己的商号申请全部的45类商标以尽可能全覆盖地获得商标法保护的商号持有人一样,将自己的人工智能算法尽可能穷尽地申请各可能应用的IPC领域进行专利申请。诸如已经开源化的DeepSeek,无论是医院的自助问诊系统,还是政府政务系统;无论是教育领域的智能搜题,还是法律领域的案件咨询,该人工智能算法本身都不能直接限定其应用领域。如若拆分其算法本身,将整体的人工智能算法拆分为若干的系统,那么这些系统的具体应用领域会局限于服务该算法本身,不可避免地会让申请者编撰相应的“凑数”权利要求以期专利申请能得以通过。
在判断一个人工智能算法是否属于可专利的技术方案时,除了上文所述要考察其与计算机内部的内部结构存在特定技术关联,还需进一步考察该方案是否真正实现了人工智能算法与具体应用领域的深度融合。如果该技术方案本质上是对算法本身的改进或优化,仅是简单地将其限定在某个具体应用领域,而没有展现出算法与该应用领域之间紧密的结合关系,即算法与具体应用领域之间存在较为松散的耦合关系,那么该方案则不应被视为专利保护的对象。对跨领域人工智能算法限定某个具体应用领域,也会导致大量技术资源的浪费。
比如,在2023版《指南》第二部分第九章第3节中,有一个审查示例涉及一种图像去噪方法。该方法通过仅对图像中灰度值超出均值上下3倍方差范围的像素点进行灰度调整,从而达到去除图像噪声的效果。与现有技术中常用的均值滤波方法相比,这一解决方案有效避免了图像模糊的问题,同时能够高效地去除图像噪声。此外,在2023版《指南》第二部分第九章第6.2节中,另一个审查示例涉及一种卷积神经网络(CNN)模型的训练方法。该方法在各级卷积层对训练图像完成卷积操作和最大池化操作后,进一步对特征图像执行水平池化操作。通过这种方式,训练完成的CNN模型能够在识别图像类别时处理任意尺寸的待识别图像,从而提升了模型的灵活性和适用性。
两个人工智能算法的功能均为实现视觉识别的优化,但具体应用领域均是跨领域的情形。比如,该类视觉识别功能可以用于交通运输中的监控,用于汽车自动驾驶,用于流水线工业识别,也可用于手机摄像等。
通过分析《指南》中的图像处理案例可见,判断领域耦合程度的关键不在于是否限定了具体应用领域,而在于算法改进是否针对特定领域的技术难题提供了专属解决方案。当算法的改进能够直接解决某个领域长期存在的技术痛点(如废钢分拣的准确性),而非仅仅是在该领域运行通用算法时,才能被认为达到了必要的耦合阈值,这与崔国斌教授强调的“技术领域贡献度”理论形成了呼应。因此,领域耦合的紧阈值,关键看算法是否真刀真枪地解决了某个具体领域的技术难题。面对通用算法(比如DeepSeek)的保护难题,或许可以换个思路:对算法底层架构的创新,试试用系统权利要求保护其通用能力;对解决特定领域难题的应用,则用方法权利要求保护其具体方案。这种分层保护的想法,或许能让审查标准更灵活,更好地适应AI技术的发展。
5. 结语
通过对人工智能算法可专利性问题的深入研究,本文从多个维度探讨了当前人工智能算法在专利保护中面临的挑战与机遇。综上所述,人工智能算法的可专利性问题是一个涉及技术、法律与产业多维度的复杂问题。在当前弱人工智能时代,适当扩大算法专利保护范围是符合市场需求和政策导向的,但这种扩展必须建立在明确的技术性判断标准,与硬件一定的结合程度和应用领域适配性的分析之上。展望未来,随着人工智能技术向通用化发展,专利审查标准应当建立更具弹性的判断体系。可以考虑通过系统权利要求保护算法的基础架构创新,同时运用方法权利要求保护其在特定领域的技术应用,形成分层保护模式,从而在保持专利法稳定性的同时,更好地适应AI技术的迭代特性。