第1章 人工智能相关定义及特点

1.1 人工智能的定义

目前对于人工智能,有以下几种比较常见的定义:

根据我国《人工智能标准化白皮书(2018年)》,其定义为:人工智能是利用数字计算机或者由数字计算机控制的机器,模拟、延伸和扩展人类的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术和应用系统。

根据维基百科,其定义为:人工智能就是机器展现出来的智能,所以只要机器有智能的特征和表现,就应该将其视为人工智能。

根据百度百科,其定义为:人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术和应用系统的一门新的技术科学,并认为人工智能是计算机科学的一个分支。

1.2 人工智能的特点

由上述几种定义可知,对于人工智能,有以下几个特点:

1)人工智能是人类智能的模拟、延伸或扩展

人工智能具体可以是针对人类的智能包括言语语言、音乐韵律、数理逻辑、视觉空间、身体运动、自我认知、人际沟通、自然观察等的模拟、延伸或扩展。

2)人工智能的实现需要利用计算机及机器学习

人工智能由算法、数据、算力共同驱动,而人工智能技术的基础和核心在于机器学习,并主要依赖于计算机执行[1],需要通过计算机程序来实现,人工智能可以是完全基于计算机程序的,也可以嵌入到硬件设备。

而机器学习的定义是使计算机拥有在没有被明确编程的情况下学习的能力,机器学习的步骤包括:首先选择合适的人工智能模型,所谓模型就是一组函数的集合;其次输入样本数据训练模型,同时需要确定模型训练成功的衡量标准,通常采用损失函数来进行衡量,最后基于衡量标准来确定模型训练成功。

3)人工智能产业分解

人工智能产业从技术实现层面可以分解为基础层、技术层、应用层,基础层涉及计算机硬件技术、计算系统技术、数据处理技术等,技术层涉及算法理论、开发平台、应用技术等,应用层涉及各种行业解决方案及热门产品等。

第2章 人工智能技术的可专利点

2.1 机器学习涉及的专利

人工智能技术的基础和核心在于机器学习,并主要依赖于计算机执行。因此,人工智能领域的专利申请大部分都是涉及计算机程序的专利申请,尤其是和算法相关的专利申请。

机器学习所涉及的专利分为以下几种情况:

1)针对模型训练进行改进而产生的专利;

2)针对模型应用进行改进而产生的专利;

3)针对模型训练和模型应用均有改进而产生的专利。

2.2 模型训练所涉及的可专利点

模型训练是一个通过海量样本数据来对模型参数进行优化的过程,其相关步骤包括:

1)选取数据,包括原始数据的采集、样本数据的挖掘及设置等;

2)数据预处理,数据预处理是对数据提前进行处理和修正,主要包括:特征提取、特征降维、特征空值处理、特征转换、特征归一化、目标值空值处理、目标值转换等;

3)训练效果的验证设置,包括训练集、验证集的数据划分,如训练数据、验证数据的选取及设置、损失函数的设计等;

4)模型训练及测试,用处理好的数据训练模型并进行测试,其中,在模型训练过程中可能涉及到模型内部结构变化、模型参数更新、模型组合训练以及模型训练效率的提升等。

基于上述模型训练的相关步骤,针对模型训练所涉及的可专利点可以体现在以下几个方面:

1)问题的转化

如何将一个实际业务中待解决问题转化为一个机器学习模型训练及应用问题,这一问题的转化过程中往往会产生可专利的技术方案,例如,参见专利CN201810238038.0,其要求保护一种纺织布疵点检测模型的训练方法,其主要创新点就在于将实际业务中的纺织布质量检测的问题转化为一个纺织布疵点检测模型训练的问题,从而形成相应的专利方案。当然,基于问题的转化进行专利挖掘时,要注意在形成专利时不能仅笼统地强调创新点在于在实际业务中引入了模型,要详细描述在该实际业务中针对某一实际业务对象具体是如何利用该实际业务对象自身的属性、特点、参数等进行模型训练的相关设置的。

2)标签标注的方法

在数据本身不具有能直接反映某一问题的标签的情况下,如何对数据进行标注,以及如何提高标签标注的效率、准确率等,相关的技术及操作往往会产生可专利的技术方案,例如,参见专利CN201710581312.X,其要求保护一种基于词标签的词语标注方法,其主要创新点就在于在词语标注的过程中,自动获取相关联的已知词,并将已知词作为标签词对待标注词语进行自动标注,从而形成相应的专利方案。

3)样本数据的处理方法

在对样本数据进行采集、筛选、预处理甚至构造的过程中,针对样本数据进行的新的或特别的处理方法,例如通过处理实现如何扩大样本、如何对样本做倾斜采样处理、如何去除不合适样本等,相关的处理过程往往会产生可专利的技术方案,例如,参见专利CN201811204498.8,其要求保护一种样本数据的处理方法,其主要创新点就在于通过对召回样本的相似条件设置,大大增加正样本的比例,从而形成相应的专利方案。

4)机器学习算法模型的选择和构建

在模型训练之前,如何选择或构建特定的机器学习算法模型,使得模型训练的效果更优,这个过程中往往会产生可专利的技术方案,例如,参见专利CN201911234038.4,其要求保护一种声纹神经网络模型的训练方法,其主要创新点就在于利用一维卷积网络结构和残差网络结构结合的方式来构建神经网络模型,从而形成相应的专利方案。

5)模型训练的验证

在模型训练的过程中,如何针对性地选择度量方式、如何验证模型训练效果,对此如果进行了专门的设置,则往往会产生可专利的技术方案,例如,参见专利CN202010237383.X,其要求保护一种基于人工智能的模型训练方法,其主要创新点就在于在构建损失函数来验证模型训练效果时,专门增加背景扰动损失来度量模型训练效果,以更新网络模型的参数,从而形成相应的专利方案。

6)模型训练的优化

在模型训练的过程中,除了常规的训练步骤之外,如果进行了额外的模型优化操作,如针对模型的特定层或特定的参数进行了优化,或者针对模型的数据分析可视化、特征工程、算法调参、bad case 分析等进行了专门处理,则往往会产生可专利的技术方案,例如,参见专利CN201510830359.6,其要求保护一种人脸识别模型训练方法,其主要创新点就在于在模型进行了初步训练之后,还专门额外针对模型的特定层的特征系数进行二次训练,以实现模型的优化,从而形成相应的专利方案。

7)模型运行的辅助服务设计

在模型训练好之后,针对后续模型运行如果进行了专门的设置,包括线上以及离线特征导入以及线上特征提取、模型线上化、离线和线上模型性能确认、策略研发等,实现了模型运行效果的优化,则往往会产生可专利的技术方案,例如,参见专利CN201811591355.7,其要求保护一种模型上线配置方法,其主要创新点就在于针对训练好的多个模型在上线运行之前,通过对比测试来为各个模型赋予对应的应用权重,并通过应用权重来确定多个模型最终的综合输出结果,从而实现了针对模型上线的专门配置,形成了相应的专利方案。

通过以上分析及案例可知,针对模型训练,从最开始的问题转化,到训练之前针对原始数据的处理、打标签,样本数据的选取及处理,模型的选择及构建,模型训练的验证及优化,以及模型训练好之后的设置等等方面,都有可能涉及可专利点,形成相应的专利技术方案。当然,上述分析并非穷举,只是在针对模型训练进行专利挖掘时提供一些供参考的挖掘方向,事实上在模型训练的过程中,只要进行了不同于现有技术的一些专门处理,都有可能形成可专利点,产生专利技术方案。

2.2 模型应用所涉及的可专利点

模型在训练好之后进行应用的过程中,其输入数据之前的预处理、数据处理的过程以及预测数据的输出,在技术上与模型训练过程是一致的,因此,其可专利点的分析与挖掘也与模型训练是一致的。

与模型训练存在区别的是,针对模型输出结果的具体应用,可考虑模型输出结果与具体应用领域、具体应用场景的结合,在具体结合过程中往往会产生可专利点,形成新的专利技术方案。

第3章 人工智能专利授权的实质性法条要求

3.1 保护客体

涉及人工智能专利的保护客体相关规定的实质性法条包括专利法第2条第2款中关于技术方案的规定和专利法第25条中关于智力活动的规则和方法的规定,其中,基于专利法第25条的规定应注意权利要求不能仅包含算法特征,还要包含技术特征;而基于专利法第2条第2款的规定,则应注意从整体考虑权利要求中记载的全部特征[2],权利要求应记载对要解决的技术问题采用了利用自然规律的技术手段,并由此获得符合自然规律的技术效果。

因此,对于保护客体,考虑要点主要体现在算法要结合具体的技术领域、数据具有确切的技术含义、解决的要是技术问题。

参见专利CN201510944909.7,其保护主题包含了神经网络和神经网络算法本身,而模型及算法本身并不构成技术方案,因此其不属于专利保护客体。

参见专利CN201410056862.6,其要求保护一种建立数学模型的方法,但其权利要求限定的数据属于通用数据,并不具有技术含义,限定的步骤也都是抽象的数学方法步骤,不包括任何技术特征,得到的结果也是抽象的通用分类数学模型,因此,其不属于专利保护客体。

参见专利CN201510242301.X,其要求保护一种用于目标识别的方法,其权利要求仅简单限定了神经网络的训练数据包括语音数据,未体现出与具体应用领域语音领域的紧密结合;并且其通过选择部分隐藏节点进行训练实质上是对神经网络结构的调整,属于神经网络结构本身的优化,并非技术手段,因此,其不属于专利保护客体。

参见专利CN201611184109.0,其要求保护一种基于IPSO-BP神经网络短期股价预测系统,其要解决的问题是对股票短期价格的精确稳定快速预测,并非技术问题,其权利要求限定的数据是股票数据,并非具有确切技术含义的技术数据,算法本身的输入输出关系不能够脱离市场/经济因素的制约,并非遵循自然规律;因此,其不属于专利保护客体。

3.2 创造性

针对创造性进行具体规定的实质性法条是专利法第22条第3款,对于人工智能专利技术方案,若要体现其技术方案是非显而易见的,则应当考虑将算法特征和技术特征结合起来,进行论述,主要考虑以下几点:

1)通过对数据的特殊限定来论述其所处领域的特殊性或技术方案的独特之处;

2)论述算法处理数据的相关操作具有独特之处;

3)论述算法处理后的输出结果具有独特之处;

4)论述算法模型为应用到本申请的技术领域针对模型架构或某些关键参数(如神经网络参数、神经网络层数)等进行了改进。

参见专利CN201610247060.2,其要求保护一种用于检验飞机故障诊断模型的方法,其权利要求与对比文件的区别就在于限定了“第一总线数据为ARINC429总线数据” 和“第二总线数据为ARINC717总线数据”,通过将数据限定为真实飞机的数据而不是模型飞机的数据,即通过对数据的特殊限定来论述其所处领域的特殊性体现出了该方案的创造性。

参见专利CN201410301836.5,其要求保护一种在机器视觉系统中训练图案识别和配准模型的方法,其权利要求与对比文件的区别就在于限定了“从余下的图像中选择得分较高的图像的子集作为模型训练的输入”,并且利用上述区别特征实现通过训练部分图像得到第一图案模型后,不需要用户提供其他模型训练参数,也不对已训练过的图像重复训练,而是从余下的图像中选择分数较高的图像子集作为模型训练的输入再次训练,即通过论述算法处理数据的相关操作具有独特之处体现出了该方案的创造性。

参见专利CN201710485670.0,其要求保护一种使用递归神经网络进行血管疾病检测的方法,其权利要求与对比文件的区别就在于限定了“使用经训练的卷积神经网络CNN将所述2D横截面图像分块中的每一个编码成相应的特征向量”,基于卷积神经网络CNN所进行的编码提取的是横截面图像的高级语义表示的特征,即通过论述算法处理后的输出结果具有独特之处体现出了该方案的创造性。

参见专利CN201610481440.2,其要求保护一种基于级联残差神经网络的图像去噪方法,其权利要求与对比文件的区别就在于限定了“级联残差神经网络模型由三个残差单元串联而成,其中每个所述残差单元包括10层卷积层、每个所述卷积层后的激活层和单位跳跃连接单元,该10层卷积层中前9层卷积层的卷积核大小为3×3,最后一层的卷积核大小为1×1”,通过对上述卷积层数和卷积核大小的选择,已经实现了池化层的功能,因此,无需再引入池化层,从而简化了残差神经网络模型的架构,即通过论述算法模型为应用到本申请的技术领域针对模型架构进行了专门改进体现出了该方案的创造性。

3.3 公开充分

针对公开充分进行具体规定的实质性法条是专利法第26条第3款,对于人工智能专利技术方案,为符合公开充分的要求其考虑要点主要体现在以下几个方面:

1)对于自行设计的公式、函数,说明书中应当有清楚的说明,涉及公式、函数运算的,要确保运算推导过程正确无误;

2)改进在于多个模型联合的,说明书中应当清楚说明模型联合的具体方式及步骤流程;

3)对于自定义的、非公知的操作,说明书中应当有清楚的记载;

参见专利CN201611150823.8,其要求保护一种基于精准能量分配的激光-电弧复合加工的能量分配系数模型的构建方法,其说明书中记载了能量分配比例模型的计算公式,但根据说明书的记载部分表达式并不能准确推导出来,从而导致无法获得上述能量分配比例模型,导致说明书公开不充分。

参见专利CN201910453505.6,其要求保护一种基于联合神经网络模型的图像内容描述自动生成方法,其改进之处在于联合神经网络模型的构建,在说明书中也对具体的构建过程进行了清楚的描述,从而使得说明书公开充分。

参见专利CN201610807693.4,其要求保护一种基于相位噪声数学模型的相位噪声测量方法,其权利要求及说明书中限定了多个自定义的、非公知的操作,如“撤回”、“将波动的频率进行互换”、“将两组相位重合检测结果进行对比”、“得到相位噪声测量结果”,而说明书中对于这些自定义操作并没有进行清楚说明,导致说明书公开不充分。

3.4 支持

针对支持进行具体规定的实质性法条是专利法第26条第4款,对于人工智能专利技术方案,为符合支持的要求其考虑要点主要体现在以下几个方面:

1)注意权利要求与说明书中对方案的描述不要存在很大出入;

2)注意在说明书中仅提供一种特定实现手段的时候,对应权利要求不能过于概括。

参见专利CN200680027219.4,其要求保护一种电力系统中的能量管理方法,根据权利要求1的记载,其使用“负荷数据”和“第一组在线预测的负荷值”分别对离线神经网络进行训练,而根据说明书和附图的记载,仅使用负荷数据对离线神经网络进行一次训练;根据权利要求1的记载,“第一组在线预测的负荷值”既被用来训练离线神经网络,又被用来预测第二组预测的负荷值,即相同的一组数据在两个不同步骤被用于进行不同的计算,而根据说明书和附图的记载,并未使用同一数据进行“训练神经网络”和“预测第二组预测的负荷值”两项运算,从而导致该权利要求没有以说明书为依据,得不到支持。

参见专利CN202010877044.8,其要求保护一种神经网络结构搜索方法,其权利要求1中限定的“由所述当前性能指标和预测的推理时间计算得到奖励值”概括了一个较大的范围,而根据说明书充分公开的内容,在根据当前性能指标和预测的推理时间计算奖励值时,仅采用了特定的计算公式,从而导致该权利要求没有以说明书为依据,得不到支持。

3.5 权利要求清楚

针对权利要求清楚进行具体规定的实质性法条是专利法第26条第4款,对于人工智能专利技术方案,为符合支持的要求其考虑要点主要体现在对于权利要求中涉及公式、函数的,注意相应参数含义要限定清楚。

参见专利CN201911374334.4,其要求保护一种模型训练的方法,权利要求中限定了第一损失函数的公式,但对于公式中的部分参数并没有明确限定其含义,从而导致权利要求不清楚。

3.6 必要技术特征

针对必要技术特征进行具体规定的实质性法条是专利法实施细则第23条第2款,对于人工智能专利技术方案,为符合支持的要求其考虑要点主要体现在以下几个方面:

1)注意明确独立权利要求对应要解决的技术问题;

2)注意必要技术特征一定是不可缺少的;

3)注意独立权利要求不要写入非必要技术特征。

参见专利CN202010871826.0,其要求保护一种神经网络的优化方法,其要解决的技术问题是如何减少神经网络中量化带来的精度损失,提高量化精度;说明书第[0077]-[0079]段的特征是为解决技术问题不可缺少的技术特征,因为为了提高量化精度,必须对重新训练后的神经网络进行量化并计算量化损失,并在量化损失不在预设范围内时再次执行神经网络优化过程,但相应的技术特征并未记载在权利要求1中,从而导致权利要求1缺少必要技术特征。

第4章 人工智能专利的新申请撰写

4.1 技术交底书的分析

对于人工智能专利的技术交底书,可以按照以下顺序对其进行分析:

1)理解技术方案

首先要明确整个方案的步骤流程,比如训练数据的选取、清洗,特征的选取、处理,模型的选取、参数的设置,模型的训练以及模型的应用等;

2)确定技术改进点

首先判断模型在架构上有无改进;比如说,技术方案是否涉及到新的模型架构或者非常规的模型架构,例如具有特殊的层结构的神经网络,或者对每层神经元的个数有特殊设置的神经网络,或者并联或串联的多重神经网络?更进一步地,技术方案将两个或更多的模型进行组合而形成新的模型架构等;

其次判断训练数据的相关处理上有无改进;比如说选取的数据类型、数据清洗、归一化、特征提取、特征处理等。

另外,对于处理好的训练数据,如何对其进行专门的设置以作为模型的输入,可能也会涉及到改进;

再次判断训练过程有无改进;比方说,是用输入数据的特定子集训练模型的每个部分,还是分阶段训练这个模型?训练的过程是否采用了专门设计的并行进程从而减少了训练时间等?

最后判断模型训练好之后,后续应用上有无改进;比如应用到具体的场景、领域,利用模型输出结果作进一步计算、分析、预测等。

4.2 权利要求书的撰写

在撰写权利要求书的过程中,在布局模型应用方法类权利要求时,独立权利要求能不体现模型尽量不要体现,可以考虑采用常规动作的逻辑语言描述模型运行所体现的数据处理过程和结果(例如根据数据进行分类或预测等),以尽可能扩大专利保护范围;

在布局模型训练方法类的权利要求时,可以针对预先确认过的改进点进行布局;

在同时布局模型训练方法类和模型应用方法类的权利要求时,可以先针对模型训练类的权利要求进行布局,随后将模型作为预设条件写入模型应用方法类的权利要求。

4.3 说明书的撰写

在撰写说明书时,其注意事项如下:

1)独立权利要求对应的方案以及其他从属权利要求对应的进一步限定的方案应当完整且相互独立,不要相互混淆,采用一些具有标识作用或区分作用的文字在段落开头进行说明。

特别是说明书中同时包含模型训练和模型应用的方案时,撰写时应当注意区分清楚。

2)对于没有先后执行顺序的多个步骤,说明书中应体现这一点,例如涉及多个模型训练的,不同模型训练的流程之间很可能并不需要体现先后顺序。

3)注意对自定义模型的公开充分:应当对相关数据和算法模型进行描述,且这种描述使得输入数据和输出数据之间通过该模型具有逻辑关联性。

第5章 结论

本文针对人工智能领域的专利,从人工智能的定义出发,详细分析了人工智能技术的特点、人工智能技术的可专利点、人工智能专利授权的实质性法条要求以及人工智能专利的新申请撰写,相关内容为本人在专利代理过程中的一些实践经验总结,具体内容仍有总结不到位或不全面之处,欢迎感兴趣的读者多多交流、多多批评指正,谢谢。

[1] 王锴. 基于审查标准谈人工智能领域的专利申请策略[J].《中国发明与专利》,2020,第10期,91-97.

[2] 安文森. 人工智能发明创造的国际保护挑战[J].《中国发明与专利》,2020,第05期,89-94.