EN
首页>鑫诺动态>衍生数据确权“四要件”探析

衍生数据确权“四要件”探析

鑫诺动态2025-12-29
[摘要]衍生数据确权“四要件”探析

序言

12月17日,最高人民法院通过修订《民事案件案由规定》,增设“数据纠纷”二级案由及其子案由,虽从程序上为数据权益争议提供了明确的诉讼入口,但并未、亦无法从实体上回答一个根本性问题:在何种具体条件下,一项衍生数据能够被确认为一项独立、可受法律保护的权益?这一实体标准的缺失,已成为制约数据要素合规高效流通、影响司法裁判统一性的关键瓶颈。本文旨在融合政策导向、行业实践与司法逻辑,初步搭建衍生数据确权“四要件”实践框架。

一、衍生数据界定的二元范式:“处理说”与“价值说”

明确衍生数据的概念边界,是讨论其权益保护的前提。当前,我国不同效力层级、不同规制目标的规范性文件对衍生数据的界定呈现出两种清晰可辨的范式。

(一)“处理说”:以加工行为与技术形态为核心的风险管控范式

“处理说”侧重于从数据处理活动的客观过程与技术结果来定义衍生数据。其典型代表是国家标准GB/T 43697-2024《数据安全技术 数据分类分级规则》。该标准第3.10条将衍生数据定义为:“经过统计、关联、挖掘、聚合、去标识化等加工活动而产生的数据”。该标准附录I以“加工程度”为维度,对数据进行了分类示例,清晰展示了从原始数据到脱敏数据、标签数据、统计数据、融合数据等各类衍生数据的形态演变。

事实上,前述含义也见常于《金融数据安全数据生命周期安全规范》等以数据安全管理为核心目标的规范中。其规范意旨在于识别和管控数据处理活动带来的风险变化。不同的加工深度(如从原始数据到标签数据、融合数据)意味着数据蕴含的信息敏感度、识别特定自然人或实体的能力、以及对国家安全、公共利益、组织与个人权益的潜在影响(即数据安全级别)可能发生根本性改变。因此,“处理说”为数据分类分级这一基础性安全管理活动提供了较为清晰、客观的技术标尺。

(二)“价值说”:以实质处理和价值增益为核心的权益确认范式

根据国家数据局《数据领域常用名词解释(第二批)》,衍生数据是指:数据处理者对其享有使用权的数据,在保护各方合法权益前提下,通过利用专业知识加工、建模分析、关键信息提取等方式实现数据内容、形式、结构等实质改变,从而显著提升数据价值,形成的数据。此种定义超越了单纯的技术处理视角,强调衍生数据经加工后被赋予了显著的新价值,最终着力点投向数据处理活动所创造的经济与社会价值提升,本文谓之“价值说”。

2025年12月1日起施行的《湖南省数据条例》在其附则中也完全采纳了这一定义。可以想见,此定义今后将更多见于各类旨在促进数据开发利用、明晰数据权益、推动数据要素市场的文件中。

“价值说”虽仍然必须建立在对数据的深度加工处理的基础之上,但其核心与“处理说”不同,它并非为安全管理与风险控制提供标尺,而是为权益确认与利益分配提供切割基石,即类比于知识产权的法理保护逻辑,数据处理者因其专业性的、实质性的投入(智力、资本、劳动),使原始数据发生“实质改变”,产生了独立于原始数据的新效用(如预测能力、分析结论、用户画像等等),法律应当保护和激励那些能够创造显著新价值的数据处理行为。而衍生数据作为这一处理行为的产物和新增价值的载体,其权益理应由数据处理者享有。这一定义与数据要素市场化改革中“按价值贡献参与分配”的原则高度契合。

本文对衍生数据独立权益的探讨,亦主要立基于此“价值说”范式。

二、衍生数据独立权益的权属框架

在明确概念的基础上,需进一步简单明确本文所探讨的“独立权益”的权属内涵。

《中共中央国务院关于构建数据基础制度更好发挥数据要素作用的意见》(“《数据二十条》”)明确提出了“建立数据资源持有权、数据加工使用权、数据产品经营权等分置的产权运行机制”。这一表述在政策文件中形成了对数据权利分置的初步制度架构,其划分思路体现了对数据从资源到产品转化过程中不同权利配置的需求。 随后,国家数据局在工作推进与政策衔接中,结合实践需要与管理逻辑,对相关权利表述进行了进一步整合与提炼,明确了数据产权,是指权利人对特定数据享有的财产性权利,包括数据持有权、数据使用权、数据经营权等[1]”。这一调整既延续了“三权分置”的制度内核,也强调了权利在运行过程中的层次性与可操作性。虽如前所述,上位法尚未明确数据权属的具体种类和内涵,但依据前述政策与规范性文件,本文所称的衍生数据独立权益亦可具化为前述“数据产权”;确认数据处理者享有数据产权的过程谓之“确权”。

三、衍生数据确权“四要件”

综合政策导向、法理基础与司法实践,衍生数据若要构成一项独立的、可受法律保护的数据产权,需满足以下四个构成要件。

(一)要件一:原始数据来源合法——权益生成的合法性基石

任何财产性权益的合法性,都植根于其产生基础的正当性,对于衍生数据权益而言,这一基础便是其加工处理所依赖的原始数据。

如果原始数据系通过窃取、欺诈、非法侵入计算机信息系统、或通过其他明确违反法律禁止性规定或公序良俗的手段获得,则基于此类非法数据进行的任何加工处理,无论其技术多么复杂、投入多么巨大,所产生的衍生数据均为“毒树之果”。因此,若以非法获取的原始数据为基础产生的“衍生数据”,其权益主张将在司法审查的源头即因缺乏合法性基础而被否定。

需要说明的是,虽根据国家数据局的《数据领域常用名词解释(第一批)》,“原始数据”是指初次产生或源头收集的、未经加工处理的数据。但为了区别于衍生数据,本文中将用于加工生成衍生数据的数据也称之为“原始数据”(亦有文件将其称为“源数据”)。同时,笔者认为,在“价值说”下,不论是初次产生即“原始取得”的数据还是依法从第三方“继受取得”后用于加工生成衍生数据的数据,对于数据处理者基于实质投入产生的价值增值权益保护来说没有实质性区别,因此在本文中对“原始取得”和“继受取得”加以区分的意义不大,二者均属于本文所指的“原始数据”范畴。

原始数据的合法来源通常包括:依据“知情同意”等原则自行合法收集、依据有效合同合法采购或经授权取得、遵守相应规则(如Robots协议)的合法网络爬取、以及法律法规允许的其他方式。原始数据来源合法性是维护数据市场秩序、杜绝非法“洗白”行为的首要关口。

(二)要件二:以创设独立使用价值为目的进行数据处理——权益形成的主观要件

数据处理者运用专业知识、算法与工具对原始数据进行深度加工,旨在创造具有新效用(如预测分析、智能决策支持等)的数据产品,这一过程体现了数据处理者的主观意志。亦如民法中“先占”的成立要件之一须为权利主体应“以所有的意思对物进行占有”,笔者认为,衍生数据产权的成立要件之二应为:数据处理者须以“创设具有独立使用价值的衍生数据”的意思对原始数据进行处理;“独立使用价值”是指衍生数据的价值应有别于原始数据的“资源属性”或其固有“使用价值”,这也是衍生数据独立于原始数据应获得法律保护的核心。本要件决定了与数据处理者意志无关或随机、偶发生成的数据即便与原始数据截然不同,亦不能产生受法律保护的数据产权。

在深圳市腾讯计算机系统有限公司与杭州祺韵网络技术有限公司等著作权侵权、不正当竞争纠纷案[2]中,法院认为:“对于用户因注册、浏览、交互式参与等行为而在平台上留下的原始数据,如果平台在数据收集后,没有投入更多的成本将这些数据作为重要资源予以运营和保护,则不宜因平台主张利益就当然对其进行保护,否则将导致数据封闭和数据垄断,不利于数字经济的发展”;在深圳市某某计算机系统有限公司、某某科技(北京)有限公司、某某数码(天津)有限公司诉上海某某有限公司不正当竞争纠纷案中,法院认为被告某乙公司虽实施了“筛重、分类[3]”等处理行为但“对涉案数据的利用并未形成新的衍生品、创造数据的再生价值,而是利用了**新闻平台通过长期经营积累的数据资源为其自身获取竞争利益……某乙公司的被诉行为构成对某甲公司的不正当竞争”。

前述案例亦能表明,在司法实践中,数据处理者若未以寻求独立的使用价值为目的对数据进行处理,或者处理后的数据不具备区别于原始数据的“独立使用价值”,均无法成立衍生数据的独立产权。

(三)要件三:原始数据经处理发生“实质改变”并具备独立使用价值——权益形成的客观表征

马克思主义政治经济学认为,价值是凝结在商品中无差别的人类劳动。在数据领域,当数据处理者运用算法模型、分析工具等,对原始数据进行建模、分析、整合与提炼时,原始数据在结构、形态、信息内涵或功能属性上发生实质改变,这一过程凝结了数据处理者的智力与劳动,形成具有新的独立使用价值的衍生数据,能够为数据处理者带来新的经济效用、竞争优势或商业价值。

之所以强调原始数据的“实质改变”或者说改变后的衍生数据须有“独立使用价值”,其原因主要在于法律要激励真正的价值创造,而非“跑马圈地”,法律保护过度会不当阻碍数据这一重要生产要素的流通与再利用。而“实质改变”和“独立使用价值”为衍生数据权利的诞生设定了一个平衡标准,有助于将衍生数据产权与原始数据权利进行法律上的切割,减少“搭便车”等不正当竞争行为与冲突。

综上,基于“价值说”的视角,技术处理固然是衍生数据形成的必经之路,但判断其是否构成“实质改变”,关键并非机械地审视所采用的技术手段本身,而应着眼于最终的结果。这正如专利制度保护的并非技术复杂度,而是其中蕴含的“独创性”。笔者认为,对“实质改变”的认定,应回归结果标准:经处理形成的衍生数据是否已具备明确的、独立于原始数据的使用价值。这一点在司法实践中已有所体现,例如深圳市某某计算机系统有限公司等诉上海某某有限公司不正当竞争纠纷案表明,若数据处理行为未改变数据的根本用途,其成果便难以形成具有创新性的独立使用价值,自然也无法构成一项独立的权益客体。

此外,当衍生数据的形成过程(如对数据的选择、编排、计算体系的构建)和结果体现了独创性的智力创作时,其本身可能构成著作权法上的作品(如汇编作品、图形作品、模型作品等),此时亦可依著作权法上的请求权主张权益。篇幅所限,本文不再展开。

(四)要件四:数据处理与使用具有正当性——权益行使的合法边界

即使一项衍生数据来源合法、加工具有实质性、且具备创新性使用价值,数据处理者对该数据的加工行为本身以及后续对衍生数据的具体使用行为,也必须具有法律上或合同上的正当性。这一要求至少包含如下两点:

1.数据处理者必须具有以实现特定目的对原始数据进行加工的处理权限。

虽国家数据局《数据领域常用名词解释》中“数据使用权,是指权利人通过加工、聚合、分析等方式,将数据用于优化生产经营、提供社会服务、形成衍生数据等的权利”,但“数据使用权”是否天然包含生成特定衍生数据的权利?答案是否定的。尤其是在涉及个人信息处理时,数据处理者加工生成特定衍生数据的权利范围,必须与其获取原始数据时所依据的合法基础和处理目的保持一致。 以高速公路运营场景为例:

正面情形中,运营方基于履行高速公路通行服务合同而收集车牌、时间、站点等数据,将其加工为"高风险逃费预警数据",用于识别逃费行为并追缴费用。此处的数据加工行为与原始收集目的(通行服务与收费管理)直接相关,构成合同履行之必要,因此具备将原始数据加工成"高风险逃费预警数据"这一衍生数据的处理权限。

反面情形中,若同一运营方将上述数据加工为"高频商务人群出差画像"用于商业营销,则产生了本质区别:首先,商业营销分析不属于履行通行合同所必需的范围,高速运营方不享有此种情形下的“豁免同意”;其次,实际生活中,在高速公路运营方通常未予明示《隐私政策》的情况下,该行为无法满足《个人信息保护法》所要求的"告知-同意"基本原则。因此,在此情形下,运营方显然缺乏将原始数据加工为此类“衍生数据”的合法使用权限。

由此可知,数据使用权在不同的情况下,尤其是在个人信息框架下并不是一项概括或笼统的权限范围。数据处理者是否具有加工生成特定衍生数据的权限需要根据数据来源的具体场景和法律文件(如《隐私政策》、数据采购合同、数据许可协议、个人信息处理授权同意书等)进行具有针对性的解读。

2.使用衍生数据的目的与方式须具有正当性——以不损害其他主体的合法权益为限

“不损害其他主体的合法权益”是权利行使的普遍边界,数据权益的行使亦应遵循这一原则。在深圳市腾讯计算机系统有限公司与杭州祺韵网络技术有限公司等著作权侵权、不正当竞争纠纷案中,法院明确“从推进社会经济发展的角度,应当允许不同主体在不损害其他主体合法权益的基础上,自主地对数据进行占用、使用、收益[4]”,此中前提即为“不损害其他主体的合法权益”。因此,即使数据来源与加工行为均为合法,对衍生数据的具体使用也必须以不损害他人的合法权益为边界,如数据处理不得侵犯在先的知识产权,不得违反《个人信息保护法》的要求,不得利用衍生数据实施《反不正当竞争法》第十二条所禁止的扰乱市场秩序、损害其他经营者合法权益的行为等等。

综上所述,通过融合政策设计、行业逻辑、法理基础与司法实践,本文尝试构建“四要件”的分析框架,通过明确合法性基础、主观目的、客观表征和行为边界这四个要件,平衡数据价值创造激励与数据安全、个人信息保护及公平竞争秩序维护等多重目标,愿在当下数据专门立法尚未出台的过渡期,为衍生数据独立权益的认定提供一个具有操作性的思考路径、推动形成更为清晰稳定的权属认定标准。

[1] 见国家数据局发布《数据领域常用名词解释(第二批)》

[2] 见广州互联网法院一审(2020)粤0192民初20405号《民事判决书》

[3] 天津自由贸易试验区人民法院(2022)津0319民初11108号《民事判决书》

[4] 见广州互联网法院一审(2020)粤0192民初20405号《民事判决书》案例编写:李俊松、李婷《深圳市腾讯计算机系统有限公司与杭州祺韵网络技术有限公司等著作权侵权、不正当竞争纠纷案》

本文章为相关议题的交流或探讨,仅代表作者本人观点,不得视为鑫诺律师事务所或其律师出具的正式法律意见或建议。如需转载或引用该文章的任何内容,请注明出处。未经本所书面同意,不得转载或使用该文章中包含的任何图片或影像。如您有意进一步交流或探讨,欢迎与本所联系。

新版尾图-网站.jpg

相关律师

手机分享