数据作为重要的生产要素已经成为兵家必争之地。实践中,围绕数据的爬取与反爬取、爬取后数据的合理使用,以及OpenAPI开发合作模式中的授权使用原则等问题都曾产生过不正当竞争纠纷。
在争讼案件不断积累的过程中,数据不正当竞争认定规则也不断清晰,可以归纳出以下几点:一、限制搜索引擎抓取应有行业公认合理的正当理由;二、判断限制非搜索引擎抓取行为的正当性需保护经营者自主权与多元利益的平衡;三、抓取后数据的使用不可超出“必要的限度”;四、OpenAPI开发合作需遵守“用户授权”+“平台授权”+“用户授权”的三重授权原则;五、区分数据抓取行为与使用行为的正当性认定标准,构建数据权益动态赋权制度,促进数据安全合法流动。
限制搜索引擎抓取应有行业公认的正当理由
在奇某公司诉百某公司(设置robots白名单限制抓取)不正当竞争纠纷一案中,一审法院北京市第一中级人民法院(2013)一中民初字第13657号民事判决查明,2012年11月1日,在中国互联网协会的牵头组织下,十二家互联网企业签署了《互联网搜索引擎服务自律公约》。该公约第七条第一款规定:遵循国际通行的行业惯例与商业规则,遵守机器人协议(robots协议)。第八条规定:互联网所有者设置机器人协议应遵循公平、开放和促进信息自由流动的原则,限制搜索引擎抓取应有行业公认合理的正当理由,不利用机器人协议进行不正当竞争行为,积极营造鼓励创新、公平公正的良性竞争环境。
一审法院强调,奇某公司的3××搜索引擎属于通用搜索引擎,而通用搜索引擎的网络机器人进入一个对公众开放的网站抓取信息,通常并不会损害网站的利益,反而有利于其宣传推广。在综合考量案件情况之后,一审法院判决百某公司立即停止涉案不正当竞争行为。百某公司提起上诉。二审法院北京市高级人民法院(2017)京民终487号民事判决指出,“可以将互联网行业协会组织其会员起草并签署的行业自律公约的相关约定作为认定互联网行业惯常行为标准和公认商业道德的参考依据。”在对涉案行为给经营者利益、消费者利益、竞争秩序带来的影响进行分析后,二审法院判决驳回上诉,维持原判。
判断限制非搜索引擎抓取行为的正当性需保护经营者自主权与多元利益的平衡
在字某跳动公司与微某创科公司不正当竞争纠纷一案中,二审法院北京市高级人民法院(2021)京民终281号民事判决强调:“搜索引擎是给被搜网站带来流量和利益,而非搜索引擎的网络机器人往往不是给被搜网站带来流量,反而可能带走被搜网站的流量。由于非搜索引擎场景应用的网络机器人,已经不像搜索引擎那样当然地对公众利益,以及互联网的互联、互通、共享、开放的精神产生影响,因此在对这些网络机器人通过robots协议进行限制时,不宜当然地借用对于搜索引擎进行限制的规则。也就是说,《互联网搜索引擎服务自律公约》仅可作为搜索引擎服务行业的商业道德,而不能成为互联网行业通行的商业道德。”
二审法院还指出,在判断robots协议对于网络机器人限制行为的正当性时,其核心在于保护网站经营者的自主经营权与维护其他经营者利益、维护消费者利益、维护竞争秩序之间的平衡。尽管robots协议客观上可能造成对某个或某些经营者的“歧视”,但在不损害消费者利益、不损害公共利益、不损害竞争秩序的情况下,应当允许网站经营者通过robots协议对其他网络机器人的抓取进行限制,这是网站经营者经营自主权的一种体现。
抓取后数据的使用不可超出“必要的限度”
遵守robots协议抓取信息,是不是就不会构成不正当竞争?在汉某公司与百某公司不正当竞争纠纷案中,一审法院上海市浦东新区人民法院(2015)浦民三(知)初字第528号民事判决明确:“Robots协议只涉及搜索引擎抓取网站信息的行为是否符合公认的行业准则的问题,不能解决搜索引擎抓取网站信息后的使用行为是否合法的问题。”
二审法院上海知识产权法院(2016)沪73民终242号民事判决更进一步指出,汉某公司对涉案信息的获取付出了巨大的劳动,具有可获得法律保护的权益,而百某公司的竞争行为亦具有一定的积极效果,在此情况下应当对两者的利益进行一定平衡。百某公司在使用来自大众点评网的评论信息时,理想状态下应当遵循“最少、必要”的原则,即采取对汉某公司损害最小的措施。但是要求百某公司在进行商业决策时,逐一考察各种可能的行为并选择对汉某公司损害最小的方式,在商业实践中是难以操作的。但如果存在明显有对汉某公司损害方式更小的方式而未采取,或者其欲实现的积极效果会严重损害汉某公司利益的情况下,则可认定为使用方式已超过必要的限度。
OpenAPI开发合作需遵守三重授权原则
在微某公司与淘某公司不正当竞争纠纷案中,二审法院北京知识产权法院(2016)京73民终588号民事判决指出,新某微博在实施开放平台战略中,有条件地向开发者应用提供用户信息,坚持“用户授权”+“新浪授权”+“用户授权”的三重授权原则,目的在于保护用户隐私同时维护企业自身的核心竞争优势。脉×应用于2013年10月底上线,是一款基于移动端的人脉社交应用,通过分析用户的新某微博和通讯录数据,帮助用户发现新的朋友,并且可以使他们建立联系。但是,淘某公司违反《开发者协议》,未经用户同意且未经微某公司授权,获取新某微博用户的相关信息并展示在脉×应用的人脉详情中,侵害了被上诉人微某公司的商业资源,不正当地获取竞争优势,这种竞争行为已经超出了法律所保护的正当竞争行为。
区分数据抓取行为与使用行为的正当性认定标准
在天津某数码公司诉上海某公司数据不正当竞争纠纷案中,一审法院天津自由贸易试验区人民法院(2022)津0319民初11108号民事判决书指出,数据的价值在于流通,数据的有效利用有助于提高企业的生产效率、改善产品品质与服务体验,特别是某些新兴产业的生存与发展更需要依赖于对数据的收集与利用,通过对原始数据的加工创造出衍生数据产品,从而创造数据的再生价值,推动社会经济与行业的整体进步。涉案的被告上海某公司未经原告许可,整体搬运涉案数据并直接用于涉案产品的新闻栏目中,该行为既非实现涉案产品正常运营的必要手段,亦不符合社会公共利益的价值需求,其所实现的效果并不足以弥补被诉行为给原告所造成的损失,影响了正常的市场竞争秩序和健康公平的行业生态,降低了消费者的福利,超出了数据利用的合理限度,具有不正当性。
通过该案的判决可以大致总结两项基本规则,也可以认为是在贯彻实践《数据二十条》意见的基础上,对当前司法实践中就数据不正当竞争行为违法性认定规则的调整与完善。
其一,在人工智能场景下,利用机器人爬虫技术通过全网抓取已成为数据企业获取生产原料的主要方式的情况下,对数据爬取等数据机器化获取行为在提高数据获得效率、降低数据使用成本、增进数据流通速率、更好释放数据价值上的合理性与合法性认定有了新的认识,不再简单地以数据静态赋权的方式,来判断数据爬取行为的当然违法性,而是将数据获取行为正当性的判断与数据动态创新所带来的价值一并考量。其中,也要看到随着网络爬虫应用场景的不断扩展,非搜索引擎应用场景下的网络爬虫也开始收集其他网站公开乃至用户生成的各种数据,可能出现不仅无法给网站带来流量,反而分流源网站流量的情况,在此种情形下,网络服务提供者在收集、使用他人数据时应负有更高的注意义务,尊重他人合法数据权益。
其二,关注数据利用的合理限度,或者试图建立数据合理使用的判断标准,将数据权益动态赋权制度引入司法裁判,更加关注与数据安全合法流动相关的价值实现,即为了实现数据安全合法流动所必需的行为及成本的合理分配,必须赋予数据企业在数据采集、使用、存储、流通、交易等各环节中所付出的必要成本和可预期收益的充分填补与合理回报,以明确稳定且更好地规范与激励数据企业合理使用数据,多维度、全流程细化和优化数据行为正当性识别标准。
特别需关注数据安全、合法流动,平台经营者为管控和处理其享有合法权益的数据,在不损害公共利益和他人合法利益的前提下,有权自主决定哪些信息或数据,在什么范围内、允许或限制哪些主体进行抓取和使用,理应属于经营者自主经营的范畴。
在科学合理配置数据权益的基础上,平衡数据安全保护与开发使用的关系,在不断完善数据分类分级的基础上,建立以市场机制为基础的数据合理使用制度,在明确利益享有与安全义务相匹配的基础上,动态适配有序竞争与合理规制之间的关系。
(陈兵系南开大学竞争法研究中心主任、法学院副院长、教授,南开大学数字经济交叉科学中心研究员;赵青系南开大学竞争法研究中心助理研究员、法学博士)