1. 首页>>网络热点>>即时新闻

爬取数据,存在哪些法律风险

【法治课】

作者:兰国红(北京知识产权法院法官)

互联网时代充斥着大量的数据。这些数据看似微不足道,但在算法的支持下,它们已经成为商家竞争的资源。数据生产不是一天的工作,不是一个人的力量。在数据巨大的市场价值驱动下,数据爬行已成为许多企业获取数据的首选。那么,数据能爬取吗?什么样的爬行是不允许的?我们从两个关于数据爬取的案例中探讨一下。

百度地图不仅具有导航定位功能,还为网络用户提供商户信息查询、团购等服务。为了吸引更多的用户,百度地图在网上爬取了大量的用户评论。法院认为,百度地图使用了大量的大众评论网络评论信息,取代了大众评论网络向网络用户提供信息,抓住了大众评论网络的流量和交易机会,导致大众评论网络流量减少,对大众评论网络造成损害,构成不公平竞争。

在“鹰击”系统爬取微博数据的案例中,“鹰击”系统不仅爬取了微博前台的公开数据,还绕过防范设置爬取了微博后台的非公开数据。在“鹰击”系统爬取数据后,进一步显示和分析微博平台的数据,最终为用户形成数据分析报告。法院认为,“鹰击”系统干扰了微博平台的正常运行,增加了微博的运营成本,影响了微博运营商的授权和相关收入,构成了不公平竞争。

从以上两个案例可以看出,数据是可以爬行的,但爬行并不都是合法的。如果爬行内容实质性地取代了数据源网站,则是一种“搭便车”行为,会对同行业的竞争对手造成损害。此外,绕过被爬行对象设置的访问权限或破坏网站设置的技术措施爬行非公开数据会干扰被爬行对象的正常运行,损害被爬行对象,这也是一种不公平的竞争行为。

有人认为技术是中立的。如果能绕过技术屏障爬取数据,恰恰体现了技术的进步,不负责任。这一说法有待商榷。虽然技术本身不是可责任的,但研发和使用技术的人对技术的功能和目的是明确和明确的。当然,将技术作为实施不当行为的手段是可责任的。

还有一种观点认为,数据来自用户,不能被视为企业的财产,应允许自由使用。这种观点有其可取之处,但绝不是爬数据不当的正当理由。数据本质上是信息的集合,数据的来源是多样化的,可能来自用户或客观事实,如天气信息和地理信息。无论数据来自哪里,只要数据持有人对数据生成进行必要的投资,就应得到保护。

数据爬行是许多数据使用和处理的行为之一。在司法实践中,涉及数据的不当行为还包括未经许可使用他人数据产品的不当行为;不当获取数据后形成并提供自己的数据产品;污染数据的刷刷量;破坏或干预数据生成;设置Robots协议,限制特定主体捕获数据。

法律还为这些涉及数据的不当行为提供了许多保护路径,包括作权法、反不正当竞争法和反垄断法。例如,数据产品不仅可以作为汇编作品或计算机软件作品提起侵犯作权的诉讼,还可以对抓取非公开数据的行为提起侵犯商业秘密的诉讼,对刷刷行为提起虚假宣传诉讼,对不打开数据界面的反垄断诉讼。然而,在大多数情况下,数据不是原创的、创造性的或秘密的,传统的知识产权部门法在数据保护过程中不适应。因此,为了促进数据的交易和流通,保护数据链上相关者的利益,有必要赋权数据。

数据的无形性和非消耗性使数据与知识产权保护对象有了自然的亲缘关系。在为数据创建权利时,笔者建议充分借鉴知识产权的权利设计模式。同时,由于数据所涉及的利益主体是多样化和交叉的,它不仅涉及数据收集和处理主体的利益,还涉及个人信息和公共利益。因此,为数据提供的保护应该是弱保护,只赋予数据有限的排他权。在具体权项设计中,应重点关注数据持有、披露、使用、损坏等典型数据不当行为,并辅以相应的权利限制制度。

《光明日报》( 2023年03月25日05版)

来源: 光明网-光明日报

本文由seo技术发布/转载,不代表seo技术网立场,如有侵权请联系站长删除或下架处理!

本文采摘于网络,不代表本站立场,转载联系作者并注明出处:https://www.w7758.com/jishi/6894.html