AI搜索的数据之争，知网给秘塔AI搜索发了告知函

就在几天前，中国知网CNKI给秘塔AI搜索引擎发了一份告知函，要求塔秘AI搜索断开知网的网站链接。

有趣的是 Felo AI搜索，可以搜索小红书的内容，小红书的 Robots.txt 显示，不允许匿名爬虫或机器人索引该站点。

看起来 Robots 协议下，AI搜索又要展开一场数据争夺战。

一般来说，Robots 协议下，爬虫得遵守站点协议，否则构成侵权。

RPA 和 Web 爬虫的区别

RPA（Robotic Process Automation）：RPA 是一种自动化技术，用于模拟人类在计算机系统上的操作，例如填写表单、点击按钮、数据输入等。RPA 通常用于特定任务或业务流程自动化，适用于各类应用程序，包括 web 页面。

Web 爬虫：Web 爬虫（Web Scraper）是一种程序，专门用于自动化地抓取互联网内容，通常会访问网页并提取其中的结构化或非结构化数据。爬虫的目标是大规模抓取网站数据，可能涉及到多个页面甚至整个网站的内容。

违反网站使用条款：许多网站明确禁止自动化访问和数据抓取行为。如果使用 RPA 进行大规模数据抓取，违反了这些条款，网站所有者有权采取法律行动，要求停止这种行为，甚至可能追求赔偿。

数据隐私问题：如果 RPA 抓取的是涉及用户个人信息的数据，可能会触犯隐私保护法律，如欧盟的《通用数据保护条例》（GDPR）或美国的《加州消费者隐私法案》（CCPA）。未经用户同意的大规模数据抓取，可能会引发隐私侵权问题。

知识产权侵权：有些数据和内容受知识产权保护，例如文章、图片或数据库内容。未经授权的大规模数据抓取可能会侵犯内容所有者的知识产权。

0 条评论