AI搜索的数据之争,知网给秘塔AI搜索发了告知函

就在几天前,中国知网CNKI给秘塔AI搜索引擎发了一份告知函,要求塔秘AI搜索断开知网的网站链接。 有趣的是 Felo AI搜索,可以搜索小红书的内容,小红书的 Robots.txt 显示,不允许匿名爬虫或...
就在几天前,中国知网CNKI给秘塔AI搜索引擎发了一份告知函,要求塔秘AI搜索断开知网的网站链接。

有趣的是 Felo AI搜索,可以搜索小红书的内容,小红书的 Robots.txt 显示,不允许匿名爬虫或机器人索引该站点。

看起来 Robots 协议下,AI搜索又要展开一场数据争夺战。

一般来说,Robots 协议下,爬虫得遵守站点协议,否则构成侵权。


RPA 和 Web 爬虫的区别

RPA(Robotic Process Automation):RPA 是一种自动化技术,用于模拟人类在计算机系统上的操作,例如填写表单、点击按钮、数据输入等。RPA 通常用于特定任务或业务流程自动化,适用于各类应用程序,包括 web 页面。

Web 爬虫:Web 爬虫(Web Scraper)是一种程序,专门用于自动化地抓取互联网内容,通常会访问网页并提取其中的结构化或非结构化数据。爬虫的目标是大规模抓取网站数据,可能涉及到多个页面甚至整个网站的内容。


违反网站使用条款:许多网站明确禁止自动化访问和数据抓取行为。如果使用 RPA 进行大规模数据抓取,违反了这些条款,网站所有者有权采取法律行动,要求停止这种行为,甚至可能追求赔偿。

数据隐私问题:如果 RPA 抓取的是涉及用户个人信息的数据,可能会触犯隐私保护法律,如欧盟的《通用数据保护条例》(GDPR)或美国的《加州消费者隐私法案》(CCPA)。未经用户同意的大规模数据抓取,可能会引发隐私侵权问题。

知识产权侵权:有些数据和内容受知识产权保护,例如文章、图片或数据库内容。未经授权的大规模数据抓取可能会侵犯内容所有者的知识产权。

  • 发表于 2025-01-18 23:42
  • 阅读 ( 23 )
  • 分类:互联网

0 条评论

请先 登录 后评论
注单异常
注单异常

714 篇文章

你可能感兴趣的文章

相关问题