当前位置:首页 > 新闻中心 > 热点问题 >

你知道吗?网络爬虫也分“善恶”

  • 发表时间:2018-12-12     18:20:41

摘 要:在我们之前的文章《什么是网络爬虫》中,我们就网络爬虫对大家做了一个基本介绍。相信大家在看过之后,也一定对网络爬虫这种东西有一定的了解。但是,你知道吗,网络爬虫也有

你知道吗?网络爬虫也分“善恶” 
你知道吗?网络爬虫也分“善恶”
 
  在我们之前的文章《什么是网络爬虫》中,我们就网络爬虫对大家做了一个基本介绍。相信大家在看过之后,也一定对网络爬虫这种东西有一定的了解。但是,你知道吗,网络爬虫也有“善恶”之分。
 
  每当逢年过节的时候,大家都急着买票回家。但是,铁路部门的票都是有数量的,不可能说你一买就买得到,有的人甚至要等很多时间。于是,就有了网络订票这一选择。现在,有很多的抢票软件都可以尽进行网络抢票,而进行网络抢票就要用到网络爬虫。每个网络爬虫造访12306网站时,就相当于人来点击了一下12306网站。但是抢票对于很多买不到票,不会抢票的人来说又很不公平,于是就有了验证码这种东西。因为网络爬虫只是机械的点击,并不能识别验证码,所以用验证码可以把一部分网络爬虫抵挡在12306网站的大门外,对于12306来说这些爬虫都是“害虫”。据统计,出行行业的爬虫是全网爬虫中最多的,而在这出行行业的爬虫中,超过89%都是奔着12306网站去的。因为在中国卖火车票的企业只此一家。
 
  我们在玩微博的时候,常常会说某个人的微博粉丝里全是“僵尸粉”。而“僵尸粉”,其实也就是网络爬虫造成的。利用“僵尸粉”可以快速给自己制造大量的粉丝或留言。但是对于微博来说,显然不同意这种做法,于是在微博上的这类网络爬虫就是“害虫”。
 
  我们在电商网站上购买东西时,在搜索框里输入商品名字,会排列出来很多商品,人们往往也只会看前面几种。但是,你知道吗?你所看到的排在前列的商品,有可能不是电商平台给你推荐的,而是网络爬虫想要你看到的。因为网络爬虫在这里模拟的点击过程,往往点击高的会排在前头,但是作为电商网站又很难阻止这些爬虫,因为电商网站总不可能给用户设置一大堆验证码吧。所以,在这里,对电商网站而言这种爬虫就是“害虫”。
 
  在网络的世界里,还存在很多的“有害网络爬虫”。比如说恶意抢医院挂号资源的、通过爬虫恶意提升自己网站排名的等等。但是网络爬虫本身是不具有善恶观的,得看操控它的人怎样去使用它。