工欲善其事必先利其器,scrapy工程创建好以后,需要简单设定几个参数,来开启使用
第一个:
源文件下的 allowed_domains这个变量需要注释掉,这个变量用来限定哪些进行请求,不在列表中的不进行请求,所以要注释掉,代表对请求不做限制
第二个:
setting.py文件中的ROBOTSTXT_OBEY = True改为ROBOTSTXT_OBEY = False,
setting.py是scrapy的设置文件,ROBOTSTXT_OBEY参数是确定是否遵守网站的robots协议,建议自学的时候改为False
Original: https://blog.csdn.net/ragerabbitr/article/details/122145123
Author: ragerabbitr
Title: scrapy的初始化的一些设定
原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/790254/
转载文章受原作者版权保护。转载请注明原作者出处!