Selector的用法
Scrapy shell
借助Scrapy shell来模拟Scrapy请求的过程:
cmd输入以下命令开启Scrapy shell:
scrapy shell
http://doc.scrapy.org/en/latest/_static/selectors-sample1.html
可以在该模式下输入命令调用对象的一些操作方法,回车之后实时显示结果
; XPath选择器
返回结果是selector组成的列表,实际上是SelectorList类型,仍然可以继续调用xpath()和css()等方法来进一步提取数据。 和列表的操作方法是一样的
CSS选择器
与xpath用法一致
- 选取节点:response.css(‘a’)
- 提取节点:response.css(‘a’).extract()
- 属性选择:response.css(‘a[href=”image1.html”]’).extract()
- 节点内部文本和属性获取:response.css(‘a[href=”image1.html”]::text’).extract_first()
response.css(‘a[href=”image1.html”] img::attr(src)’.extract_first()
获取文本和属性需要用::text和::attr()的写法
xpath()和css()方法可以任意自由组合实现嵌套查询
正则匹配
*直接调用re()方法会提示没有re属性,但是先调用了xpath(’.’)选中全文,再调用就可以进行正则匹配了。
Original: https://blog.csdn.net/shallow_xxx/article/details/114487795
Author: shallow~萱
Title: Scrapy框架-Selector的用法
原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/792205/
转载文章受原作者版权保护。转载请注明原作者出处!