Scrapy框架-Selector的用法

Selector的用法

Scrapy shell

借助Scrapy shell来模拟Scrapy请求的过程:
cmd输入以下命令开启Scrapy shell:
scrapy shell
http://doc.scrapy.org/en/latest/_static/selectors-sample1.html

Scrapy框架-Selector的用法
可以在该模式下输入命令调用对象的一些操作方法,回车之后实时显示结果
Scrapy框架-Selector的用法

; XPath选择器

Scrapy框架-Selector的用法

返回结果是selector组成的列表,实际上是SelectorList类型,仍然可以继续调用xpath()和css()等方法来进一步提取数据。 和列表的操作方法是一样的

CSS选择器

与xpath用法一致

  • 选取节点:response.css(‘a’)
  • 提取节点:response.css(‘a’).extract()
  • 属性选择:response.css(‘a[href=”image1.html”]’).extract()
  • 节点内部文本和属性获取:response.css(‘a[href=”image1.html”]::text’).extract_first()
    response.css(‘a[href=”image1.html”] img::attr(src)’.extract_first()
    获取文本和属性需要用::text和::attr()的写法
    xpath()和css()方法可以任意自由组合实现嵌套查询

正则匹配

Scrapy框架-Selector的用法
*直接调用re()方法会提示没有re属性,但是先调用了xpath(’.’)选中全文,再调用就可以进行正则匹配了。

Original: https://blog.csdn.net/shallow_xxx/article/details/114487795
Author: shallow~萱
Title: Scrapy框架-Selector的用法

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/792205/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球