python爬虫详解(五)——爬取王者荣耀英雄详细、攻略搭配、出装配置、铭文搭配、搭档/压制、入手详情

今天给大家爬取一个王者荣耀的详情,让大家更好更快了解,说白了,就是想练练手

点个赞留个关注吧!!

今天爬取的内容相对简单,我也不知道难不难,可能对于新手来说会一点难,难就难着吧,不下功夫当然过不了,熬三个夜晚就会了

今天爬取的主要内容分别是: 英雄名称、详情链接、英雄属性(生存、伤害、技能、难度) 、英雄皮肤(非图片) 、铭文搭配推荐、召唤师技能推荐(针对不同英雄给予不同的推荐) 、出装搭配推荐(两种方案) 、最佳的搭档、压制英雄、被压制英雄

爬取的不包含图片/文件,只有可视文字字幕,,用了一个晚上做出来的,闲的睡不着觉才想到做这个爬虫的,希望能帮助到大家,不妨先点个关注,给个赞也可以

因为这个网站的一些问题,爬取不到前几位的英雄,我试了很多次都无济于事,也懒得搞了就暂时先不管这个了,如果有哪一位博主知道怎么回事,请在评论区或私信说一下,谢谢

python爬虫详解(五)——爬取王者荣耀英雄详细、攻略搭配、出装配置、铭文搭配、搭档/压制、入手详情

python爬虫详解(五)——爬取王者荣耀英雄详细、攻略搭配、出装配置、铭文搭配、搭档/压制、入手详情

废话不多说,由于代码较多,原本我也想分三个文件写入,但是我太懒了,直接写到一个py文件内了,直接上代码:

-*- coding: utf-8 -*-
import requests
import re
from bs4 import BeautifulSoup

URL = requests.get('https://pvp.qq.com/web201605/herolist.shtml')
html = URL.content
soup = BeautifulSoup(html,'html.parser',from_encoding="utf-8")  #解析器
div_people_list = soup.find('ul', attrs={'class': 'herolist clearfix'})

for a in div_people_list.find_all('li'):
    #爬取人物详情链接
    text_1 = a.find('a')
    URL_2 = ('https://pvp.qq.com/web201605/'+text_1['href'])  #链接

    #脾气任务名称
    URL_3 = requests.get(f'{URL_2}')
    html_2 = URL_3.content   #再次解析
    soup_2 = BeautifulSoup(html_2,'html.parser',from_encoding="utf-8")  #解析器
    text_2 = soup_2.find('h2', attrs={'class': 'cover-name'}).get_text()   #名称

    #print(text_2+'\t\t'+URL_2)
    #爬取任务伤害比例
    text_3 = soup_2.find('ul', attrs={'class': 'cover-list'})  # 伤害
    T = 0
    for text_4 in text_3.find_all('i', attrs={'class': 'ibar'}):
        r = text_4['style']
        T += 1
        #获取属性伤害
        if T == 1:
            print(f'------------------------------>>{text_2}<

python爬虫详解(五)——爬取王者荣耀英雄详细、攻略搭配、出装配置、铭文搭配、搭档/压制、入手详情

可以看到已经爬取出来了

python爬虫详解(五)——爬取王者荣耀英雄详细、攻略搭配、出装配置、铭文搭配、搭档/压制、入手详情

不妨点个赞在走呗!!!

Original: https://blog.csdn.net/weixin_46625757/article/details/122335702
Author: 小木_.
Title: python爬虫详解(五)——爬取王者荣耀英雄详细、攻略搭配、出装配置、铭文搭配、搭档/压制、入手详情

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/639996/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球