王心凌再次爆火，为了防止收费，我连夜用Python把她所有的MV离线

2023年5月24日上午12:13 • Python • 阅读 53

《乘风破浪的姐姐3》王心凌一骑绝尘，破收视率，多年后再次全网爆火，某音截止现在差不多3500W粉丝，五月份热门女星排名，吊打其它所有人，不愧是我女神！

但是这个热度，感觉她的歌曲和MV，已经离收费越来越近了，于是我连夜用Python把所有MV 和歌曲离线，今天先给大家分享MV的方法。

女神镇楼！

话不多说，我们开冲！

; 步骤分析

一、数据来源分析

1、首先我们确定自己的需求，什么网站，获取什么数据。

以酷我为例，直接打开酷我搜索王心凌，点击MV。

然后我们通过开发人员工具进行包分析，以分析我们想要的数据来自哪里。

[En]

Then we do package analysis through developer tools to analyze where the data we want comes from.

直接点击第一个，然后右键点击检查，或者直接按F12 打开开发者工具，然后点击network ，点击AII ，然后我们看到的是这样的页面。

此时没有数据，所以我们需要刷新它。

[En]

There is no data at this time, so we need to refresh it.

现在数据就出来了

每个视频都有自己的编号，我们可以在地址栏中看到。这段视频的编号是89622。

[En]

Each video has its own number, which we can see in the address bar. The number of this video is 89622.

我们在开发者工具找到对应的目录，在network → AII 里第一个就是。

或者直接点左上角的搜索工具，或者直接 Ctrl+f 打开搜索框，输入序号进行搜索。

第一种是，或者搜索相应的标题来查找相关数据。

[En]

The first is, or search the corresponding title to find the relevant data.

然后再这里找到我们需要的 Cookie 、Referer 、url 等等数据。

代码展示

本文中代码实现的四个基本步骤

[En]

The four basic steps of code implementation in this article

1. &#x53D1;&#x9001;&#x8BF7;&#x6C42;, &#x6A21;&#x62DF;&#x6D4F;&#x89C8;&#x5668;&#x5BF9;&#x4E8E;url&#x7F51;&#x5740;&#x53D1;&#x9001;&#x8BF7;&#x6C42;  <专门定义函数来发送请求>
2. &#x83B7;&#x53D6;&#x6570;&#x636E;, &#x83B7;&#x53D6;&#x7F51;&#x9875;&#x6E90;&#x4EE3;&#x7801;
3. &#x89E3;&#x6790;&#x6570;&#x636E;, &#x63D0;&#x53D6;&#x6211;&#x4EEC;&#x60F3;&#x8981;&#x6570;&#x636E;&#x5185;&#x5BB9; <视频信息以及视频标题>
4. &#x4FDD;&#x5B58;&#x6570;&#x636E;, &#x628A;&#x89C6;&#x9891;&#x5185;&#x5BB9;&#x4FDD;&#x5B58;&#x672C;&#x5730;
</视频信息以及视频标题></专门定义函数来发送请求>

1、首先导入需要用的模块

import requests
import re

requests 是第三方模块，需要手动安装一下。

键盘按住 win+r 输入 cmd 确定，弹出命令提示符窗口，输入 pip install requests 回车安装即可。

不，你可以看到我的顶部文章，有一个特别的介绍，或者添加底部的文章直接联系我。

[En]

No, you can see my top article, there is a special introduction, or add the bottom of the article to contact me directly.

2、发送请求

模拟浏览器对于url网址发送请求

headers = {
    'Cookie': '_ga=GA1.2.1259590012.1628168238; Hm_lvt_cdb524f42f0ce19b169a8071123a4797=1655356984; _gid=GA1.2.1126000694.1655356984; Hm_lpvt_cdb524f42f0ce19b169a8071123a4797=1655357023; _gat=1; kw_token=XBR2CWDG9IP',
    'Host': 'www.kuwo.cn',
    'Referer': 'http://www.kuwo.cn/search/list?key=%E9%99%88%E5%A5%95%E8%BF%85',
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/99.0.4844.84 Safari/537.36',
}
url = 'http://www.kuwo.cn/mvplay/89622'
response = requests.get(url=url, headers=headers)

Python学习交流群  279199867

所有这些数据都是在开发人员的工具中获得的。你还记得上面提到的步骤吗？

[En]

All these data are obtained in the developer’s tool. do you remember the steps mentioned above?

Cookie、Host 、Referer 、 User-Agent 这些数据找到后，直接复制下来，Referer是防盗链，没看到的话不用写。

url 在第一个

相应的标签需要放在引号中，才能将复制的内容更改为词典格式。

[En]

The corresponding tag needs to be in quotation marks to change the copied content into a dictionary format.

然后通过 response 对网站发送请求

print 打印一下

3、获取数据

html_data = response.text
print(html_data)
Python学习交流群 279199867

打印以查看获得的数据。

[En]

Print to see the data obtained.

4、解析数据

.*?匹配任意字符 \n 换行除外

video_url = re.findall('src:"(.*?)"}]', html_data)[0]
video_url = video_url.replace('\\u002F', '/')
video_data = requests.get(url=video_url).content

5、保存数据

with open('爱你.mp4', mode='wb') as f:
    f.write(video_data)

你可以开始快乐地欣赏女神了！

[En]

You can begin to enjoy the goddess happily!

在这里，我只进行了一次获取、多个爬行和多个页面爬行。我专门录制了这段视频，可以在本文中获得。

[En]

Here I just made a single acquisition, multiple crawls and multi-page crawls. I specifically recorded the video, which can be obtained in this article.

Original: https://www.cnblogs.com/hahaa/p/16383541.html
Author: 轻松学Python
Title: 王心凌再次爆火，为了防止收费，我连夜用Python把她所有的MV离线

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/499315/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

OpenCV之角点检测和边缘检测的方法总结

一. 膨胀和腐蚀的粗略理解因为膨胀和腐蚀都属于形态学滤波范畴，所以必须先有一个结构体元素。结构体元素就是滤波器矩阵，其有多种类型，包括x形、矩形、十字交叉形、菱形等。其中cv2有…

Python 2023年8月28日
0045
mysql自定义函数知乎_scrapy入门

准备工作系统windows7 安装MYSQL 提示: 安装的时候, 选安装选项server only 根据提示, 遇到安装界面没有下一步可以用键盘操作键盘操作 b-back。n…

Python 2023年10月6日
0032
十四、Docker 微服务实战

1、创建SpringBoot项目 hello_docker 1.1、项目结构 1.2、项目所有代码 pom.xml 4.0.0 com.liuchao hello_docker 1…

Python 2023年10月24日
0031
ISCC-WP（二）擂台

WEB 1. Melody 查看源代码，发现/info，然后访问是要更改useragent头，要讲请求头改为Melody。给Melody传入参数{{config}},会发现一个ke…

Python 2023年8月12日
0043
python_缺失值处理

Data Cleaning and Preparation# pandas使⽤浮点值# NaN（Not a Number）表示缺失数据。我们称其为哨兵值import numpy a…

Python 2023年5月25日
0071
Python可视化物理随机过程—pygame学习笔记2

Python可视化物理随机过程—pygame学习笔记2 文章目录 * – Python可视化物理随机过程—pygame学习笔记2 – 一、扩散现…

Python 2023年9月20日
0050
Scrapy入门探索盗墓笔记

Scrapy入门探索盗墓笔记 声明：本文只&am…

Python 2023年10月4日
0048
对抗攻击（Adversarial Attack）

文章目录对抗攻击对抗防御对抗攻击图片可以看成一个很长的向量，如果在图片的每个像素上都加上一个很小的pertubation(扰动、杂讯)，再把它输入到神经网络，这个时候分类器…

Python 2023年9月28日
0046
【Git】一文带你入门Git分布式版本控制系统（简介，安装，Linux命令）

个人简介 👀 个人主页：前端杂货铺🙋‍♂️ 学习方向：主攻前端方向，也会涉及到服务端📃 个人状态：在校大学生一枚，已拿多个前端 offer（秋招）🚀 未来打算：为中国的工业软…

Python 2023年9月16日
0051
【Python深度学习之路】产生随机数

随机数的生成 1.设置种子计算机是根据被称为”种子(seed)”的数据来生成随机数的。所谓种子，是指在生成随机数的过程中所使用的初始值，如果种子的值固定…

Python 2023年8月27日
0030
postman中js脚本简单用法

1.获取接口相应结果 2.设置环境变量 3.设置全局变量 4.通过key值获取环境变量 5.通过key值获取全局变量 6.通过key值获取一个变量 7.通过key值注销一个环境变量…

Python 2023年6月11日
0064
Django 基础（13）-Django drf 序列化器类to_representation和to_internal_value（处理返回的日期格式）、序列化类 ModelSerializer

文章目录一、Django drf 序列化 * 1. 背景 2. 使用思路 3. 代码demo 4. 【重要】序列化类 ModelSerializer 5. DRF序列化器to_r…

Python 2023年8月6日
0049
python pygame模块按键延迟_用pygame做游戏时，用pygame.KEYDOWN来实现的按键控制“不灵敏”能怎么解决?…

这样写就十分灵活了就是每个按键添加了一个k变量来检测按键是否被按着。每一对儿方向相对的按键加了一个f变量来记录两个按键谁最后按下的。 speed=[x,y] for event…

Python 2023年9月24日
0065
python 读取配置文件的单元测试_Pytest测试框架学习

pytest介绍 pytest是一个非常成熟的全功能的Python测试框架，主要有以下几个特点： 1.简单灵活，容易上手 2.支持参数化 3.能够支持简单的单元测试和复杂的功能测试…

Python 2023年9月13日
0034
将DataFrame作为邮件正文HTML发送 in Python

OverviewTo convert this question into english, maybe: How to convert a DataFrame into a pe…

Python 2023年8月21日
0039
pytest第一版入门学习

一、pytest 简介 pytest是一个非常成熟的单元框架，比unittest更灵活，容易上手。 pytest可以和selenium，request，appium结合实现web自…

Python 2023年9月14日
0037

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

王心凌再次爆火，为了防止收费，我连夜用Python把她所有的MV离线

大家都在看