Python爬虫入门教程：下载企鹅动漫视频

2023年5月25日上午12:58 • Python • 阅读 121

当然，要一口气看好看的动画片，但他也有广告。为了节省时间，我直接爬了下来。

[En]

Of course, you have to watch good-looking cartoons in one breath, but he also has advertisements. In order to save time, I climbed them down directly.

本文文字和图片均来自网络，仅供学习、交流和使用，不具有任何商业用途，如有任何疑问，请及时与我们联系处理。

[En]

The text and pictures of this article come from the network, only for learning, communication and use, do not have any commercial use, if you have any questions, please contact us in time to deal with.

基本开发环境

Python 3.8
Pycharm

相关模块的使用

import requests
import re

安装Python并添加到环境变量，pip安装需要的相关模块即可。

需求数据来源分析

其实深圳腾家的视频还是比较好下载的，就是m3u8的视频格式而已，和之前爬取A站视频是一样的。

通过开发者工具这些数据内容都是可以一一抓包分析出来的，不过需要注意的是post请求的。

如果想要爬取多个视频的呀，他的参数主要变化的是url地址，每一集的url地址。

是通过URL编码的，通过解码可以发现其实就url地址的变化就可以爬取多个视频内容了。

兄弟们学习python，有时候不知道怎么学，从哪里开始学。掌握了基本的一些语法或者做了两个案例后，不知道下一步怎么走，不知道如何去学习更加高深的知识。

那么对于这些大兄弟们，我准备了大量的免费视频教程，PDF电子书籍，以及视频源的源代码！

还会有大佬解答！
都在这个群里了，【点我立即进裙领取】;

欢迎加入，一起讨论一起学习！

代码实现

import requests
import re
from tqdm import tqdm
url = 'https://vd.l.qq.com/proxyhttp'
data = {"buid":"vinfoad","adparam":"pf=in&ad_type=LD%7CKB%7CPVL&pf_ex=pc&url=https%3A%2F%2Fv.qq.com%2Fx%2Fcover%2Fm441e3rjq9kwpsc.html&refer=https%3A%2F%2Fv.qq.com%2Fx%2Fcover%2Fm441e3rjq9kwpsc.html&ty=web&plugin=1.0.0&v=3.5.57&coverid=m441e3rjq9kwpsc&vid=m00253deqqo&pt=&flowid=6ee7a12b36edccc1298ca3c4a1279361_10201&vptag=www_baidu_com%7Cx&pu=2&chid=0&adaptor=2&dtype=1&live=0&resp_type=json&guid=4b4e192e83f4abaf8b68df3e4f5be769&req_type=1&from=0&appversion=1.0.166&uid=522810848&tkn=PZiKadvwBqjt1VRYEWFcLw..<=qq&platform=10201&opid=5FE180427A4C883F69CADDED665CE99B&atkn=49C1A486316C8D269AC65AAC080CFB29&appid=101483052&tpid=3","vinfoparam":"spsrt=1&charge=0&defaultfmt=auto&otype=ojson&guid=4b4e192e83f4abaf8b68df3e4f5be769&flowid=6ee7a12b36edccc1298ca3c4a1279361_10201&platform=10201&sdtfrom=v1010&defnpayver=1&appVer=3.5.57&host=v.qq.com&ehost=https%3A%2F%2Fv.qq.com%2Fx%2Fcover%2Fm441e3rjq9kwpsc.html&refer=v.qq.com&sphttps=1&tm=1633760593&spwm=4&logintoken=%7B%22main_login%22%3A%22qq%22%2C%22openid%22%3A%225FE180427A4C883F69CADDED665CE99B%22%2C%22appid%22%3A%22101483052%22%2C%22access_token%22%3A%2249C1A486316C8D269AC65AAC080CFB29%22%2C%22vuserid%22%3A%22522810848%22%2C%22vusession%22%3A%22PZiKadvwBqjt1VRYEWFcLw..%22%7D&vid=m00253deqqo&defn=&fhdswitch=0&show1080p=1&isHLS=1&dtype=3&sphls=2&spgzip=1&dlver=2&drm=32&hdcp=0&spau=1&spaudio=15&defsrc=1&encryptVer=9.1&cKey=5DdFIhZoCTh6L5EItZs_lpJX5WB4a2CdS8kEIuoKVaqtHEZQ1c_W6myJ8hQAnmDDGMN6HtSKNTvj2vPBr-xE-uhvZyEMY131vUh1H4pgCXe2Op9Lrzb_fbB32kFt6bl1q30sVBkIXYfWkOdABnbLUo4RgzSXkBHF3N3K7dNKPg_56X9JO3gwBMyBeAex05x8SbbQKY5AXaDVSM7hsBQ8XEeHzIEGJzlCt94OJgnPQjUjJKF82JUds1R0-cHhfOLSlSKkRfXJvCgPorVuLVB8vGkZ9SUNglJgQYGpVikdTUgXRIOHHObmqSLLKn4jYCmTQKXhvP_ARCxg07_d7CuHkmkZ3RplMNDtdQRyXVHoQHKn5vzNKGxIiW5AhdIEBAQEW_tymg&fp2p=1&spadseg=3"}
headers = {
    'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/94.0.4606.71 Safari/537.36'
}
response = requests.post(url=url, json=data, headers=headers)
html_data = response.json()['vinfo']
m3u8_url = re.findall("url(.*?),", html_data)[3].split('"')[2]
m3u8_data = requests.get(url=m3u8_url).text
m3u8_data = re.sub('#EXTM3U', '', m3u8_data)
m3u8_data = re.sub('#EXT-X-VERSION:\d', '', m3u8_data)
m3u8_data = re.sub('#EXT-X-MEDIA-SEQUENCE:\d', '', m3u8_data)
m3u8_data = re.sub('#EXT-X-TARGETDURATION:\d+', '', m3u8_data)
m3u8_data = re.sub('#EXT-X-PLAYLIST-TYPE:VOD', '', m3u8_data)
m3u8_data = re.sub('#EXTINF:\d+\.\d+,', '', m3u8_data)
m3u8_data = re.sub('#EXT-X-ENDLIST', '', m3u8_data).split()
for ts in tqdm(m3u8_data):
    ts_url = 'https://apd-565555bc66fc61b759c9b3d174974007.v.smtcdns.com/moviets.tc.qq.com/AljnQkp9aX_s0xghcGyUDvSrsDw-60Juazgu71dVgpw8/uwMROfz2r5xgoaQXGdGnC2df645GziNP4fCTXzcc9dfItw5M/MwE4f2JnwaJD4DIrFImz_B51hCanEvH3_a3pTvopgHoqDuCXu22oHCXO-_aZh79YTmXQ-8fQX66xUs9NEzpkLfyLY5Wbes8W1mnPl983JuGgWWPVLlyh-76C2rGHa1COTMDOMc58Y6-fWzZkbfboxyd3NUyMe6tpaPBkhz2gFABB1Vjqii_6nQ/' + ts
    ts_content = requests.get(url=ts_url).content
    with open('斗罗001.mp4', mode='ab') as f:
        f.write(ts_content)
print('下载完成')

Original: https://www.cnblogs.com/hahaa/p/15433681.html
Author: 轻松学Python
Title: Python爬虫入门教程：下载企鹅动漫视频

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/511056/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

从零搭建完整python自动化测试框架（UI自动化和接口自动化）——持续更新

本自动化测试框架采用python + unittest 的基础来搭建，采用PO模式、数据驱动的思想，通过selenium来实现WEB UI自动化，通过request来实现接口自动化…

Python 2023年8月1日
0058
Pandas DataFrame的一些简单操作

一、创建方法直观上理解，DataFrame就是很多个Series拼在一起的一个新的数据结构，他看起来就像Excel的表一样，以下是快速创建的方法。 marvel_data = […

Python 2023年8月7日
0041
垂直条形图——plot.bar

Out [5]: 流浪地球飞驰人生疯狂的外星人新喜剧之王廉政风云神探蒲松龄小猪佩奇过大年熊出没·原始时代02.013.194.072.720.560.660.581.1314.59…

Python 2023年8月27日
0060
深入理解PSNR（峰值信噪比）(附matlab代码)

深入理解PSNR 作者：老李日期：2022-1-19 本文引入MSE、SNR、变异系数（Coefficient of Variation），并希望从统计学的角度上解释这个变量这个…

Python 2023年10月27日
0017
Matplotlib学习

Matplotlib学习官网：pyplot — Matplotlib 2.0.2 documentation · 散点图（Scatter）可参考：(3条消息) plt.scat…

Python 2023年9月2日
0045
python怎么爬虎牙_使用python爬虫框架scrapy抓取虎牙主播数据

前言本文利用python的scrapy框架对虎牙web端的主播、主播订阅数、主播当前观看人数等基本数据进行抓取，并将抓取到的数据以csv格数输出，以及存储到mongodb中思路…

Python 2023年10月4日
0070
使用配置文件创建conda环境

注意：使用官方给出的部署文件进行环境的创建时，特别要注意 cuda 版本是否和服务器的版本（显卡驱动版本）一致（这里的一致是指：显卡驱动以及 CUDA 版本不能低于需要安装的 C…

Python 2023年9月9日
0054
python+selenium+pytest+allure框架

python编辑器 selenium webdriver原理 pytest 文件命名规则 pytest用例运行级别 PyCharm 是一款功能强大的 Python 编辑器，具有跨平…

Python 2023年9月11日
0051
数据可视化网页制作

python数据可视化上传至网页老师布置任务，要将数据情感分析进行数据可视化。功能如下：1.群体情绪排行榜2.群体情绪中国地图3.集群密度排行4.某一事件或视听节目讨论中，一个饼…

Python 2023年8月9日
0065
AI遮天传 DL-反馈神经网络RNN

本文会先介绍动态系统的概念，然后介绍两种简单的反馈神经网络，然后再介绍两种门控神经网络(LSTM, GRU)，最后是关于反馈神经网络的应用(本次以语音识别为例)。 RNN: Rec…

Python 2023年9月27日
0034
（Python）在子线程中使用Matplotlib进行绘图（100%解决问题）

今天在那边做一个UI界面的时候，想往里面做一个功能：”主线程上进行当前数据的监控、并将数据存入MongoDB中。当按下UI界面上的一个按钮后，创建一个子线程，让他去查M…

Python 2023年8月30日
0048
【FOC控制】英飞凌TC264无刷驱动方案simplefoc移植（5）-磁编码器移植AS5600 软件IIC

【FOC控制】英飞凌TC264无刷驱动方案simplefoc移植（5）-磁编码器移植【FOC控制】英飞凌TC264无刷驱动方案simplefoc移植（5）-磁编码器移植 * 一、…

Python 2023年11月7日
0039
【Matlab】一键Matlab代码转python代码详细教程

Motivation 博主最近在看的一篇做biomedical image SR的论文，其对数据的预处理用matlab做的…要在集群上跑的话还要重新配环境装matlab…

Python 2023年8月1日
0090
Matplotlib数据可视化入门

目录前言 1.基础知识 * 1.1 图形绘制 1.2 标题、标签、坐标轴刻度 – 1.2.1 标题的设置 1.2.2 标签的设置 1.2.3 坐标轴刻度的设置 1.3…

Python 2023年9月3日
0045
Python的22个万用公式，你确定不看看吗

前言在大家的日常python程序的编写过程中，都会有自己解决某个问题的解决办法，或者是在程序的调试过程中，用来帮助调试的程序公式。小编通过几十万行代码的总结处理，总结出了22个…

Python 2023年11月8日
0049
路径分析—QGIS+PostgreSQL+PostGIS+pgRouting（一）

路径分析—QGIS+PostgreSQL+PostGIS+pgRouting（一）路径分析—PostgreSQL+GeoServer+Openlayers（二）前言因业务需求…

Python 2023年10月19日
10126

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Python爬虫入门教程：下载企鹅动漫视频

大家都在看