python爬虫练习（flask框架部分）

2023年8月13日下午10:30 • Python • 阅读 51

这边是flask框架+echarts+wordcloud练习部分。

flask框架

flask框架需要使用Flask  ， render_template两个库（后者用来返回模板html）

@app….. 这部分是路由解析，通过用户访问的路径匹配不同的函数。

底部函数负责返回对应的网页以及网页渲染所需要的参数（例如查询数据库获取参数）

@app.route('/movie')
def movie():  # put application's code here
    movies = []
    conn = sqlite3.connect("movie.db")
    cur = conn.cursor()
    sql = "select * from movie250"
    data = cur.execute(sql)
    for item in data:
        movies.append(item)
    cur.close()
    conn.close()
    return render_template("movie.html", movies=movies)

Echarts部分

去Echarts官网下载示范模板即可。导入echarts.min.js的JavaScript文件，找到合适的模板下载代码，修改参数。

3.Wordcloud部分

需要使用以下几个库。

import jieba                            #&#x5206;&#x8BCD;
from matplotlib import pyplot as plt    #&#x7ED8;&#x56FE;&#xFF0C;&#x6570;&#x636E;&#x53EF;&#x89C6;&#x5316;
from wordcloud import WordCloud         #&#x8BCD;&#x4E91;
from PIL import Image                   #&#x56FE;&#x50CF;&#x5904;&#x7406;
import numpy as np                      #&#x77E9;&#x9635;&#x8FD0;&#x7B97;
import sqlite3                          #&#x6570;&#x636E;&#x5E93;

jieba.cut需要三个参数，分别为需要分词的字符串string，是否开启全模式，是否搜索引擎

jieba.cut 返回的结构是一个可迭代的 generator（或者叫对象），可以使用 for 循环来获得分词后得到的每一个词语(unicode)，或者用jieba.lcut 以及 jieba.lcut_for_search 直接返回 list

#&#x5206;&#x8BCD;
cut = jieba.cut(text)
string = ' '.join(cut)

这边直接在cut返回的对象中插入空格生成字符串

img = Image.open(r'.\static\assets\img\Jay.png')
img_array = np.array(img)       #&#x5C06;&#x56FE;&#x7247;&#x8F6C;&#x6362;&#x4E3A;&#x6570;&#x7EC4;

然后将生成词云需要的图片使用numpy库转变为数组，便于后面的计算

wc = WordCloud(
    background_color='white',
    mask=img_array,
    font_path="FZSTK.TTF",
    stopwords="&#x7684; &#x662F; &#x4F60; &#x4EBA; &#x4E86; &#x7535; &#x5F71; &#x90FD; &#x6211; &#x5728; &#x5C31;&#x662F; &#x548C; &#x7535;&#x5F71;",
)
wc.generate_from_text(string)

然后就用wordcloud库进行词云对象封装，然后wc对象对（string）进行解析与生成

#&#x7ED8;&#x5236;&#x56FE;&#x7247;
fig = plt.figure(1)
plt.imshow(wc)
plt.axis('off')    #&#x662F;&#x5426;&#x663E;&#x793A;&#x5750;&#x6807;&#x8F74;
#plt.show()

plt.savefig(r'.\static\assets\img\word.jpg', dpi=500)

最后使用matplotlib库绘制成图片并保存。(figure(1)似乎可以省略

Original: https://blog.csdn.net/qq_41571018/article/details/119719553
Author: chormoon
Title: python爬虫练习（flask框架部分）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/748693/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

针对“RuntimeError: each element in list of batch should be of equal size” 问题解决

第一次运行代码出现了这个问题：这个问题的出现主要来源于DataLoader类中的collate.py文件造成的问题，由于每个batch里的长度不一致，因此导致出现了该问题。通过百度…

Python 2023年6月9日
0098
最终篇：简洁易懂，初学者挑战学习Python编程30天 (五)

①行业咨询、专业解答 ②Python开发环境安装教程 ③400集自学视频 ④软件开发常用词汇 ⑤最新学习路线图 ⑥3000多本Python电子书 26.1网页版 Python Py…

Python 2023年8月11日
0056
2022年亚太数学建模竞赛-问题C：全球变暖与否？-思路详解

一、题目分析数据分析典中典，数据量适中，主要考察预测模型，另外还需要收集额外的数据辅助建模和判断。要求 1.你同意全球气温的说法吗？使用2022_APMMC_C_Data。cs…

Python 2023年9月27日
00109
Python实现因子分析（附案例实战）

因子分析因子分析（Factor Analysis）是一种数据简化的技术。它通过研究众多变量之间的内部依赖关系探求观测数据中的基本结构，并用少数几个假想变量来表示其基本的数据结构。…

Python 2023年8月1日
0059
【Python】学生管理系统——详细解释+代码+详细注释（课设必过）

带你编写学生管理系统（Python）很多学生在学校学习完Python，就要做一个课设考验你对知识的掌握程度，这次就教大家如何来用Python来实现一个学生管理系统对学生管理系统…

Python 2023年7月31日
0060
pandas数据去重：drop_duplicates与duplicated函数

1 drop_duplicates与duplicated参数： DataFrame.duplicated(subset=None,keep=’first’)…

Python 2023年8月6日
0042
【Python】一文弄懂Numpy中的深拷贝和浅拷贝

引言深拷贝和浅拷贝是Python中重要的概念，本文重点介绍在NumPy中深拷贝和浅拷贝相关操作的定义和背后的原理。闲话少说，我们直接开始吧！浅拷贝 2.1 问题引入我们来举个…

Python 2023年8月27日
0052
超长时间序列数据可视化的6个技巧

时间序列是由表示时间的x轴和表示数据值的y轴组成，使用折线图在显示数据随时间推移的进展时很常见。它在提取诸如趋势和季节性影响等信息方面有一些好处。但是在处理超长的时间轴时有一个问…

Python 2023年8月17日
0059
攻防世界-shrine题分析

shrine 题目分析进入靶场后可以看见给出了源码，比较乱的话可以 ctrl+u查看源码：进行代码审计可以发现，这个网页是用flask模板写的，这时就很容易就联想到flask模…

Python 2023年8月14日
0081
pandas类库常用方法的学习

一、Pandas 数据结构 1、import pandas as pd import numpy as np import matplotlib.pyplot as plt 2、S…

Python 2023年8月7日
0044
Jinja2模板基本语法

当下学Jinja2的语法只是为了能展示网页，所以这里只介绍其基本语法。后续若有更高需求，会持续补充 Jinja2是基于python的模板引擎，是Flask作者开发的一个模板系统。起…

Python 2023年8月9日
0054
表弟打把王者的时间，我就用python写了个自动玩贪吃蛇的程序

文章目录实现效果代码表弟最近放假了天天打王者，作业也不做，气得我差点想给他买三年高考五年模拟了… 算了，血压有点上升，不管他了，先写代码。 ; 实现效果这比我手…

Python 2023年9月19日
0060
java xpath selector_scrapy Selector用法及xpath语法

准备工作 html示例: text test in p 把该示例保存到test.html中. 创建python文件，输入代码 from scrapy.selector import…

Python 2023年10月5日
0038
详细解释numpy库中slice切片用法 0，1，None

详解numpy库中切片用法 0，1，None 在图像处理中，常常会对矩阵进行切片操作，例如，通过切片操作拿出ROI区域，或者做一些变换。 [1:3]取矩阵的[1,3)的第一行和第二…

Python 2023年8月27日
0030
Vue3 SFC 和 TSX 方式自定义组件实现 v-model

1 v-model v-model 是 vue3 中的一个内置指令，很多表单元素都可以使用这个属性，如 input、 checkbox 等，咱可以在自定义组件中实现 v-model…

Python 2023年10月18日
0053
机器学习实践：棋类游戏-5

机器学习实践：棋类游戏 1、实验描述本实验中，利用游戏Pygame库，结合Python基础编程编写棋类游戏脚本，使得玩家能够与AI电脑进行对抗博弈。AI下棋算法利用蒙特卡洛搜索…

Python 2023年9月19日
0067

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

python爬虫练习（flask框架部分）

大家都在看