wordcloud生成词云图（含形状、颜色设置）

2023年8月31日下午6:16 • Python • 阅读 58

一、导入和主要方法

1、导入wordcloud包
生成词云图之后还要显示出来，所以还会用到matplotlib
如果要设置mask蒙版，还需要从imageio导入imread()函数
如果需要设置词云中字体的颜色，还会用到matplotlib中的colors

import wordcloud
import matplotlib.pyplot as plt
from imageio import imread
from matplotlib import colors

2、主要方法

wc = wordcloud.WordCloud(...)
wc.fit_words(frequencies)
wc.generate(text)

wc.to_file()
wc.to_array(filename)

其中” 根据词频生成 “和” 根据文本生成 “两种方法中只能选取一种。

（1）wordcloud.WordCloud()参数说明

这个也是参数最多的地方

font_path : string
        //字体路径，词云图默认不支持中文，所以一般都要设置该参数

stopwords :字符串列表
        //设置需要屏蔽的词，如果为空，则使用内置的STOPWORDS

mask : nd-array
        //如果不设置，则词云是正规矩形。
        //如果 mask 非空，设置的宽高值将被忽略，遮罩形状被 mask 取代。
        //一般结合imread()，将图片中不是白色的地方作为轮廓。

width : int
        //输出的画布宽度，默认为400像素，越宽，词云中包含的关键词越多

height : int
        //输出的画布高度，默认为200像素

prefer_horizontal : float (default=0.90)
        //词语水平方向排版出现的频率，默认 0.9 （所以词语垂直方向排版出现频率为 0.1 ）

max_words : number (default=200)
        //要显示的词的最大个数

min_font_size : int (default=4)
        //显示的最小的字体大小

colormap : string or matplotlib colormap, default="viridis"
        //给每个单词随机分配颜色，若指定color_func，则忽略该方法

background_color : color value (default="black")
        //背景颜色，如background_color='white',背景颜色为白色。

max_font_size : int or None (default=None)
        //显示的最大的字体大小

relative_scaling : float (default=.5)
        //词频和字体大小的关联性

****************一些不常用的参数**************

color_func : callable, default=None
        //生成新颜色的函数，如果为空，则使用 self.color_func

regexp : string or None (optional)
        //使用正则表达式分隔输入的文本

font_step : int (default=1)
        //字体步长，如果步长大于1，会加快运算但是可能导致结果出现较大的误差。

scale : float (default=1)
        //按照比例进行放大画布，如设置为1.5，则长和宽都是原来画布的1.5倍。

其中也写参数的具体设置在后面的例子中看。

（2）wc.fit_words(frequencies)

frequencies是一个字典，键为单词，值为出现的次数

（3）wc.generate(text)

text没啥好说的，就是一段文字

二、实例

包括了，字体设置、颜色设置、蒙版设置、

1、例一：wc.fit_words(frequencies)先去停用词

from  wordcloud import WordCloud
import jieba
from collections import Counter
from imageio import imread
import matplotlib.pyplot as plt

"""获取文本内容"""
with open("济南的冬天.txt","r",encoding="utf-8") as fp:
    content = fp.read()
words_temp = jieba.lcut(content)
words = []
"""读取停用词"""
with open("C:/停用词/哈工大停用词.txt","r",encoding="utf-8") as fp:
    stopwords = [s.rstrip() for s in fp.readlines()]

"""去掉切分词语中的停用词"""
for w in words_temp:
    if w not in stopwords:
        words.append(w)

frequency = dict(Counter(words))

font = "C:/Fonts/AaMingYueJiuLinTian.ttf"
mask_image = imread("20160303160528046.png")

wc = WordCloud(font_path=font,
              background_color="white",
              mask=mask_image)

wc.fit_words(frequency)

plt.imshow(wc)
plt.axis("off")
plt.show()
wc.to_file("C:/Users/lenovo/Desktop/pic/6.png")

上例是手动先去除掉分词结果中的停用词，然后统计词频，再直接画图。
下面这个例子，没有手动去除停用词，直接统计词频，但是在WordCloud函数中设置了stopwords参数，这样更加方便，而且和上面的方法使用的还是同一个停用词表。（但是画出的图好像不大一样）

2、例二：wc.fit_words(frequencies)在WordCloud（）中去停用词

"""获取文本内容"""
with open("济南的冬天.txt","r",encoding="utf-8") as fp:
    content = fp.read()
words = jieba.lcut(content)

"""读取停用词"""
with open("C:/停用词/哈工大停用词.txt","r",encoding="utf-8") as fp:
    stopwords = [s.rstrip() for s in fp.readlines()]

frequency = dict(Counter(words))

font = "C:/Fonts/AaMingYueJiuLinTian.ttf"
mask_image = imread("20160303160528046.png")

wc = WordCloud(font_path=font,
              background_color="white",
              mask=mask_image,
              stopwords=stopwords)

wc.fit_words(frequency)

plt.imshow(wc)
plt.axis("off")
plt.show()
wc.to_file("C:/Users/lenovo/Desktop/pic/6.png")

小总结： wc.fit_words(frequencies)逻辑：

分词（加载用户词典、去停用词）、统计词频
生成wordcloud对象
处理（plt画图、保存图像）

3、例三：wc.generate(text)

"""获取文本内容"""
with open("济南的冬天.txt","r",encoding="utf-8") as fp:
    content = fp.read()

font = "C:/Fonts/AaMingYueJiuLinTian.ttf"
mask_image = imread("20160303160528046.png")

wc = WordCloud(font_path=font,
              background_color="white",
              mask=mask_image)

wc.generate(content)

plt.imshow(wc)
plt.axis("off")
plt.show()
wc.to_file("C:/Users/lenovo/Desktop/pic/7.png")

在上例中，我也尝试了在WordCloud（）方法中设置了stopwords参数，但是一点效果也没有。

小总结： wc.generate(text)处理逻辑

读取文本
生成WordCloud对象
处理（展示、保存）

三、颜色设置

最后再来看看词云的颜色设置，默认情况下，词云的颜色是随机的；

方法一：

wordcloud.ImageColorGenerator(image, default_color=None)返回一个颜色生成器，把这个值赋值给WordCloud（）中的color_func参数，效果就是单词的颜色和图像中对应位置的色彩一样。
也可以使用colormap参数手动设置需要使用的颜色，

方法二：

WordCloud（）的colormap参数值需要使用matplotlib的colors库中的ListedColormap方法。要注意方法一和二的两个参数值不能同时使用。

方法一：

from  wordcloud import ImageColorGenerator

font = "C:/Fonts/AaMingYueJiuLinTian.ttf"
mask_image = imread("20160303160528046.png")

bg_color = ImageColorGenerator(mask_image, default_color=None)
wc = WordCloud(font_path=font,
              background_color="white",
              mask=mask_image,
              color_func=bg_color)

wc.fit_words(frequency)

plt.imshow(wc)
plt.axis("off")
plt.show()
wc.to_file("C:/Users/lenovo/Desktop/pic/8.png")

方法二

from matplotlib import colors

color_list = ['#FF0000','#a41a1a']
colormap = colors.ListedColormap(color_list)

font = "C:/Fonts/AaMingYueJiuLinTian.ttf"
mask_image = imread("20160303160528046.png")

wc = WordCloud(font_path=font,
              background_color="white",
              mask=mask_image,
              colormap=colormap)

wc.fit_words(frequency)

plt.imshow(wc)
plt.axis("off")
plt.show()
wc.to_file("C:/Users/lenovo/Desktop/pic/8.png")

Original: https://blog.csdn.net/qq_48003414/article/details/117427378
Author: IRON POTATO
Title: wordcloud生成词云图（含形状、颜色设置）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/764765/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

conda 安装 pytorch（GPU）、torchtext、transformers问题解决

conda 安装 pytorch（GPU）、torchtext、transformers问题解决文章目录 conda 安装 pytorch（GPU）、torchtext、tran…

Python 2023年9月7日
0049
图数据挖掘（一）：网络的基本概念和表示方法

最近《复杂网络建模》这门课要考试了，正好也在跟Stanford的《CS224W：Machine Learning With Graphs》这门课，这里就一边整理笔记一边复习了。网…

Python 2023年10月25日
0056
痞子衡嵌入式：我被邀请做科锐国际旗下数科同道主办的技术沙龙嘉宾

「数科同道」是「科锐国际」旗下的面向技术开发者的专属垂直招聘平台。《数科同道技术沙龙》是由数科同道主办的活动，每期活动邀请行业内及其他知名公司的技术专家分享来自一线的实践经验。自2…

Python 2023年10月12日
0053
Flask celery消息生成消费

Celery 是一个异步任务队列。你可以使用它在你的应用上下文之外执行任务。总的想法就是你的应用程序可能需要执行任何消耗资源的任务都可以交给任务队列，让你的应用程序自由和快速地响应…

Python 2023年8月11日
0049
Jmeter——BeanShell 内置变量vars、props、prev的使用

在使用Jmeter过程中，或多或少都会接触些BeanShell，它会使工具的使用，变得更灵活。 Jmeter中关于BeanShell的有： 1.BeanShell Sampler …

Python 2023年10月19日
0030
AI一键图文生成短视频工具，文章AI自动生成视频，傻瓜式操作。

据数据统计，截止2020年12月,短视频用户约有 8.73 亿，由此可见，短视频发展潜力巨大。抓住短视频，无疑就是抓住一个流量红利。那如何制作短视频呢？可以选择文本一键生成短视频…

Python 2023年10月8日
00186
使用小程序实现AI动漫脸特效

文章目录 * – 一、文章前言 – 二、具体流程及准备 – 三、开发步骤 – 四、完整代码 – 五、拓展开发 &#821…

Python 2023年10月7日
0033
【Kotlin】object 对象 ( object 关键字 | 对象声明 | 对象表达式 | 伴生对象 )

一、object 关键字 object 关键字可以定义单例类 ; 使用 object 关键字修饰的类 , 只能创建一个实例对象 ; object 有 3 种使用方式 : 对象声…

Python 2023年11月6日
0038
python / flask sqlAlchemy 分页查询（paginate）实现举例，分页方式使用不当报404错误

from sqlalchemy.orm import aliasedfrom sqlalchemy import func 方式一，db.session.query查询 Order…

Python 2023年8月12日
0058
SQL Server2008详细安装步骤（超详细步骤）

一、文件提取 https://pan.baidu.com/s/1yvolqfU-AbiuGrIzblA7pA提取码：lzw8 二、解压以及安装过程 1.下载好安装包后解压到除C盘以…

Python 2023年10月26日
0037
软工综合实践课设——员工招聘系统（参考BOSS直聘）；Pyhton实现

应用背景：随着科学技术的发展，岗位数量越来越多，特别是每逢毕业季找工作的人数也很多，如果人们找工作或者企业招人靠纯手工的话，费时费力，仅仅是筛选简历和费劲，并且员工找工作投简历可…

Python 2023年10月30日
0044
车牌识别定位 matlab基本方法和操作

车牌识别的方法很多，比如深度学习算法的识别比如模式识别的算法研究等 1 车牌识别方法一本文提出的方法实现了车牌的定位车牌区域的细分然后将车牌的数值进行分割进而可以得到…

Python 2023年9月28日
0054
iis部署django框架，使用celery无命令窗口运行

用bat文件 1、在桌面新建一个text文件。写入以下： @echo off if "%1"=="h" goto begin start m…

Python 2023年8月6日
0075
python 对excel的函数操作（2）

1、用pandas的二维数组做除法运算，替换inf，过滤inf等操作 import pandas as pd import numpy as np 用pandas科学数据库操作ex…

Python 2023年8月16日
0038
三.Flask 数据库[flask-sqlalchemy]

一.数据库 1.基础 1.1 下载格式： pip install flask-sqlalchemy 1.2 集成化配置 app.config[‘SQLALCHEMY_DATABA…

Python 2023年8月10日
0039
【Node.js实战】一文带你开发博客项目之安全（sql注入、xss攻击、md5加密算法）

个人简介 👀 个人主页：前端杂货铺🙋‍♂️ 学习方向：主攻前端方向，也会涉及到服务端📃 个人状态：在校大学生一枚，已拿多个前端 offer（秋招）🚀 未来打算：为中国的工业软…

Python 2023年11月4日
0053

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

wordcloud生成词云图（含形状、颜色设置）

1、例一：wc.fit_words(frequencies)先去停用词

2、例二：wc.fit_words(frequencies)在WordCloud（）中去停用词

3、例三：wc.generate(text)

方法一：

方法二：

大家都在看