【chp2】车万翔-自然语言处理:基于预训练模型的方法

  1. 找到matplotlib 配置文件:
import matplotlib
print(matplotlib.matplotlib_fname())
# 我自己的输出结果如下:
# D:\Program Files\Python36\Lib\site-packages\matplotlib\mpl-data
  1. 编辑器打开此文件 matplotlibrc

删除font.family和font.sans-serif两行前的#,并在font.sans-serif后添加微软雅黑字体Microsoft YaHei

下载字体:SimHei.ttf(黑体) 或者 msyh.ttf (微软雅黑)
放在matplotlib 字体目录中添加SimHei.ttf的字体文件
C:\Users\Thinkpad\anaconda3\envs\python3.7\Lib\site-packages\matplotlib\mpl-data\fonts\ttf
(import matplotlib之后才会出现这个目录)

P.S. SimHei.ttf 可以在C:/Windows/fonts中找到。

  1. 删除.matplotlib/cache里面的两个缓存字体文件
    C:\Users\你的用户名.matplotlib
  2. 添加代码(缺什么补什么)
from matplotlib import font_manager as fm, rcParams
import matplotlib as plt

plt.rcParams['font.sans-serif']=['SimHei']
plt.rcParams['axes.unicode_minus']=False
  1. 重启Python
  2. 在输出位置多增加3行输出
for i in range(len(words)):
    plt.text(U[i, 0], U[i, 1], words[i])
    print(words[i])
    print(U[i,0])
    print(U[i,1])

观察输出值落入的范围,修改以下范围代码。

[En]

Observe the range in which the output value falls, and modify the following range code.

plt.xlim(-0.5, -0.1)
plt.ylim(-0.5, 0.4)

【chp2】车万翔-自然语言处理:基于预训练模型的方法

Original: https://blog.csdn.net/weixin_43095939/article/details/122979038
Author: 半杯知识
Title: 【chp2】车万翔-自然语言处理:基于预训练模型的方法



相关阅读

Title: python pandas.merge_ordered 用法及代码示例

pandas.merge_ordered(left, right, on=None, left_on=None, right_on=None,
                     left_by=None, right_by=None, fill_method=None,
                     suffixes=('_x', '_y'), how='outer')

(1) left: 用于连接的 左DataFrame
(2) right: 用于连接的 右DataFrame
(3) on: 连接关键字。 必须 同时存在于 左DataFrame、右DataFrame

(4) left_on: 左DataFrame 中用于连接的关键字
(5) right_on: 右DataFrame 中用于连接的关键字

(6) left_by: 对 左DataFrame 进行分组的关键字
(7) right_by: 对 右DataFrame 进行分组的关键字

(8) fill_method: 对缺失数据填充的值
(9) suffixes: 连接后,同时存在于 左DataFrame、右DataFrame 中的字段,添加的后缀名
(10) how: 连接方式。默认为 外连接

注意: 1> 使用参数 on 时,不能同时使用 “left_on” 或 “right_on”

2> left_on 与 right_on 必须同时存在

3> 如果 on、left_on 、right_on 的参数值均为空时, 默认以 同时存在于两个 DataFrame 中的列,为连接关键字
如果不存在共同列,将会报错:pandas.errors.MergeError: No common columns to perform merge on.

3> left_by 与 right_by 不能同时存在

构造数据源:df1、df2

df1 = pd.DataFrame(
    {
        "key": ["a", "c", "e", "a", "c", "e"],
        "lvalue": [1, 2, 3, 1, 2, 3],
        "group": ["a", "a", "a", "b", "b", "b"]
    }
)

df2 = pd.DataFrame({"key": ["b", "c", "d"], "rvalue": [1, 2, 3]})

(1)如果 left_by 与 right_by 均为空,等价于 merge

pd.merge_ordered(df1, df2).sort_values(by=["key", "lvalue"], ignore_index=True)

pd.merge(df1, df2, how="outer").sort_values(by=["key", "lvalue"], ignore_index=True)

(2)如果 left_by 或 right_by 不为空,会先按这个参数值对 DataFrame 进行分组,将分组后的 DataFrame 再进行连接

pd.merge_ordered(df1, df2, left_by="group")
"""
第一步:将 df1 根据 group 进行分组
第二步:将分组后的 df1 中每一组的数据,通过连接关键字 key 与 df2 进行连接
"""

pd.merge_ordered(df1, df2, right_by="rvalue")
"""
第一步:将 df2 根据 rvalue 进行分组
第二步:将分组后的 df2 中每一组的数据,通过连接关键字 key 与 df1 进行连接
"""

如果,”left_by 或 right_by 的值” 与 “连接关键字” 相同,那无论是什么连接方式,结果都一样

pd.merge_ordered(df1, df2, right_by="key")

pd.merge_ordered(df1, df2, right_by="key", how="left")

pd.merge_ordered(df1, df2, right_by="key", how="right")

pd.merge_ordered(df1, df2, left_by="key")

pd.merge_ordered(df1, df2, left_by="key", how="inner")

pd.merge_ordered(df1, df2, left_by="key", how="right")

Original: https://blog.csdn.net/ljr_123/article/details/114015181
Author: jieru_liu
Title: python pandas.merge_ordered 用法及代码示例

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/330135/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

最近整理资源【免费获取】:   👉 程序员最新必读书单  | 👏 互联网各方向面试题下载 | ✌️计算机核心资源汇总