HanLP是由一系列模型与算法组成的工具包,目标是普及自然语言处理在生产环境中的应用。HanLP具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点;提供词法分析(中文分词、词性标注、命名实体识别)、句法分析、文本分类和情感分析等功能。
参考了网上的好多资源写了此博文
如果你的pytorch版本和GPU是对应的兼容版本,重要提示 不要直接pip install pyhanlp 或者pip install hanlp ,它会让你的pytorch自动更新升级。pytorch自动更新升级的还有torchtext。安装的时候需要注意。安装torchtext需要
conda install -c pytorch torchtext
(安装的时候观察一下,如果出现torch的更新,立马关掉命令)
然后就是java中的JDK,一般电脑上安装过neo4j或者Navicat premium过的都会有JDK的插件(这3个软件我安装太久了,忘记了,大家自行搜搜吧)
打开cmd 先执行 pip install jpype1(这里是jpype1有一个数字1)
测试jpype是否成功
>>> from jpype import *
>>> startJVM(getDefaultJVMPath(), "-ea")
>>> java.lang.System.out.println("月亮就是被人偷走的")
月亮就是被人偷走的
>>> shutdownJVM()
>>>
修改之后,在pycharm里面运行测试
from jpype import *
startJVM(getDefaultJVMPath(), "-Djava.class.path=D:\ok\HANLP\hanlp\hanlp-1.8.3.jar;D:\ok\HANLP\hanlp",
"-Xms1g",
"-Xmx1g") # 启动JVM,Linux需替换分号;为冒号:
print("=" * 30 + "HanLP分词" + "=" * 30)
HanLP = JClass('com.hankcs.hanlp.HanLP')
# 中文分词
print(HanLP.segment('月球持续偷走地球的能量,渐渐对地球造成打击,地球将无四季之分'))
print("-" * 70)
shutdownJVM()
结果为
`
==============================HanLP分词==============================
[月球/n, 持续/vd, 偷走/v, 地球/ns, 的/ude1, 能量/n, ,/w, 渐渐/d, 对/p, 地球/ns, 造成/v, 打击/v, ,/w, 地球/ns, 将/d, 无/v, 四季/n, 之/uzhi, 分/qt]
Original: https://blog.csdn.net/ghjikd/article/details/124343439
Author: 温柔可爱贝
Title: hanlp安装
原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/527703/
转载文章受原作者版权保护。转载请注明原作者出处!