【RASA】安装与项目构建

2023年8月11日上午4:55 • Python • 阅读 51

一、rasa安装

首先安装rasa，目前rasa版本支持多种语言，可以直接通过下面指令来安装：

pip install rasa

由于要安装很多依赖包，所以此步骤所需时间比较长。（也可以加个清华源来安装）

目前安装的是rasa-1.3.0，依赖的tensorflow版本为1.15.0，rasa版本更新较快，后续版本依赖的tensorflow为2.0版本。但不同的rasa对后续的开发影响不大。

安装好rasa之后，就可以构建rasa项目去训练自己的chatbot。

二、新建rasa项目

rasa init --no-prompt

项目创建后，会生成如下文件：

训练模型：

python -m rasa train --config config.yml --domain domain.yml --data data/

运行rasa服务：

python -m rasa run --port 5005 --endpoints endpoints.yml --credentials credentials.yml --debug

启动action服务：

Python -m rasa run actions --port 5055 --actions actions --debug

启动flask交互界面：

python server.py

|– word
| |– dict.txt #jieba分词用户自定义字典

测试了一个简单的银行存取款问答数据，可以跑通项目，如下截图：

备注：
1、nlu模块添加自定义组件
目前添加自定义模块是在源码中添加的，以bilstm-crf用于实体识别为例：
（1）、首先将bilstm_crf_entity_extractor.py添加到site-package/rasa/nlu/extractor中；
（2）、在site-package/rasa/nlu/registry.py中将自定义模块加入进来：
1）from rasa.nlu.extractors.bilstm_crf_entity_extractor import BilstmCRFEntityExtractor
2）component_classes中添加 BilstmCRFEntityExtractor,
3）registered_pipeline_templates中添加”ner_bilstm_crf”: [“BilstmCRFEntityExtractor”],
(3)、在config.yml文件中加入自定义组件配置，- name: “BilstmCRFEntityExtractor”

三、rasa数据格式说明

（1）rasa_nlu数据格式：

rasa_nlu提供了两种训练样本的数据格式——Markdown和json。通常我们会使用Markdown来存储训练数据。同时Markdown和json之间可以互相转换，通过运行rasa data convert nlu即可。下面将介绍Markdown数据格式。

rasa_nlu数据可以形式化为4个部分：

a. common example（必须）

comment examples是必须要有的，它由intent、text和entities三部分组成。其中，text表示用户自然语言文本，即用户Message；intent表示某个意图，它应于某些text相对应； entities表示将要被提取的目标实体，我们需要在text文本中标出(如果该text存在实体的话)。Common Examples一般格式如下：

intent:你的意图名称

text

注：text中可以不包括实体，但如果包含需要用entityText进行标志

b. synonyms（同义词）

对于同义词，在实体提取的时候会被统一解析成同一个意思。举例来说：

synonym:余额

余额
话费
话费余额
账户余额

在我们说账户余额、话费等词语时，NLU在提取实体时会能够成功被捕获，并被统一解析成余额。需要注意的是，为了在训练数据中使用同义词，需要pipeline中包含EntitySynonmMapper组件。

c. regular expression features

正则表达式有助于意图分类和实体抽取，但它不参与实体和意图的定义，仅仅是提供规则来协助意图分类和实体抽取。因此，在训练文本text中，该添加的实体和意图样本需要照样添加。比如当需要用户输入的手机号实体时，我们可以再nlu.md文件中添加正则表达式特征支持，当用户输入的Message包含符合手机号正则表达式规则的内容时，Rasa可以更加容易地将其提取出来。Regular Expression Features一般格式如下：

regex:phone_number

((\d{3,4}-)?\d{7,8})|(((+86)|(86))?(1)\d{10})

注意：phone_number表示的既不是实体名也不是意图名，它只是一个便于我们阅读的标志而已。除了实体识别，我们还可以编写符合意图分类的正则表达式。另外，需要注意的是，对于实体提取来说，目前只有CRFEntityExtractor 实体提取器支持正则特征，MitieEntityExtractor和SpacyEntityExtractor目前还不支持；对于意图分类器，目前均已支持正则特征。最后，为了使用正则特性，我们需要在pipline中添加RegexFeaturizer组件。

d. lookup tables

查找表有利于在加载训练数据时，生成与Regular Expression Features相同的正则特征。当在训练数据中提供查找表时，内容被组合成一个大型、不区分大小写的regex模式，该模式在训练示例中查找精确匹配。这些正则表达式匹配多个token，其处理与训练数据中直接指定的正则表达式模式相同。

四、参考文档：

http://rasachatbot.com/ （rasa中文文档）
Rasa中文聊天机器人开发指南(2)：NLU篇_无名之辈FTER的博客-CSDN博客

Original: https://blog.csdn.net/u011590738/article/details/125497900
Author: MachineCYL
Title: 【RASA】安装与项目构建

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/746233/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

7. Python type( )函数——查询数据类型

type( )函数——查询数据类型文章目录 7. type( )函数——查询数据类型 * 1. print( )函数知识回顾 2. 什么是type( )函数 3. type( )…

Python 2023年8月23日
0046
【pytest】修改allure报告中的logo及参数化

文章目录一、Pytest生成Allure报告-改变报告logo * 1、找到Allure安装static目录文件： 2、将需要替换的logo文件保存在该目录下：【并命名为allu…

Python 2023年9月9日
0053
【合集】笔者送给读者的话

当同学们看到这页博客，那么恭喜你们，你们已经踏上了一条前程似锦却又辛苦无比的路可能同学们幻想中的程序员是这样的工资高，待遇好，技术黑客。 *高收入低消费，动不动就两三十万，年收…

Python 2023年6月10日
0064
java 爬取股票_使用 Scrapy 爬取股票代码

抓取工具：scrapy scrapy 介绍 Scrapy是一个为了爬取网站数据，提取结构性数据而编写的应用框架。可以应用在包括数据挖掘，信息处理或存储历史数据等一系列的程序中。其…

Python 2023年10月4日
0042
【python】django数据库操作

第三方库准备： pip install mysqlclient ORM ORM可以做两件事：创建、修改、删除数据库中的表【无法创建数据库】操作表中数据 1 创建数据库 2 Dj…

Python 2023年8月6日
0066
Pytest测试框架

Pytest介绍Pytest文档：https://docs.pytest.org/en/latest/contents.html#toc第三方库：https://pypi.org/…

Python 2023年9月13日
0044
PySpark之SparkSQL基本操作

SparkSQL DataFrame的优点： DataFrame的推出，让Spark具备了处理大规模结构化数据的能力，不仅比原有的RDD转化方式更加简单易用，而且获得了更高的计算性…

Python 2023年8月8日
0057
matplotlib cm.coolwarm报错解决方法

目录背景解决方法第一处错误解决方法第二处错误 cm.coolwarm 解决方法完整代码使用其它颜色背景想了解一下 matplotlib 绘图，从官网 copy了以…

Python 2023年9月3日
00116
手把手教你使用scrapy框架来爬取北京新发地价格行情（理论篇）

点击上方” Python爬虫与数据挖掘“，进行关注回复” 书籍“即可获赠Python从入门到进阶共10本电子书今日鸡汤博…

Python 2023年10月3日
0072
Servlet | HttpServletRequest接口、通过request接口获取请求参数

一：HttpServletRequest接口二：通过request接口获取请求参数一：HttpServletRequest接口（1）HttpServletRequest是一个…

Python 2023年11月7日
0056
17 – vulhub – Django GIS SQL注入漏洞（CVE-2020-9402）

文章目录 * – 漏洞名称：Django GIS SQL注入漏洞（CVE-2020-9402） – + 影响版本 + 漏洞原理 – 漏洞复现 &…

Python 2023年8月5日
0056
程序员自制游戏：超级玛丽100%真实版，能把你玩哭了~【附源码】

导语🎁 哈喽！哈喽！我是木木子😎，今日游戏更新—— 超级玛丽华丽上线🎊啦！ “超级玛丽“有多少人还记得这款经典游戏？对于90、00后应该不大熟悉，但多多少少…

Python 2023年8月2日
0085
深度学习FashionMnist模型训练

import osimport tensorflow as tffrom tensorflow import kerasfrom tensorflow.keras import d…

Python 2023年10月29日
0044
SQL alchemy使用

SQLAlchemy介绍创建操作数据表 scoped_session线程安全基本增删查改新增数据删除数据修改数据查询数据一对多关系多对多关系 flask-sqlal…

Python 2023年8月13日
0038
龙珠训练营python-Pandas揭秘美国选民的总统喜好

阿里天池龙珠训练营python数据分析项目用Pandas揭秘美国选民的总统喜好链接https://tianchi.aliyun.com/competition/entrance…

Python 2023年8月22日
0048
Scrapy 工作流程

Scrapy工作流程(重点) 1.首先Spider(爬虫)将需要发送请求的url经过ScrapyEngins(引擎)交给调试器Scheduler(调度器)2.Scheduler(调…

Python 2023年10月4日
0051

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31