加密流量分类-论文3：FS-Net: A Flow Sequence Network For Encrypted Traffic Classification

2023年7月2日下午6:27 • 人工智能 • 阅读 76

FS-Net是一个端到端的分类模型，它从原始流中学习代表性特征，然后在一个统一的框架中对它们进行分类。采用多层编码器-解码器结构，可以深入挖掘流的潜在序列特征，并引入重构机制，提高特征的有效性。

传统的基于统计特征加上机器学习的流量分类，太依赖与专业经验，即人类的特征工程，特征工程的好坏直接影响分类性能。以往的基于DL的流量分类方法如Deep Packet:，只使用了网络流量的有效载荷进行分类，没有考虑到流量中的其他信息。因此提出基于DL的端到端的分类模型，尝试设计一种新的适合 流序列特征的神经网络结构，可以直接从原始输入中学习特征，学习到的特征以真实标签为指导，从而提高性能。因此，它可以节省设计和验证功能的人力。

FS-Net是基于网络流量的应用分类，即应用识别。
一个原始流量可以表示为不同的类型序列，如消息类型序列或者 包长度序列，本文将一个原始流量看作包长度序列。具体的，Xp表示第p个样本的序列表示：
X p = [ L 1 p , L 2 p , . . . , L n p ) ] X_p=[L_1^p,L_2^p,…,L_n^p)]X p =[L 1 p ,L 2 p ,…,L n p )]
其中n是Xp的长度，Lip是时间步长i的数据包值。

3.1总览

类似于AE半监督的思想，模型由五大块组成

嵌入层
编码层
解码层
重构层
分类器

3.2 嵌入层

任务：将L1到Ln的序列信息转化为e1到en的向量表示。如果有K个数据，且嵌入向量的维度为d，那么K个数据经过嵌入层将转化为一个矩阵EK*d,矩阵E是可以在模型训练过程中训练出来的，矩阵的每一个行向量都对应着一个数据样本的嵌入向量表示。
使用嵌入向量的优点：
一些非数值(如消息类型)可以很容易地表示为数值进行计算。
向量表示丰富了一个序列中每个元素保存的信息。嵌入向量的每个维度都是影响流生成的潜在特征。同一元素在不同的序列中可能有不同的含义和方面。
模型可以学习每个元素的嵌入向量的面向任务的较优秀的向量表示，从而提高分类性能。

3.3 编码层

输入为嵌入向量，输出压缩后的特征
编码采用的是堆叠的Bi-GRU神经网络模型。低层的编码器学习到局部特征，高层的编码器学习到相对全局的特征，最后将 所有层的最终前向与后向的隐藏状态串联Ze作为编码器压缩后的特征。此时，Ze就包含了整个编码流程序列的双向上下文信息，将会作为分类器的输入的一部分。（既有局部的，又有全局的）

3.4 解码层

解码器的结构如同编码器一样，为折叠的Bi-GRU网络结构。
输入为Ze，输出由两个部分组成
1.第一部分类似于编码器的输出，为解码器所有层的前向状态与后向状态的拼接，称之为，Zd这部分输出将会作用与最终的分类器输出的一部分。
2.第二部分则是最后一层解码器的自身输出，这部分将会送入重构层，进行重构，重构目标是还原起初的模型输入。

3.5 分类器

分类器之前，设置了 Dense层对分类器的输入（即Ze与Zd向量的拼接）进行压缩，得到新的特征向量z.

加密流量分类-论文3：FS-Net: A Flow Sequence Network For Encrypted Traffic Classification

然而，z的维度还是太高，使用两层带Selu的激活函数的MLP对z进行降维得到Zc,降维过后能有效避免过拟合问题。

公式中的W1，b1,b2都是可以学习的参数。
* 输入为Zc，经过softmax分类器，得到预测标签A-，与真实标签A之间构造一个交叉熵损失LC
* 在重构器后面，解码器中的Bi-GRU经过重构，输出的Li^与原始的输入特征Li之间可以构造另外一个交叉熵损失LR
* 因此，最终的损失函数
L = L C + α L R L=L_C+αL_R L =L C +αL R
α是超参数。

实验设置：以报文长度序列作为FS-Net的输出，嵌入向量维度d设置为128，GRU的隐藏状态维度也是128，α设置为1，dropout设置为0.3，Adam优化器的lr设置为0.0005
与其他模型结果实验对比的结论：加密流分类任务中，报文长度比消息类型更具有代表性。主要原因可能是[11]发现的不同应用程序的消息类型序列高度重叠。有更多的信息蕴含在包长度集合中而不是消息类型的集合中。
对FS-Net的一些分析：
摒弃解码器层、重构层和重构损失，即只将基于编码器的特征向量Ze传递到密集层进行分类。该变体称为FS-ND.此时FS-Net与其变体FS-ND的默认输入仍旧为 包长度序列（The packet length sequence）。

个人感觉这种变体特别像BERT，BERT就是只使用了Transformer的编码器结构，经历预训练后，在诸多下游任务中均获得了不错的效果。当然，BERT是有MLM与NSP的预训练任务的，而此处的FS-ND貌似并没有提及，只是单纯砍掉了解码器与重构器那一部分。
因为传统的消息类型马尔可夫方法(FoSM、SOCRT、SOB)以消息类型序列（The message type sequences）作为输入。为了便于比较，FS-Net和FS-ND也结合消息类型序列进行测试，对应的方法记为FS-Net- s和FS-ND- s。
采用多属性序列(消息类型序列和报文长度序列)来提高性能。即同时关注 包长度序列（The packet length sequence）与消息类型序列（The message type sequences），这两种不同的模型被称为FS-Net-SL和FS-ND-SL。
结果分析：
1. 重构机制（即包含解码层、重构层）有用，提高分类性能。与不同序列比较，FS-Net的FTF性能始终优于FS-ND，提高了0.01左右。利用重构机制，引导从编码器学习到的特征存储更丰富的信息。
2. 重构机制有用，但是对比FS-ND提示不大，并且加了那么多结构，有点不太划算。变体模型FS-ND也优于现有的模型，而且FS-Net和FS-ND之间的性能差距不大。然而，FS-ND模型比FS-Net需要更少的层，可以更快地训练。
3. 报文长度序列的信息比消息类型序列的信息更丰富。消息类型序列的信息几乎被合并到包长度序列中。从FS-Net到FS-Net- sl的改进不显著(如FTF为0.0005)。FSND和FS-ND-SL之间也存在类似的现象。
调参分析：
GRU的隐藏状态维度：太大，模型冗余，过拟合的同时容易从噪声中学习无用信息；太小，不足以提取数据的隐藏特征。研究中设置为128。
超参数α：建议α值设为[0.125,2]。
模型结构，类似与NLP中的Seq2Seq结构，可否在中间的编码器与解码器之间照葫芦画瓢加上Attention机制来进一步优化捏？
去除解码器与重构器，模型复杂度减少，并且实验证明在数据集上的表现FS-ND也跟FS-Net差之无几，能否在FS-ND上做出改进，使之效率与复杂度要比现在的模型好。

Original: https://blog.csdn.net/qq_45125356/article/details/126690908
Author: 烟玉蓝田
Title: 加密流量分类-论文3：FS-Net: A Flow Sequence Network For Encrypted Traffic Classification

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/665983/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

python做数据分析的自定义字符串切片

pandas数据分析小技巧有时候我们在用pandas读入数据之后，数据有点杂乱，我们想要进行改进，而且许多都是object类型的，其中切片操作非常常见，比如有这样的数据：路口0…

人工智能 2023年6月11日
0072
黑产工具情报的分析方式浅析

接下来我们以恶意爬虫、抢券工具和注册机三种工具来谈一下黑产工具情报的分析方式。对于企业方面来说，黑产工具情报可以有效的提高业务安全的攻防效率。通过分析工具利用的业务接口，不仅可以…

人工智能 2023年6月27日
0097
Stereo R-CNN1.0：

Stereo R-CNN1.0：代码克隆到自己电脑上的一些问题，只记录了从python setup.py build develop 之后出现的问题。之前的问题忘记记录了问题 …

人工智能 2023年7月10日
0054
Python提取pdf中的表格数据（附实战案例）

14天阅读挑战赛今天给大家介绍一个Python使用工具，那就是从pdf文件中读取表格数据，主要用到第三方库 pdfplumber。 pdfplumber简介 pdfplumber…

人工智能 2023年7月4日
00102
使用python用递归的方法实现冰山立方体BUC算法（以水果分类数据为例）

冰山立方体BUC算法是一种计算稀疏立方体的构建算法，在构建数据立方体的过程中，如果构建完整的数据仓库可能会花费大量的计算、存储和时间成本。不过因为在应用过程中大部分的数据都是稀疏的…

人工智能 2023年7月2日
0066
排序 (爱思创算法四)(期中测试)(答案记录)

这篇文章还是是为了帮助一些像我这样的菜鸟找到简单的题解题目描述小思老师现在拿到了一个数字序列，这个数字序列恰好由1到n这n个数字组成，但这些数字可能没有排序。由于小思…

人工智能 2023年6月27日
0044
[彻底解决]CUDA error: an illegal memory access was encountered(CUDA错误非法访问内存)

第一种可能你的程序涉及到并行计算，但你只有一张卡，因此只要将程序涉及到并行计算的部分改成单卡即可 找找有&…

人工智能 2023年7月22日
0042
解决新创建的anaconda环境在C:Usersxxx.condaenvs，而不在anaconda安装目录下的envs中

文章目录问题描述问题分析解决方法参考资料问题描述今天调试一个模型的代码时，需要新创建一个anaconda的环境，而新创建的环境之前都是在anaconda安装目录下的en…

人工智能 2023年7月3日
0082
导出TensorBoard中的所有数据并平滑处理

在写machine learning 作业的时候遇到一个题就是如果把TensorBoard文件中的数据导出并自己重新画图。查找资料以后发现有两种方式： from tensorboa…

人工智能 2023年5月25日
00142
KNN（最近邻算法）

最近邻算法（k-NearestNeighbor），简称KNN算法。 KNN算法主要分两类，一类是KNeighborsClassifier，一类是KNeighborRegressor…

人工智能 2023年6月15日
00106
【技术】DTEmpower核心功能技术揭秘(7) – ROD基于回归分析的异常点检测技术

概述《DTEmpower核心功能技术揭秘》系列的文章围绕着如何提升机器学习模型的精度，介绍了AIOD、AIAgent、autoML等核心技术。其中AIOD异常点检测技术融合了数十…

人工智能 2023年6月18日
0082
回归预测 | MATLAB实现PSO-LSTM(粒子群优化长短期记忆神经网络)多输入单输出

回归预测 | MATLAB实现PSO-LSTM(粒子群优化长短期记忆神经网络)多输入单输出目录 * – 回归预测 | MATLAB实现PSO-LSTM(粒子群优化长短…

人工智能 2023年6月16日
0078
基于Yolov5目标检测的物体分类识别及定位 — 全过程总结

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年6月17日
0069
Python实现dijkstra算法

文章目录 dijkstra算法 * 一、简介 – 1、概念二、实现原理 – 1、动图演示 2、思路解析三、代码实现 – 1、构…

人工智能 2023年7月30日
0042
图像处理（十一）：轮廓检测

1 图像的轮廓轮廓可以简单认为成将连续的点（连着边界）连在一起的曲线，具有相同的颜色或者灰度。轮廓是图像目标的外部特征，这种特征对于我们进行图像分析，目标识别和理解等更深层次的处…

人工智能 2023年6月19日
0070
基于数据挖掘的H公园客流量分析预测

2章 H公园客流量初步分析 H公园开园于2018年11月，开园时间短，所拥有的历史数据只有一年多，缺少历年来数据的对比，相关人员本身无法根据这些数据得到有价值的信息，例如季节趋势等…

人工智能 2023年7月16日
0062

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31