论文学习——多度量水文时间序列相似性分析

2023年6月27日下午7:22 • 人工智能 • 阅读 88

文章目录

摘要
1 研究背景
*
1.1 主要研究内容
1.2 研究背景
1.3 启发
2 基于改进BORDA投票法的多度量水文时间序列相似性分析
*
2.1 研究方法
2.2 BORDA投票法的改进
–
- 2.2.1 BORDA 的缺点
- 2.2.2 改进的BORDA投票法
3 实验验证与分析
*
3.1 实验数据
3.2 实验结果分析
4 结语

多度量组合可以提高相似性分析的准确性。

; 摘要

多度量组合可以提高相似性分析的准确性
本文方法：首先使用多个单一相似度量分别计算相似时间子序列；然后采用改进的BORDA投票法对各度量分析得到的相似子序列进行组合和排序，得到最终的相似时间子序列。

1 研究背景

1.1 主要研究内容

主要是研究水文时间序列相似性；
目前是k个最近邻水文过程发现，特别是洪水过程的相似性。

1.2 研究背景

众多学者结合水文时间序列的特点，进行了水文时间序列相似性的研究。

李薇《水文时间序列相似性查询的分析与研究》
抽取时间序列的模式特征（包括长度和斜率），然后借鉴动态弯曲的思想定义序列之间的动态模式匹配距离（DPM）
欧阳如琳《水文时间序列的相似性搜索研究》
采用DTW距离计算流域内多水文站之间相似性洪水过程，发现流域的洪水过程形态。
朱跃龙《基于语义相似的水文时间序列相似性挖掘》
提出基于语义的水文时间序列相似性度量，定义水文时间序列的上升、保持和下降等语义模式，在此基础上，定义序列的语义距离描述序列的相似程度。

李士进《基于BORDA计数法的多元水文时间序列相似性分析》
针对多维水文时间序列相似性，李士进首先逐维进行一元时间序列相似性分析，然后采用BORDA投票法对各维的相似子序列进行组合和排序，获取多维相似子序列。

; 1.3 启发

目前水文时间序列相似性所示大多采用单一相似度量来评价序列之间的相似性。

[11-12]文献提出多度量相似性分析， 采用启发式搜索确定各度量的权重，相似距离为各度量距离的加权和。

2 基于改进BORDA投票法的多度量水文时间序列相似性分析

2.1 研究方法

串行组合处理
并行组合处理

本文关注h近邻搜索问题，即查询与指定序列最相似的前k个子序列从分类角度来看，k近邻相似搜索可以视为采用相似度量将时间子序列划分为第1相似子序列、第2相似子序列…，第h相似子序列以及不相似子序列。（也就是说，前k个都是相似的，后面都是不相似的）
*本文采用改进的BORDA投票法，对多个单一相似度量算法计算得到的相似子序列进行并行组合，得到最终的k近邻子序列。

; 2.2 BORDA投票法的改进

2.2.1 BORDA 的缺点

本文指定：针对每个投票人的排序，给每个候选人设定一个排序分数，规定排在最后的候选人的排序分数为1分，倒数第2位的候选人为2分，依次类推，排在第1位为p分，候选人的排序分数的累积称为BORDA分数,BORDA分数进入前m名的候选称作BORDA胜者。

BORDA投票法只考虑所有候选人排序先后，没有考虑前后候选人差距的大小，这样可能造成无法计算出真实的排序。【啥意思啊，看不懂啊，候选人差距的大小？感觉根据例子是投票人差距大小吧阿巴阿巴】

如假设,有A、B.C、D四匹马进行四场比赛，四场比赛名次排序分别为:A、B C、D,B、A、D、C,D、C、A、B和C、D、B、A。四匹赛马BORDA分数都为10分,出现了四匹赛马并列第一名的情况，因为BOR-DA投票法仅考虑四匹马的名次排序，而没有考虑各匹马在比赛时成绩的具体差异。

2.2.2 改进的BORDA投票法

那么我就自然地提出我的问题了：第一d1 、d2、d3等等是如何确定的？第二候选人差距是否可以量化是如何确定的？

在各单一相似度量的查询结果中，出现次数越多，说明其被越多的相似度量认可为相似子序列，其改进BORDA分数将可能越高；若只是在单一相似度量的查询结果靠前，说明可能只是被单一的度量认为是相似子序列，其改进BORDA分数可能不高。

因此，相比于单一相似度量，多度量组合可以在结果中包含参与组合的多个单一相似度量结果中的优秀结果，从而提高相似搜索的准确性。

; 3 实验验证与分析

为什么选择这一流域的这一个水文站？

3.1 实验数据

这里的实验数据介绍的还是很清楚的。

首先可以看到是11年间的，6-9这四个月的流量数据（标题中的水文序列就是指的是流量序列，水文数据包括了流量数据、水文数据、降水量数据等等），每天是四个检测时间点，也就是说（这里是大概算了一下数据量） 11年 * 4个月 * 30天 * 4个时间点 = 5280个数据点 这些数据都是连续的记录型数据，但是要注意的是，这里是洪水过程相似性分析，应该是要对5千个数据点按照一场洪水为单位去划分的，每场洪水大概持续多少天然后大概几十到一百多的流量数据能刻画出一场洪水。

; 3.2 实验结果分析

这里介绍了查询序列，任务就是在数据库中查询出与之相似的序列。
可以看到这个洪水是7月31日到8月29日， 30天*4个数据点，流量序列的长度就是120
看表1，这里可以看出洪水的流量序列是被等长切分的，也就是说没有按照单场洪水来划分，而是简单处理成30天的长度，应该是作者想要方便实现和方便计算。

实验二：双洪峰M型洪水相似性分析

分析就不放上来了，无非就是这四种方法不好，然后自己提出的改进BORDA方法好。

4 结语

Original: https://blog.csdn.net/weixin_42521185/article/details/127752134
Author: 谜底是你_
Title: 论文学习——多度量水文时间序列相似性分析

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/655528/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

R语言应用统计1 主成分分析

R语言应用统计1 主成分分析这个系列就讨论应用基础，争取一条公式都不用写。当原始数据集比较庞大，并且不同变量之间存在一些相关性时，我们希望可以用更少的变量来表示原始数据集，用到的…

人工智能 2023年6月19日
0073
【数据集转换】VOC数据集转COCO数据集·代码实现+操作步骤

在自己的数据集上实验时，往往需要将VOC数据集转化为coco数据集，因为这种需求所以才记录这篇文章，代码出处未知，感谢开源。在远程服务器上测试目标检测算法需要用到测试集，最常用的…

人工智能 2023年7月23日
0080
手把手教利用Bert实现知识库问答（详细注释）

1、数据分析数据格式如下：这个题目的意思就是判断Question和Sentence是否匹配，如果匹配label就是1 统一导入工具包 import csv import tran…

人工智能 2023年5月28日
0087
学生HTML个人网页作业作品简单的IT技术个人简历模板html下载简单个人网页设计作业静态HTML个人博客主页

🎉精彩专栏推荐👇🏻👇🏻👇🏻✍️ 作者简介: 一个热爱把逻辑思维转变为代码的技术博主💂 作者主页: 【主页——🚀获取更多优质源码】🎓 web前端期末大作业：【📚毕设项目精品实战案例…

人工智能 2023年6月26日
0090
[ 可视化 ] 经典网络模型 —— Grad-CAM 详解与复现

🤵 Author ：Horizon Max ✨ 编程技巧篇：各种操作小结 🎇 机器视觉篇：会变魔术 OpenCV 💥 深度学习篇：简单入门 PyTorch 🏆 神经网络篇：经典网络…

人工智能 2023年6月16日
00128
第十六届全国大学生智能汽车比赛—摄像头算法控制总结

第十六届全国大学生智能汽车比赛是我大学参加的第一个有意义的比赛，让我在学校实验室SCA打开了进入大学的大门，无数次的包夜和学习让我静下了心，很荣幸参加过这样一次的竞赛，收获颇丰。简…

人工智能 2023年6月17日
0087
Python NLP教程之知识图谱，从文本构建知识，实现从文本或在线文章中提取知识库的管道（教程含源码）

; 准备开始？这就是我们要做的：了解什么是知识库和知识图谱。了解如何构建知识图谱以及REBEL模型的工作原理。实现从文本中提取关系、构建知识图并将其可视化的完整管道。使用S…

人工智能 2023年6月10日
0079
图像处理技术-基本运算

点运算是图像处理图像处理基本运算，即像素2像素，对每个像素进行运算B(x,y)= f [A(x,y)]A–输入图像；B–输出图像f–灰度映射函数点运算根据f的不同而分为线性/非线性…

人工智能 2023年6月20日
0060
论文阅读：Knowledge Distillation: A Survey 知识蒸馏综述（2021）

论文阅读：Knowledge Distillation: A Survey 知识蒸馏综述2021 目录摘要 Introduction Background 知识 * 基于响应的知…

人工智能 2023年5月27日
0081
腐蚀与膨胀算法

（1）概念腐蚀与膨胀算法，是一种入门级基础的形态学处理算法，常见用于图形处理方面腐蚀操作可以消除噪点，同时消除部分边界值，导致目标图像整体缩小。膨胀操作可以使目标特征值增大，导致…

人工智能 2023年5月26日
0081
softmax多分类

文章 * – 一、softmax分类 – 二、Fashion MNIST 数据集 – 三、softmax分类的简单示例 – + 1….

人工智能 2023年6月17日
0099
相机标定——张氏标定法

目录 * – 前言 – + 动机 + 为什么要进行相机标定 + 什么是张氏标定法 – 张氏标定法的原理 – + 透镜成像原理 + 世…

人工智能 2023年5月26日
0077
【Python+中文NLP】知识图谱系列(1)——构建流程

目录前言领域知识图谱构建 * 一、知识图谱基本定义 – 1.1 三元组 1.2 两个层次二、构建流程 – 2.1 四个阶段 2.2 五个环节 + 1….

人工智能 2023年6月1日
00117
[spawn_model1-4] process has died [pid 6923, exit code 1, cmd /opt/ros/melodic/lib/gazebo_ros/spawn_

一、问题描述： joes@joes-PC:~/jiao/ROS_Projects/05_aotexueyuan_Project$ roslaunch ros23_urdf02_ga…

人工智能 2023年6月2日
00108
经典论文学习笔记——13篇对比学习（Contrastive Learning）

emsp; 跟着李沐老师的对比学习课程看了一遍，又照着知乎 / CSDN等各位大佬的总结，重新理解了一遍，下面根据自己的学习来总结一下。着重讲一下MoCo，及附带其他12种对比学习…

人工智能 2023年6月25日
0096
一个基于Docker的TensorRT+OpenCV项目的环境配置

最近做了个基于docker的深度学习项目，这里简要记录一下整个环境的搭建和遇到的坑，供自己以后回看和大家借鉴。环境依赖 python 3.7.13cuda10.2 cudnn 8…

人工智能 2023年7月20日
0076

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31