Experiment3: IR Evaluation

2023年7月18日上午11:24 • 人工智能 • 阅读 34

实现代码如下

def generate_tweetid_gain(file_path):
    data_dict = {}
    with open(file_path, 'r', errors='ignore') as f:
        for line in f:
            result = line.strip().split(' ')
            query_id = result[0]
            docu_id = result[2]
            rel = int(result[3])
            if query_id not in data_dict:
                data_dict[query_id] = []
            if rel > 0:
                data_dict[query_id].append([docu_id,rel])
            else:
                data_dict[query_id].append([docu_id,0])
    return data_dict

import pandas as pd
import math
import numpy as np

def generate_tweetid_gain(file_path):
    data_dict = {}
    with open(file_path, 'r', errors='ignore') as f:
        for line in f:
            result = line.strip().split(' ')
            query_id = result[0]
            docu_id = result[2]
            rel = int(result[3])
            if query_id not in data_dict:
                data_dict[query_id] = []
            if rel > 0:
                data_dict[query_id].append([docu_id,rel])
            else:
                data_dict[query_id].append([docu_id,0])
    return data_dict

def MAP_eval(data_dict):
    MAP = 0
    for query_result in data_dict:
        data = data_dict[query_result]
        AP = 0
        Rank = []
        for result in data:
            rel = result[1]
            if(rel > 0):
                index = data.index(result) + 1
                Rank.append(index)

        num_related_doc = len(Rank)
        i = 1
        for index in Rank:
            precision = i / index

            AP += precision
            i += 1
        AP /= num_related_doc

        MAP += AP
    MAP = MAP / len(data_dict)
    return MAP

def MRR_eval(data_dict):
    MRR = 0
    for query_id in data_dict:
        data = data_dict[query_id]
        RR = 0
        for result in data:
            rel = result[1]
            if(rel > 0):
                index = data.index(result) + 1
                RR = 1 / index
                MRR += RR
                break

    MRR = MRR / len(data_dict)
    return MRR

def NDCG_eval(data_dict):
    NDCG = 0
    for query_id in data_dict:
        data = data_dict[query_id]
        CG = 0
        DCG = 0
        IDCG = 0

        i = 1
        for result in data:
            rel = result[1]
            CG +=  rel
            if i == 1:
                DCG = rel
            else:
                DCG += (rel / math.log2(i))
            i += 1

        sorted_data = sorted(data, key = lambda x:x[1],reverse = True)
        i = 1
        for result in sorted_data:
            rel = result[1]

            if i == 1:
                IDCG = rel
            else:
                IDCG += (rel / math.log2(i))
            i += 1

        NDCG += DCG / IDCG

    NDCG = NDCG / len(data_dict)
    return NDCG

def evaluation():

    file_path = './qrels.txt'
    data_dict = generate_tweetid_gain(file_path)
    MAP = MAP_eval(data_dict)
    print('MAP', ' = ', round(MAP, 5), sep='')
    MRR = MRR_eval(data_dict)
    print('MRR', ' = ', round(MRR, 5), sep='')
    NDCG = NDCG_eval(data_dict)
    print('NDCG', ' = ', round(NDCG, 5), sep='')

if __name__ == '__main__':
    evaluation()

Original: https://blog.csdn.net/Hzh130727/article/details/121652920
Author: AI-NuanBaobao
Title: Experiment3: IR Evaluation

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/700693/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

KITTI 3D目标检测的评估指标

3D目标检测使用RGB图像、RGB-D深度图像和激光点云，输出物体类别及在三维空间中的长宽高、旋转角等信息的检测。多类别目标的检测问题可以转换为”某类物体检测正确、…

人工智能 2023年7月10日
0062
【文本分类案例】(4) RNN、LSTM 电影评价倾向分类，附TensorFlow完整代码

大家好，今天和大家分享一下如何使用训话神经网络中的 RNN 和 LSTM 方法完成影评倾向分类。数据集的解释见下文：https://blog.csdn.net/qq_2386969…

人工智能 2023年5月26日
0095
SVM实现鸢尾花分类

目录一、数据准备二、模型搭建三、模型训练四、模型评估五、数据可视化六、完整代码这次我们尝试用支持向量机（SVM）来完成对鸢尾花的分类任务。对于啥时SVM，我们可以看看…

人工智能 2023年6月30日
00101
决策树介绍及常用算法

决策树作为最基础、最常见的有监督学习模型，常用来做语分类问题、回归问题决策树算法3要素：特征选择、决策树生成、决策树剪枝决策树生成过程就是使用满足划分准则的特征不断的将数据…

人工智能 2023年6月16日
0060
浅谈卷积神经网络

1.1 举个栗子：图像处理流程运算方式：卷积核在输入图像中进行移动并计算，计算方式不同，输出结果随之同。作用：使得原始信号的特征可以增强。 2.1 定义 CNN（Convolu…

人工智能 2023年6月22日
0067
【沐神课程 – 动手学深度学习】实战二详解之 Kaggle比赛：分类树叶

本部分主要用于记录自己做第二次作业的一些感受，主要是也第一次Dataloader 也算是一次学习了首先遇到的问题： Resnet18 其实看kaggle讨论和代码区挺多人上了r…

人工智能 2023年7月1日
00130
四大含金量高的算法证书考试

证书考试推荐 * – 一、PAT 计算机程序设计能力测试 – 二、CCF CSP认证 – 三、团体程序设计天梯赛 – 四、蓝桥杯大赛…

人工智能 2023年6月28日
00223
人工智能值得研究的领域有哪些?

人工智能的关键技术是深度学习，它通过模拟人脑的神经网络来阅读和处理大数据，并找出完成特定任务的规则。以深度学习为关键技术的人工智能逐渐成为各国研发投入的重点，其发展已进入应用阶段。…

人工智能 2023年5月25日
0083
Jupyter使用技巧+快捷键【速查手册】

文章目录 * – 一、编辑模式与命令行模式 – 二、编辑模式快捷键 – + （1）运行代码(命令模式也可用) + （2）光标跳转 + （3）提示…

人工智能 2023年7月15日
00139
cpu和gpu已过时，npu和apu的时代开始

🌎CPU是中央处理器。其实就是机器的”大脑”，也是布局谋略、发号施令、控制行动的”总司令官”。CPU的结构主要包括运算器（ALU，A…

人工智能 2023年7月26日
0043
cv2.VideoWriter 保存图像为视频的几个问题

用opencv库的cv2.VideoWriter函数保存图像为视频一、先确定要保存的视频的编码方式 cv2.VideoWriter_fourcc(‘I’,…

人工智能 2023年7月20日
0058
【Python强化】pandas处理excel数据

python操作excel表格文件的增删读写，一般需要用到的第三方库有xlwt,xlrd。xlrd负责读取excel,xlwt负责写入excel文件。这种操作方法比较繁琐，效率还不…

人工智能 2023年7月7日
0046
array()、range() 和 arange()函数的区别和用法

一、array() 函数二、range() 函数三、arange() 函数四、对比一下range() 和 arange() np.array(object,dtype=Non…

人工智能 2023年6月16日
0055
NLP-分类模型：短文本分类概述【FastText、TextCNN、TextRNN、TextRCNN、DPCNN】

随着信息技术的发展，最稀缺的资源不再是信息本身，而是对信息的处理能力。且绝大多数信息表现为文本形式，如何在如此大量且复杂的文本信息中如何获取最有效的信息是信息处理的一大目标。文本分…

人工智能 2023年6月30日
0080
python 图像增强算法实现

使用python编写了共六种图像增强算法：1）基于直方图均衡化2）基于拉普拉斯算子3)基于对数变换4)基于伽马变换5)限制对比度自适应直方图均衡化：CLAHE6)retinex-S…

人工智能 2023年6月18日
0055
远程声控系统（MATLAB代码见CSDN资源）

欢迎关注公众号[反向传播猿] [En] Welcome to follow the official account [reverse communication ape] 远程声…

人工智能 2023年5月25日
0061

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

Experiment3: IR Evaluation

大家都在看