Fiftyone 可视化

2023年7月10日下午5:44 • 人工智能 • 阅读 41

导入数据集
打开可视化界面显示
加载自己的预测
数据集评估
结果分析

导入数据集

fiftyone支持许多官方数据集，如coco等。这些数据集的加载方式较为简单。可直接使用官方提供的加载方式：

import fiftyone as fo
import fiftyone.brain as fob
import fiftyone.zoo as foz
import numpy as np
import cv2
import json
from collections import defaultdict

dataset = foz.load_zoo_dataset(
    "coco-2017",
    split="validation",
    dataset_name="evaluate-detections-tutorial",
)

但是许多时候我们的数据集存在本地，我们需要加载本地的数据集。这时候可以利用另一种方法：

dataset = fo.Dataset.from_dir(
   dataset_type=fo.types.COCODetectionDataset,
   data_path=image_path,
   labels_path=label_path,
)

这里的 image_path为你保存图片的路径。而这里的 label_path为你的json文件。注：如果是VOC格式的文件也可以使用一些转换脚本。我们可以使用 print来打印数据集的信息：

图1 数据集的一些信息这里显示数据集中有241张图片。

打开可视化界面显示

fiftyone的强大功能在于他的可视化。虽然我们也能直接读取出预测结果，然后在图片上进行绘制标签。但每当进行一个新的任务时，我们都需要修修改改，很不方便。fiftyone提供了一个可视化界面给我们直接观看预测结果，而不用自己去一张一张的绘制标签。

session = fo.launch_app()
session.dataset = dataset

图2 fiftyone的可视化APP

我们可以打开每一张图片查看具体信息：

图3 fiftyone的图片详细信息展示

加载自己的预测

上述只是将数据集中的标注可视化，没有实际意义。我们需要加入自己的预测进行对比。官网给出的方式为将数据集中的图片读取出送入预测网络中进行端到端的添加。我们这里已经有预测结果了，需要做出一些改变。直接通过 image_id字段添加。

image_path = '/home/xx/桌面/boat-voc/JPEGImages/'
labels_path = '/home/xx/桌面/boat-voc/val.json'
predict_path = '/home/xx/桌面/boat-voc/MSMF.json'

dataset = fo.Dataset.from_dir(
   dataset_type=fo.types.COCODetectionDataset,
   data_path=image_path,
   labels_path=labels_path,
)

with open(labels_path) as f:
    val = json.load(f)

with open(predict_path) as f:
    predict_results = json.load(f)

id2predict = defaultdict(list)
with fo.ProgressBar() as pb:
    print('generate the id2predict')
    for result in pb(predict_results):
        id2predict[result['image_id']].append(result)

image2instance = {}
with fo.ProgressBar() as pb:
    print('generate the image2id')
    for result in pb(val['images']):
        image2instance[result['file_name']] = result

classes = dataset.default_classes

predictions_view = dataset.view()

with fo.ProgressBar() as pb:
    for sample in pb(predictions_view):
        image_name = sample['filepath'].split('/')[-1]
        image_id = image2instance[image_name]['id']
        w, h = image2instance[image_name]['width'], image2instance[image_name]['height']
        detections_free = []
        for image_result_i in id2predict[image_id]:

            x1, y1, w1, h1 = image_result_i['bbox']
            rel_box = [x1 / w, y1 / h, w1 / w, h1 / h]
            detections_free.append(
                fo.Detection(
                    label=classes[image_result_i['category_id']],
                    bounding_box=rel_box,
                    confidence=image_result_i['score']
                )
            )

        sample['FREE'] = fo.Detections(detections=detections_free)
        sample.save()
print("Finished adding predictions")
session = fo.launch_app()
session.dataset = dataset
session.view = predictions_view

这次打开APP显示之后，你会发现多了一个在 ground_truth旁边多了一个字段。这个字段的名字为 FREE即为我们添加的预测。

图4 fiftyone添加预测展示我们可以每一张查看预测的效果。但在很多图片中出现了多余的框，这是由于我们没有调节置信度阈值所导致的。我们可以在APP中直接调节阈值而不用重新生成。我们可以在FREE的下拉列表中调节confidence的值来过滤掉低分的框。也可以在查看图片时在下拉列表里面设置。

图5 fiftyone调整阈值1

图6 fiftyone调整阈值2 设置阈值后，低于阈值的得分将被丢弃，只会显示高于阈值的结果。这样下来整个界面就比较清晰了。

图5 0.5置信度。粉红的为预测，绿色的为真值。

数据集评估

fiftyone 支持许多独特的数据集评估方式。我们可以按照coco数据集的方式去评估预测。对于上一步我们添加的数据集来说我们可以直接使用下面的代码进行评估：

results_FREE = predictions_view.evaluate_detections(
    "FREE",
    gt_field="ground_truth",
    eval_key="eval_free",
    compute_mAP=True,
)

FREE为需要评估的预测， gt_field为真值标签。这里的具体值对应我们我们的设置。比如我们在添加预测时使用了这一行代码 sample['FREE'] = ......。这说明我们将预测添加后命名为FREE。如果自己不确定名字也可以打开APP查看名字。
得到了评估结果后我们可以根据我们的需求进行查看。在这里实现几个评估：

实现基本的mAP计算。直接打印结果即可：

图6 mAP计算。

打印每一类别详细的报告（左），和只打印具体类别的报告（右）:

图7 打印所有类别报告

图8 打印单个类别报告

显示PR曲线。和打印类别报告类似，我们也可以通过classes控制显示的类别:

图9 打印两条PR曲线

图10 打印全部PR曲线事实上，官方还给出了一种评估方式，但这种评估方式是存在问题的。在前面说道，我们可以设置置信度阈值去丢弃低分的预测。为了评估丢弃后的效果，官方还给出了另一种评估方法：

score_thr = 0.5
high_score_predict = predictions_view.filter_labels("FREE", F("confidence") > score_thr)
high_result = high_score_predict.evaluate_detections(
    "FREE",
    gt_field="ground_truth",
    eval_key="eval_free",
    compute_mAP=True,
)

图11 0.5为阈值mAP。

图12 0.9为阈值mAP。显然，0.9为阈值的mAP与0.5为阈值的mAP不应该呈现如此的情况。事实上在重新生成json文件时，使用0.9为阈值的预测，使用cocoAPI仅仅能够得到小数位的mAP。

错误修订：事实上，官方给的样例是存在问题的。但是fiftyone是支持按照不同阈值来评估mAP的。不过我们需要添加一些参数：

图13 0.9为阈值mAP正确用法。注意在过滤时我们需要添加only_matches=False。否则在过滤后的样本中只会剩下含有预测的样本！！！！。

结果分析

fiftyone 提供了样本级别的分析。在评估后，再一次打开APP界面你会发现多了三个字段 TP，FP，FN分别对应了 True Positive， False Positive，False Negative。再次打开app之后会出现这几个字段：

图14 评估后多出来的字段我们可以根据这些字段去查看表现最好的样本（最多的TP数量），表现最差的样本（最多的FP数量）


session.view = high_score_predict.sort_by('eval_free_tp',reverse=True)

session.view = high_score_predict.sort_by('eval_free_fp',reverse=True)

在上诉的view视图中，我们仅仅按照分数大于某个阈值的的条件进行过滤。事实上，view能够完成更多复杂的操作，比如按照区域的大小来过滤。在coco数据集中像素数量少于3 2 2 32^2 3 2 2的作为小样本。在这里我们采用同样的条件过滤：


dataset.compute_metadata()

bbox_area = (
    F("$metadata.width") * F("bounding_box")[2] *
    F("$metadata.height") * F("bounding_box")[3]
)
small_boxes = bbox_area < 32 ** 2

small_boxes_view = dataset.filter_labels("FREE", small_boxes)
session.view = small_boxes_view

得到了这个view之后，我们可以利用之前介绍的方法去进行评估和可视化。

Original: https://blog.csdn.net/qq_40246742/article/details/121107375
Author: boundin box
Title: Fiftyone 可视化

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/683274/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

pandas DataFrame.shift()函数

pandas DataFrame.shift()函数可以把数据移动指定的位数 period参数指定移动的步幅,可以为正为负.axis指定移动的轴,1为行,0为列. eg: 有这样一…

人工智能 2023年6月2日
0070
一文读懂PCL可视化，CloudView类、PCLVisualizer可视化类、PCLPlotter可视化方法

官网链接：Point Cloud Library (PCL): Module visualization参考博客：PCL可视化一、PCL可视化概述构建pcl_visualiza…

人工智能 2023年6月2日
0091
机器学习多元线性回归模型（公式推导以及代码实现）

一、理论部分二、代码实现三、感想一、理论部分（公式推导） 1.1、线性回归矩阵最小二乘法(参考高等代数) 这部分知识可以参考：求C = y-Y 最小值–&gt…

人工智能 2023年6月16日
0095
2022年十大数据可视化工具，值得收藏

在业务设置中，数据可视化工具可以帮助可视化业务流程生成所有数据，并创建仪表板来跟踪几乎所有的内容。数据可视化工具还可以完美地使用特定事件、项目、分析和信息的数据创建图形。数据可视…

人工智能 2023年7月16日
0068
安卓利用tensorflow-lite使用yolov5训练的模型

前言作为使用yolov5后一次简单的尝试准备工作通过yolov5训练出自己所需要的模型查看模型训练教程将模型通过tensorflow的python版转换，使用yolov5 …

人工智能 2023年5月25日
0094
【图像处理】sobel边缘检测的实现

Sobel算子是图像边缘检测中最重要的算子之一,该算子包含两组3×3的矩阵，分别为横向及纵向，将之与图像作2D卷积，即可分别得出横向及纵向的亮度差分近似值。Gx,Gy的值…

人工智能 2023年6月18日
0088
【YOLOV5】训练自己的数据集，CBAM，CIoU，Soft-nms，网络结构修改

Ultralytics： https://github.com/ultralytics/yolov5本文链接： https://github.com/ghostype98/yolo…

人工智能 2023年5月26日
00102
传统伪影去除方案

1、Pointwise Shape-Adaptive DCT for High-Quality Denoising and Deblocking of Grayscaleand C…

人工智能 2023年6月18日
0079
TensorFlow构建模型一

免责声明：本文非常简单，适合初学者。 [En] Disclaimer: this article is very simple and suitable for beginners…

人工智能 2023年5月23日
0068
pandas_数据处理分析基本

20210405 fancy_lee 1.pandas介绍 Python Data Analysis Library 或 pandas ，是基于NumPy 的一种工具，该工具是为了…

人工智能 2023年7月8日
0065
Python CT图像预处理——nii格式读取、重采样、窗宽窗位设置

文章目录 nii格式CT数据读取 * 读写nii格式文件查看重采样窗宽窗位设置 * 方法一：手动设置窗宽窗位方法二： nii格式CT数据读取遇到nii格式的CT数据，可以…

人工智能 2023年6月17日
0084
过滤算法如何处理大规模数据集

问题背景在处理大规模数据集时，过滤算法是非常重要的一部分。过滤算法可以帮助我们从庞大的数据集中筛选出我们所需的信息，提高数据处理的效率和准确性。本文将详细介绍一种处理大规模数据集…

人工智能 2024年1月4日
0029
泛化nerf系列：pixelNeRF 一种基于NeRF的多视角三维重建网络

1摘要文中提出了一种新的学习框架PixelNeRF，针对的是原本NeRF的不足。即现有的构建神经辐射场的方法往往需要大量的已知观察视角的图片作为输入并且需要花费大量的训练时间。P…

人工智能 2023年7月28日
0043
三维目标检测之ROS可视化

实验室有一个镭神C16的激光雷达，最近在我这，想拿来玩一玩。本意是做一个实时的检测，通过ROS获取激光雷达的激光点云，用pointpillars模型来进行实时的三维目标检测任务。但…

人工智能 2023年7月5日
0086
【Unity入门计划】基本概念(6)-精灵渲染器 Sprite Renderer

目录官方文档 1 Sprite 精灵 2 Sprite Renderer 精灵渲染器 2.1 Sprite 精灵 2.2 Color 着色 2.3 Filp 翻转 2.4 Dra…

人工智能 2023年7月29日
0096
为机器学习模型设置最佳阈值：0.5是二元分类的最佳阈值吗

对于二元分类，分类器输出一个实值分数，然后通过对该值进行阈值的区分产生二元的相应。例如，逻辑回归输出一个概率(一个介于0.0和1.0之间的值);得分等于或高于0.5的观察结果产生正…

人工智能 2023年7月29日
0050

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30