pointnet语义分割_训练并预测自己的数据

2023年5月23日下午3:54 • 人工智能 • 阅读 168

这几天想用深度学习做一下点云的分割试验，网上搜了一下相关标题的blog有很多，但大部分只是简单的介绍文章内容，说明具体操作流程的干货并不多。在缺乏相关资料和帮助的情况下，本人大致搞清楚了pointnet进行sem_seg的流程。可能步骤存在问题甚至是错的，因为也没有人交流，但从试验结果看来还行。欢迎大家批评指正。点云的标注用cloudcompare（下面简称cc）就可以，后面obj文件的可视化由于cc对其支持不太好，改用meshlab。
欢迎阅读我的其他文章：
windows下运行pointnet（全）
pointnet C++推理部署（一）
pointnet C++推理部署（二）

训练

首先准备自己的数据集。txt格式的点云文件就行，我随便找了个斯坦福兔子点云文件，里面是xyz三维点的坐标。把兔子用cc软件分割成头（head）和身子（body），并分别保存成两个txt文件。
因为我比较懒所以只标注了这一个兔子，将其随机平移和旋转变换得到100个兔子的头和身子的txt，将其分别保存在编号为i（i=0,1，2，…,99）的文件夹下分别命名为head_i.txt和body_i.txt（i=0,1，2，…,99）。
修改sem_seg\meta\class_name.txt内容为head和body。
修改sem_seg\meta\anno_path.txt内容为训练标注的路径。
修改indoor3d_util.py中的g_class2color如下

g_class2color = {'head':    [255,0,0],
                 'body':    [0,0,255]}

修改collect_point_label函数里面的内容，给点云数据增加rgb信息：

   for f in glob.glob(os.path.join(anno_path, '*.txt')):
       print(f)
       cls = os.path.basename(f).split('_')[0]

       if cls not in g_classes:
            cls = 'clutter'
       points = np.loadtxt(f)
       labels = np.ones((points.shape[0], 1)) * g_class2label[cls]
       color = np.zeros((points.shape[0], 3))
       color[:, 0:3] = 255
       points_list.append(np.concatenate([points, color, labels], 1))

然后可以运行collect_indoor3d_data.py生成npy文件。再通过运行gen_indoor3d_h5.py生成h5文件，注意要修改sem_seg\meta\all_data_label.txt内容为上面生成的npy文件的路径。
得到h5文件后就可以进行训练了。train.py文件有几个地方要修改：NUM_CLASSES、train_idxs、test_idxs；还需要修改model.py文件中网络最后一个卷积层的通道数为要分类的数目。另外，输入参数num_point、max_epoch、batch_size可以根据自己情况修改。我的数据量较少，几分钟就能训练完毕。

预测

运行batch_inference.py程序即可。同理，需要修改NUM_CLASSES，以及修改sem_seg\meta\data_label.txt中的待预测模型的路径。运行需要提供的参数可以参考我的上一篇文章：windows下运行pointnet（全）。
随便做了一些npy文件用于测试，制作过程和训练部分相似。用于预测的数据集包括随机平移旋转的模型，添加噪声的模型，裁剪的模型以及混合前三种的模型。红色为预测出的兔子头部，蓝色为预测出的兔子身体，黑色为未识别出的部分。因为我自始至终只是用了一个原始模型进行不同变换进行的测试，所以正确率都在99%以上。
随机平移和旋转的模型预测结果：

[En]

The model prediction results of random translation and rotation:

添加噪声的模型的预测结果：

[En]

The prediction result of the model adding noise:

整个工程文件打包：链接: https://pan.baidu.com/s/1yZG_OigNQqbeC852N6SMXw?pwd=zjn1 提取码: zjn1 复制这段内容后打开百度网盘手机App，操作更方便哦
–来自百度网盘超级会员v4的分享

本文参考的文章如下：
PointNet学习+训练自己的模型并实际使用测试成功

附预处理程序（Python实现和C++实现）：
随机位姿变换

import numpy as np
import random

old_file=r"rabbit.txt"
new_file=r"rabbit_change.txt"

x_offset=random.uniform(-10, 10)
y_offset=random.uniform(-10, 10)
z_offset=random.uniform(-10, 10)

scale=1.0

roate_x=random.uniform(-np.pi/10, np.pi/10)
roate_y=random.uniform(-np.pi/10, np.pi/10)
roate_z=random.uniform(-np.pi/10, np.pi/10)

roate_x_matrix=np.array([
                    [1,0,0,0],
                    [0,np.cos(roate_x),-np.sin(roate_x),0],
                    [0,np.sin(roate_x),np.cos(roate_x),0],
                    [0,0,0,1]
                    ])
roate_y_matrix=np.array([
                    [np.cos(roate_y),0,np.sin(roate_y),0],
                    [0,1,0,0],
                    [-np.sin(roate_y),0,np.cos(roate_y),0],
                    [0,0,0,1]
                    ])
roate_z_matrix=np.array([
                    [np.cos(roate_z),-np.sin(roate_z),0,0],
                    [np.sin(roate_z),np.cos(roate_z),0,0],
                    [0,0,1,0],
                    [0,0,0,1]
                    ])

transformation_matrix=np.array([
                            [scale,0,0,x_offset],
                            [0,scale,0,y_offset],
                            [0,0,scale,z_offset],
                            [0,0,0,1]
                            ]).dot(roate_z_matrix).dot(roate_y_matrix).dot(roate_x_matrix)

old_array=np.loadtxt(old_file)
old_xyz=old_array[:,:3]

ones_data=np.ones(old_xyz.shape[0])
old_xyz=np.insert(old_xyz,3,values=ones_data,axis=1)

new_xyz = np.dot(transformation_matrix,old_xyz.T)
new_array=np.concatenate((new_xyz.T[:,:3],old_array[:,3:]),axis=1)
np.savetxt(new_file,new_array,fmt='%.06f')

Eigen::Matrix4f random_transformation()
{

    float yaw = rand() * 2 /10.0 * M_PI / RAND_MAX - M_PI / 10.0;
    float pitching = rand() * M_PI / 10.0 / RAND_MAX - M_PI / 20.0;
    float droll = rand() * 2 * M_PI / 10.0 / RAND_MAX - M_PI / 10.0;

    Eigen::Vector3f ea0(yaw, pitching, droll);
    Eigen::Matrix3f R;
    R = Eigen::AngleAxisf(ea0[0], Eigen::Vector3f::UnitZ())*
        Eigen::AngleAxisf(ea0[1], Eigen::Vector3f::UnitY()) *
        Eigen::AngleAxisf(ea0[2], Eigen::Vector3f::UnitX());

    float x = rand() * 20.0 / RAND_MAX - 10.0;
    float y = rand() * 20.0 / RAND_MAX - 10.0;
    float z = rand() * 20.0 / RAND_MAX - 10.0;

    Eigen::Vector3f T(x, y, z);
    Eigen::Matrix4f H;
    H << R, T, 0, 0, 0, 1;
    return H;
}

添加高斯噪声

import numpy as np

old_file=r"rabbit.txt"
new_file=r"rabbit_change.txt"

def add_noise(point, sigma=0.1, clip=0.1):
    point = point.reshape(-1,3)
    Row, Col = point.shape
    noisy_point = np.clip(sigma * np.random.randn(Row, Col), -1*clip, clip)
    noisy_point += point
    return noisy_point

old_array=np.loadtxt(old_file)
old_xyz=old_array[:,:3]

new_xyz=add_noise(old_xyz)
new_array=np.concatenate((new_xyz,old_array[:,3:]),axis=1)
np.savetxt(new_file,new_array,fmt='%.06f')

#include
#include
#include
#include
#include

int main(int argc, char** argv)
{
    boost::mt19937 rng;
    rng.seed(static_cast<unsigned int>(time(0)));
    boost::normal_distribution<> nd(0, 0.01);
    boost::variate_generator<boost::mt19937&, boost::normal_distribution<>> var_nor(rng, nd);

    std::ifstream infile;
    std::fstream outfile;
    pcl::PointCloud<pcl::PointXYZ>::Ptr cloud(new pcl::PointCloud<pcl::PointXYZ>);
    pcl::PointCloud<pcl::PointXYZ>::Ptr cloudfiltered(new pcl::PointCloud<pcl::PointXYZ>());
    float x, y, z;

    infile.open("17/head_17.txt");
    outfile.open("19/head_19.txt", 'w');
    while (infile >> x >> y >> z)
    {
        x += static_cast<float> (var_nor());
        y += static_cast<float> (var_nor());
        z += static_cast<float> (var_nor());
        outfile << x << " " << y << " " << z << std::endl;
    }
    infile.close();
    outfile.close();

    infile.open("17/body_17.txt");
    outfile.open("19/body_19.txt", 'w');
    while (infile >> x >> y >> z)
    {
        x += static_cast<float> (var_nor());
        y += static_cast<float> (var_nor());
        z += static_cast<float> (var_nor());
        outfile << x << " " << y << " " << z << std::endl;
    }
    infile.close();
    outfile.close();

    return EXIT_SUCCESS;
}

常见报错更新

File “h5py_objects.pyx”, line 54, in h5py._objects.with_phil.wrapper
File “h5py_objects.pyx”, line 55, in h5py._objects.with_phil.wrapper
File “h5py\h5f.pyx”, line 106, in h5py.h5f.open
FileNotFoundError: [Errno 2] Unable to open file (unable to open file: name = ‘E:\ruanjianchengxuwenjian\py\pointnet-rabbit\sem_seg/data\ply_data_all_0.h5’, errno = 2, error message = ‘No such file or directory’, flags = 0, o_flags = 0)
报错原因：h5py包的版本过高
解决方法：降低h5py包的版本，例如pip install h5py==2.10
Exception has occurred: ValueError
need at least one array to concatenate
位于gen_indoor3d_h5.py的return np.concatenate(block_data_list, 0), np.concatenate(block_label_list, 0)
错误原因：网格分割比例太小，导致网格中的中点数为0。

[En]

Error reason: the grid division scale is too small, so that the number of midpoints in a grid is 0.
解决方法：将

    data, label = indoor3d_util.room2blocks_wrapper_normalized(data_label_filename, NUM_POINT, block_size=1, stride=0.5,                                                 random_sample=False, sample_num=None)

中的block_size和stride根据自己数据尺度进行调整，参数的含义见下图（从indoor3d_util.py中摘选）。

Original: https://blog.csdn.net/taifyang/article/details/115441212
Author: 给算法爸爸上香
Title: pointnet语义分割_训练并预测自己的数据

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/496198/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

TypeError: only size-1 arrays can be converted to Python scalars 报错如何解决

今天早上看到群里有个同学询问matplotlib画图作业，需求如下：作为一个python的初学者，我就想根据ta作业的要求试着画画，参考了书籍之后，用我仅余的一点matplotli…

人工智能 2023年7月5日
0085
李沐论文精读系列三：MoCo、对比学习综述（MoCov1/v2/v3、SimCLR v1/v2、DINO等）

文章目录 * – 一、MoCo – + 1.1 导言 + * 1.1.1 前言 * 1.1.2 摘要 + 1.1.3 导言 + 1.2 相关工作 + * 1…

人工智能 2023年6月28日
0083
yolov7.yaml文件详解

1、parameters （1）nc代表目标检测所检测的种类（2）depth_multiple：控制通道的深度的系数，表示channel的缩放系数，就是将配置里面的backbon…

人工智能 2023年7月28日
0058
机器学习之支持向量机（SVM）对乳腺癌数据二分类python实现

文章目录 * – 1. 概述 – 2. 标题数学推导 – + * 2.1 函数间隔 * 2.2 几何间隔 * 2.3 支持向量机 –…

人工智能 2023年6月15日
0098
【渝粤教育】国家开放大学2018年春季 0008-22T简明现代汉语参考试题

试卷编号：0008 座位号 2017—2018学年度第二学期期末考试简明现代汉语试题（开卷）2018年7月 1.普通话里阴平的调值是。2．词义除了有理性义，还可以有义。3．语…

人工智能 2023年5月25日
0064
批量规范化(批量归一化)——BN

训练深层神经网络是十分困难的，特别是在较短的时间内使他们收敛更加棘手。在本节中，我们将介绍批量规范化（batch normalization），这是一种流行且有效的技术，可持续加…

人工智能 2023年7月13日
0053
Go简单实现协程池

首先就是进程、线程、协程讲解老三样。进程:本质上是一个独立执行的程序，进程是操作系统进行资源分配和调度的基本概念，操作系统进行资源分配和调度的一个独立单位。线程:是操作系统能够…

人工智能 2023年5月31日
0074
数据结构学习笔记——归并排序

目录一、排序思想二、算法分析三、总结一、排序思想归并排序是将两个或两个以上的有序表组合成一个新的有序表，它采用的是分治法，例如将两个有序表合并成一个有序表，即二路归并排序…

人工智能 2023年6月30日
0089
Multi-View Learning（多视图学习/多视角学习）是什么？ Co-training（协同训练）和它的关系

一句话解释什么是Multi-View Learning：从多个视角进行学习，可以让模型从多方面更好的理解事物，从而提升模型的性能多个视角的来源： (1) 多个源（multipl…

人工智能 2023年6月15日
0066
写完Numpy100道基础练习题后的错误总结和语法总结

前言：由于是看视频学习的缘故，在写这100道题目道中有很多视频中没有出现的语法，然而很多语法直接拿来用都是比较简单的，少了很多的循环语句。至此写下这篇错误总结和语法总结，希望可以给…

人工智能 2023年7月4日
0073
也说说ADC以及ADC的主要技术参数及分类介绍

我们经常在芯片选型时，提到MCU是否内嵌ADC，是几位ADC等名词。这个ADC是什么呢？它代表什么意思？这里我们就带大家一起来了解一下，ADC的概念以及如何选择ADC芯片。所谓的…

人工智能 2023年7月29日
0055
RepVGG论文笔记

文章目录 * – RepVGG个人笔记 – + 前言 + RepVGG模型 + * 2.1主要架构 * 2.2RepVGG Block构造 * 2.3为什么…

人工智能 2023年7月1日
0054
评论情感分析—-多种机器学习模型测试总结

文章目录 * – 前言 – + Step1: 读取评论文件 + Step2: 去除重复评论信息 + Step3: 使用jieba库进行分词操作 + Step…

人工智能 2023年7月28日
0094
conda虚拟环境内pip install报错 TypeError: join() argument must be str or bytes, not ‘int‘

报错Exception:Traceback (most recent call last):File “/home/anaconda3/envs/facenet/lib…

人工智能 2023年5月24日
00137
对抗生成网络（GAN）详解

目录前言目标函数原理训练给定生成器，训练判别器给定判别器，训练生成器总结前言之前的生成模型侧重于将分布函数构造出来，然后使用最大似然函数去更新这个分布函数的参数，…

人工智能 2023年5月26日
0049
Apriori算法

文章目录前言先验原理 Apriori算法的频繁项集产生候选的产生与剪枝 * 蛮力方法 F k − 1 F_{k-1}F k −1 X F 1 F_{1}F 1 方法 F…

人工智能 2023年6月19日
00137

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

pointnet语义分割_训练并预测自己的数据

训练

预测

常见报错更新

大家都在看