探索发现：记一次深度图像处理的经历

2023年7月20日上午8:45 • 人工智能 • 阅读 60

一、前言

2021年底，领导给了个 tof模块，要求基于此开发一个演示程序，实现 3D人脸识别的功能。当时听他说出 3D人脸识别就有点头疼，第一是想自己之前没接触这样的项目；第二是在想 3D人脸数据相比于 2D人脸数据，恐怕没后者那么多。基于快速开发出产品以及自身能力的想法，向领导建议使用 2D+技术路线，即采用 rgb图做人脸识别，采用深度图做真假脸识别，领导同意了。

rgb图用到的就是些网上开源、成熟的模型，如 retinaface、 mobileface，这部分不是今天的主题，也没什么好说的，网上博客大把。主要说说深度图吧，简单把过程记录一下，方便自己且抛砖引玉，如果有错漏之处，还请指出，谢谢！

二、过程

（一）图片预处理过程

先给大伙看看 tof保存的深度图， 16 bit png格式，每个像素值的实际物理意义是距离，单位是 mm。

我没有上传错，原图就是这样，看起来乌漆嘛黑的。因为它是 16 bit，像素值范围是 [0, 65536)，下面给它映射到 [0, 256)，再给它像素反转一下。

import cv2
import numpy as np

def u16_to_u8(depth_image):
    min_val, max_val, min_loc, max_loc = cv2.minMaxLoc(depth_image)

    alpha = 255 / (max_val - min_val)

    beta = -min_val

    result = ((depth_image + beta) * alpha).astype(np.uint8)

    return result

depth_image = cv2.imread(r"test.png", cv2.IMREAD_ANYDEPTH)
depth_image = u16_to_u8(depth_image)
depth_image = 255 - depth_image
cv2.imshow('depth_image', depth_image)
key = cv2.waitKey(0)

显示结果如下

可以看见也没什么卵区别，都是一片糊。如果要根据深度图来做分类，区分真假脸，这样的数据恐怕不好做，所以需要再做进一步处理，比如直方图均衡。先试试 opencv自带的直方图均衡函数。

depth_image = cv2.imread(r"test.png", cv2.IMREAD_ANYDEPTH)
depth_image = u16_to_u8(depth_image)
cv_he = cv2.equalizeHist(depth_image)
cv2.imwrite(r"t1.png", cv_he)

看起来效果好了点，但还是有点不够。下面试试 openni的直方图均衡函数。

def get_his_img(img, his_size = 65536):
    if len(img.shape) == 2:
        img = img[np.newaxis, :]
    _, h, w = img.shape
    hist = cv2.calcHist(img, [0], None, [his_size - 1], [1, his_size])

    num = np.sum(hist)

    hist = np.cumsum(hist.squeeze())

    for s in range(0, his_size - 1):
        hist[s, ] = int((1.0 - (hist[s, ] / num)) * his_size)

    for ii in range(h):
        for jj in range(w):
            if img[:, ii, jj] > 0:
                img[:, ii, jj] = hist[img[:, ii, jj], ]

    if len(img.shape) == 3:
        img = img.squeeze()
    return img

depth_image = cv2.imread(r"test.png", cv2.IMREAD_ANYDEPTH)
my_he = get_his_img(depth_image, his_size = 65536)
my_he = u16_to_u8(my_he)
cv2.imwrite(r"t1.png", my_he)

这样才算好，脸部轮廓明显，估计用个逻辑回归都可以很好拟合。仔细看代码，可以看见 openni对原先像素值为 0的像素是不做处理，它的处理对象是像素值为 [1, 256)的像素。当然你们做个筛选，把近距离与远距离的像素值都置为 0，再用 opencv api来做，估计效果也不错。

（二）真假脸分类算法开发

先给大家看看真假脸的图片，看完会有更深的认识。出于减少运算量与降噪需要，我们取出 face roi。下面分别是真人脸、图片脸、电子屏幕脸，根据需要缩放到 112x112大小（使用 letterbox方式）。

一开始想无脑直接上机器学习，但是公司服务器没有，办公的 PC太辣鸡（呵呵），不想用，所以想着用传统机器视觉来做。

1. 普通直方图比较
准备一张真人脸（随机抽取的一张正面人脸）与测试人脸（无论真假脸，预处理一致）做比较，看代码吧，一目了然。

def compare_img(true_face, fake_face):
    true_face = cv2.resize(true_face, (112, 112)).astype(np.float32)
    fake_face = cv2.resize(fake_face, (112, 112)).astype(np.float32)

    true_hist = cv2.calcHist([true_face], [0], None, [256], [0, 256])
    fake_hist = cv2.calcHist([fake_face], [0], None, [256], [0, 256])

    match1 = cv2.compareHist(true_hist, fake_hist, cv2.HISTCMP_BHATTACHARYYA)
    match1 = 1 - match1
    if (match1 < 0.75):
        print(0)

    match2 = cv2.compareHist(true_hist, fake_hist, cv2.HISTCMP_CORREL)
    if (match2 < 0.965):
        print(1)

    match3 = cv2.compareHist(true_hist, fake_hist, cv2.HISTCMP_CHISQR)
    if (match3 > 8000):
        print(2)

    print("巴氏距离：%f, 相关性：%f, 卡方：%f\n" %(match1, match2, match3))

img_dir = r"C:\Users\Horizon-Robotics\Pictures"
fake_face_path = os.path.join(img_dir, "test.png")
true_face_path = os.path.join(img_dir, "H5.png")
print(os.path.basename(true_face_path), " vs ", os.path.basename(fake_face_path))

true_face = cv2.imread(true_face_path, cv2.IMREAD_ANYDEPTH)
fake_face = cv2.imread(fake_face_path, cv2.IMREAD_ANYDEPTH)

compare_img(true_face, fake_face)

该方法性能不够，后来采集了个小数据集（真假人脸各 130张图片），利用该算法一测试， 结果惨不忍睹。想了一下，失败的原因如下（自己瞎想的，如有大神有心得，还望不吝赐教）。
（1）人脸是随机抽取的，不具有代表性；
（2）该算法得到的直方图，只是对图片做了个总体地、粗略的估计。而在全局上，真假人脸可能具有相似的直方图分布。所以我们应该关注局部的特征？

2. LBP-直方图比较
出于更多关注局部特征，引入了LBP算法，正如它的介绍所说： “用于纹理特征提取，提取的特征是图像的局部的纹理特征。LBP就是一种局部信息，它反应的内容是每个像素与周围像素的关系。”

做了 lbp的图片直方图如上，可以看见二者区别还是有的，而且很明显。后来跑了下上面的小数据集， 结果准确率是100%，与上面方法相比，该方法是可行的。此处还有个考量：是否统计一下数据集里所有真人脸的 lbp直方图，然后得到一张平均的人脸，之后拿这张平均人脸去做计算，防止其过拟合。代码如下：

def my_LBP(img):
    dst = np.zeros(img.shape, dtype=img.dtype)
    h, w = img.shape

"""
    对于每个cell中的一个像素，将相邻的8个像素的灰度值与其进行比较，
    若周围像素值大于中心像素值，则该想点的位置被标记为1，否则标记为0.

"""
    for i in range(1, h - 1):
        for j in range(1, w - 1):
            center = img[i][j]
            code = 0

            code |= (img[i - 1][j - 1] >= center) << (np.uint8)(7)
            code |= (img[i - 1][j] >= center) << (np.uint8)(6)
            code |= (img[i - 1][j + 1] >= center) << (np.uint8)(5)
            code |= (img[i][j + 1] >= center) << (np.uint8)(4)
            code |= (img[i + 1][j + 1] >= center) << (np.uint8)(3)
            code |= (img[i + 1][j] >= center) << (np.uint8)(2)
            code |= (img[i + 1][j - 1] >= center) << (np.uint8)(1)
            code |= (img[i][j - 1] >= center) << (np.uint8)(0)

            dst[i - 1][j - 1] = code

    return dst
fake_img = cv2.imread(r'D:\AOBI\0\0_26.png', cv2.IMREAD_GRAYSCALE)
true_img = cv2.imread(r'D:\AOBI\1\1_0.png', cv2.IMREAD_GRAYSCALE)
fake_img = my_LBP(fake_img)
true_img = my_LBP(true_img)

plt.subplot(2,1,1)
plt.hist(fake_img.ravel(), 256, [0,256], facecolor='g', label = "fake")
plt.subplot(2,1,2)
plt.hist(true_img.ravel(), 256, [0,256], facecolor='r', label = "true")
plt.show()

3. 逻辑回归
在方法 1遇挫后，还是真香定律地试了下逻辑回归。大致流程就是将 face roi做直方图均衡预处理，再缩放至 32x32，之后 reshape成向量，喂入逻辑回归模型。最后的测试结果 98.4%准确率。但是它有个问题就是，类间距离不够大，即预测的结果有一些在阈值0.5附近。还有就是那些错分样本的输出概率值都蛮离谱的。放张错分的假人脸图片，给大伙看下。

可以看见还是比较像人脸的，难怪会分类错误。对于这样的问题，想了下，可能是模型的拟合能力不够，对于一些类人脸的假脸图片就有点力不从心。

4. LBP-逻辑回归
对于方法 3的问题，无脑的上 CNN是我不想的，所以我选择提升输入图片的质量。刚好上面用了LBP，就显示看了下。

可以看出，对于真人脸，LBP处理后人脸轮廓还是有的。但对于假人脸，即使其本来像真人脸，但是已经不那么明显了。于是将其输入逻辑回归模型训练， 最后测试结果的准确率是100%。

三、后语

近几年的感受就是，深度学习里要好好结合传统视觉，能取得让人惊喜的效果。以及多总结，多记录，多分享。

Original: https://blog.csdn.net/tangshopping/article/details/123369825
Author: tang-shopping
Title: 探索发现：记一次深度图像处理的经历

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/704585/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

java-php-python-ssm校园失物招领系统计算机毕业设计

本源码技术栈：项目架构：B/S架构开发语言：Java语言开发软件：idea eclipse 前端技术：Layui、HTML、CSS、JS、JQuery等技术后端技术：JAV…

人工智能 2023年6月26日
0055
中文版-动手学深度学习

几乎所有的深度学习教材资源都是英文版的，这对于很多国内学习深度学习的朋友来说是一个艰难的挑战。今天就推荐一本中文版的深度学习教材《动手学深度学习》，该教材由，亚马逊应用科学家，美…

人工智能 2023年5月30日
0079
SiamFC代码分析(architecture、training、test)

文章目录 1、architecture * 1.1 特征提取网络 1.2 互相关层 2、training * 2.1 图像预处理 2.2 加载训练数据、标签及损失函数 2.3 优化…

人工智能 2023年5月26日
0066
2022-2028全球与中国工业风机市场现状及未来发展趋势

【报告篇幅】：120【报告图表数】：160【报告出版时间】：2021年12月报告摘要根据简乐尚博的统计及预测，2021年全球工业风机市场销售额达到了75亿美元，预计2028年将…

人工智能 2023年6月11日
0061
蓝桥杯Java题目求解-分治法-自然数1到N有多少个数的数位中包含2

蓝桥杯，分治法【问题描述】小蓝特别喜欢 2，今年是公元 2020 年，他特别高兴。他很好奇，在公元 1 年到公元 2020 年（包含）中，有多少个年份的数位中包含数字 2？虽说…

人工智能 2023年6月4日
0092
Python小白的数学建模课-11.偏微分方程数值解法

偏微分方程可以描述各种自然和工程现象，是构建科学、工程学和其他领域的数学模型主要手段。偏微分方程主要有三类：椭圆方程，抛物方程和双曲方程。本文采用有限差分法求解偏微分方程，通…

人工智能 2023年7月5日
0048
lightgbm回归模型使用方法（lgbm.LGBMRegressor）

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年7月28日
0035
相机标定，内参数与外参数

相机标定简介所谓的相机标定就是将外界世界的坐标信息转化为计算机（自带相机/摄像头）可以理解的”距离”，将世界坐标系转换到相机坐标系。我们可以理解为从一个…

人工智能 2023年6月17日
0077
股票高频数据（分钟数据）的入门分析方法——已实现波动率的计算（含完整代码）

本文摘要本文叙述了对股票市场高频数据分析一个简单方法，即已实现波动率的计算和后续的相关研究。采用上证综指2019年至2021年3年间实时交易价格的每分钟数据，在已实现方差法下计算…

人工智能 2023年7月15日
00173
【Pytorch(二)】Numpy 搭建全连接神经网络

文章目录实验一全连接神经网络FCNN 实验说明背景知识实验步骤 * 0. 概览 1. Import Numpy 2. 导入其他 Python 库（Import Other…

人工智能 2023年7月13日
0061
《统计学》第八版贾俊平第九章分类数据分析知识点总结及课后习题答案

目录一、知识框架二、课后习题一、知识框架二、课后习题 1市场研究人员欲研究不同收入群体对某种特定商品是否有相同的购买习惯，他们调查了四个不同收入组的消费者共527人，购买习…

人工智能 2023年7月15日
0087
Python Pandas常用的描述性统计信息的函数

1.count() # 非空观测数量 2.sum() # 所有值之和 3.mean() # 所有值的平均值 4.median() # 所有值的中位数 5.mode() # 值的模值…

人工智能 2023年7月7日
0071
Pandas库

Pandas是python第三方库，提供高性能易用数据类型和分析工具。Pandas基于NumPy实现，常与NumPy和Matplotlib一同使用。pandas库引用： impor…

人工智能 2023年7月4日
0066
PyTorch安装及环境配置（Win10）亲测可用（有问题留言，实时更新）

文章目录 Win10系统下，PyTorch安装及环境配置亲测可用（有问题留言，实时更新） * 一、安装及配置Anaconda – 1.安装Anaconda 2.配置设…

人工智能 2023年7月22日
0082
‘__module__‘ : ‘tensorflow.core.framework.tensor_shape_pb2‘ TypeError: expected bytes, Descriptor f

错误解决： ‘ module /‘ : ‘tensorflow.core.framework.tensor_shape_pb2’ T…

人工智能 2023年5月25日
0056
实体识别入门代码实战

～～最近从CV转到了NLP，记录下NLP相关学习知识。命名实体识别（Named Entity Recognition，NER）是NLP中一项非常基础的任务，NER是信息提取、问答…

人工智能 2023年5月28日
0067

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

探索发现：记一次深度图像处理的经历

（一）图片预处理过程

（二）真假脸分类算法开发

大家都在看