Python:计算机视觉实现视频的AI换脸（最基础）

2023年5月28日下午4:10 • 人工智能 • 阅读 66

一、实验要求

1、手动点击关键点进行替换

2、利用光流对相邻的视频帧进行关键点的追踪

二、实验结果

三、实验代码

1、手动进行图像关键点的点击

import cv2
import numpy as np

&#x5BFC;&#x5165;&#x56FE;&#x7247;
img1 = cv2.imread('path1')
img2 = cv2.imread('path2')

a =[]
b = []

def on_EVENT_LBUTTONDOWN1(event, x, y, flags, param):
    # &#x70B9;&#x51FB;&#x9F20;&#x6807;&#x5DE6;&#x952E;
    if event == cv2.EVENT_LBUTTONDOWN:
        xy = "%d,%d" % (x, y)
        a.append(x)
        b.append(y)

        cv2.circle(img1, (x, y), 1, (255, 0, 0), thickness=-1)
        cv2.putText(img1, xy, (x, y), cv2.FONT_HERSHEY_PLAIN,
                    1.0, (0, 0, 0), thickness=1)
        cv2.imshow("image1", img1)

def on_EVENT_LBUTTONDOWN2(event, x, y, flags, param):
    # &#x70B9;&#x51FB;&#x9F20;&#x6807;&#x5DE6;&#x952E;
    if event == cv2.EVENT_LBUTTONDOWN:
        xy = "%d,%d" % (x, y)
        a.append(x)
        b.append(y)

        cv2.circle(img2, (x, y), 1, (255, 0, 0), thickness=-1)
        cv2.putText(img2, xy, (x, y), cv2.FONT_HERSHEY_PLAIN,
                    1.0, (0, 0, 0), thickness=1)
        cv2.imshow("image2", img2)

cv2.namedWindow("image1")
cv2.namedWindow("image2")
cv2.setMouseCallback("image1", on_EVENT_LBUTTONDOWN1)
cv2.setMouseCallback("image2", on_EVENT_LBUTTONDOWN2)
cv2.imshow("image1", img1)
cv2.imshow("image2", img2)
cv2.waitKey(0)

cv2.destroyAllWindows()

#for i in range(8):
   print([a[i],b[i]])

调用cv2库和numpy库，利用cv2.setMouseCallback函数得到鼠标的点击信息，并在on_EVENT_LBUTTONDOWN函数中对点击的点进行标记，将点击点的坐标存储在数组a,b里面。

2、利用光流对相邻的视频帧进行关键点的追踪

（1）首先需要提取视频的第一帧，手动进行关键点的标注，调用cap.read函数，此时frame为视频第一帧的二进制流数据

import cv2
cap = cv2.VideoCapture('2.mp4')
ret, frame = cap.read()      #frame&#x662F;&#x6BCF;&#x4E00;&#x5E27;&#x7684;&#x56FE;&#x50CF;
scaling_factor = 0.5
frame = cv2.resize(frame, None, fx=scaling_factor,
                   fy=scaling_factor, interpolation=cv2.INTER_AREA)

（2）手动点击关键点

a =[]
b = []

def on_EVENT_LBUTTONDOWN1(event, x, y, flags, param):
    # &#x70B9;&#x51FB;&#x9F20;&#x6807;&#x5DE6;&#x952E;
    if event == cv2.EVENT_LBUTTONDOWN:
        xy = "%d,%d" % (x, y)
        a.append(x)
        b.append(y)
        cv2.circle(frame, (x, y), 1, (255, 0, 0), thickness=-1)
        cv2.putText(frame, xy, (x, y), cv2.FONT_HERSHEY_PLAIN,
                    1.0, (0, 0, 0), thickness=1)
        cv2.imshow("image1", frame)

def on_EVENT_LBUTTONDOWN2(event, x, y, flags, param):
    # &#x70B9;&#x51FB;&#x9F20;&#x6807;&#x5DE6;&#x952E;
    if event == cv2.EVENT_LBUTTONDOWN:
        xy = "%d,%d" % (x, y)
        a.append(x)
        b.append(y)

        cv2.circle(img1, (x, y), 1, (255, 0, 0), thickness=-1)
        cv2.putText(img1, xy, (x, y), cv2.FONT_HERSHEY_PLAIN,
                    1.0, (0, 0, 0), thickness=1)
        cv2.imshow("image2", img1)

cv2.namedWindow("image1")
cv2.setMouseCallback("image1", on_EVENT_LBUTTONDOWN1)
cv2.imshow("image1", frame)

cv2.namedWindow("image2")
cv2.setMouseCallback("image2", on_EVENT_LBUTTONDOWN2)
cv2.imshow("image2", img1)
cv2.waitKey(0)

p0=np.float32([[[a[0],b[0]]],[[a[1],b[1]]],[[a[2],b[2]]],[[a[3],b[3]]]])
print(p0)
cv2.destroyAllWindows()

（3）对视频光流进行追踪，p0为当前关键点，p1为视频流中关键点的下一个位置信息

调用cv2.calcOpticalFlowPyrLK()函数进行我们想要的追踪操作

（ps.关注cv2.calcOpticalFlowPyrLK()函数中p0的格式）

import cv2
import numpy as np

feature_params = dict(maxCorners=100, qualityLevel=0.3,
                      minDistance=7, blockSize=7)
lk_params = dict(winSize=(15,15), maxLevel=2,
                 criteria=(cv2.TERM_CRITERIA_EPS | cv2.TERM_CRITERIA_COUNT, 10, 0.03))

cap = cv2.VideoCapture('path')
ret, frame = cap.read()      #frame&#x662F;&#x6BCF;&#x4E00;&#x5E27;&#x7684;&#x56FE;&#x50CF;

scaling_factor = 0.5
frame = cv2.resize(frame, None, fx=scaling_factor,
                   fy=scaling_factor, interpolation=cv2.INTER_AREA)
gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
p0 = np.float32([[[174,170]],[[180,190]],[[200,200]],[[210,210]]])
p0 = cv2.goodFeaturesToTrack(gray, mask=None, **feature_params)    #&#x89D2;&#x70B9;&#x68C0;&#x6D4B;
print(p0)
mask = np.zeros_like(frame)

while True:
    ret, frame = cap.read()
    frame = cv2.resize(frame, None, fx=scaling_factor,
                       fy=scaling_factor, interpolation=cv2.INTER_AREA)
    frame_gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)

    p1, st, err = cv2.calcOpticalFlowPyrLK(gray, frame_gray, p0, None, **lk_params)
    print(p1[0][0])
    print(p0)
    good_new = p1[st == 1]
    good_old = p0[st == 1]

    for i,(new,old) in enumerate(zip(good_new,good_old)):
        a,b = new.ravel()
        a=int(a)
        b=int(b)
        c,d = old.ravel()
        c=int(c)
        d=int(d)
        cv2.line(mask, (a, b),(c, d),(0, 150, 0), 1)
        cv2.circle(frame, (a, b), 3, (0, 255, 0), -1)

    gray = frame_gray.copy()
    p0 = good_new.reshape(-1, 1, 2)

    img = cv2.add(frame, mask)
    cv2.imshow("Output", img)

    k = cv2.waitKey(30)
    if k == 27:
        break

cap.release()
cv2.destroyAllWindows()

3、人脸的替换（以为图片的替换为例）

（1）鼠标定点（不再赘述）

（2）矩阵变换

调用cv2.getPerspectiveTransform(), cv2.warpPerspective()函数进行两张图片上的关键点的对比（注：此函数规定对应点为4个点）

（3）内容替换

直接用变换好的图像相应矩阵位置处的值替换原图像位置的值

import numpy as np
import cv2
%matplotlib inline

img1 = cv2.imread('path1')
img2 = cv2.imread('path2')

a =[]
b = []

&#x4E00;&#x3001;&#x9F20;&#x6807;&#x5B9A;&#x70B9;

def on_EVENT_LBUTTONDOWN1(event, x, y, flags, param):
    # &#x70B9;&#x51FB;&#x9F20;&#x6807;&#x5DE6;&#x952E;
    if event == cv2.EVENT_LBUTTONDOWN:
        xy = "%d,%d" % (x, y)
        a.append(x)
        b.append(y)

        cv2.circle(img1, (x, y), 1, (255, 0, 0), thickness=-1)
        cv2.putText(img1, xy, (x, y), cv2.FONT_HERSHEY_PLAIN,
                    1.0, (0, 0, 0), thickness=1)
        cv2.imshow("image1", img1)

def on_EVENT_LBUTTONDOWN2(event, x, y, flags, param):
    # &#x70B9;&#x51FB;&#x9F20;&#x6807;&#x5DE6;&#x952E;
    if event == cv2.EVENT_LBUTTONDOWN:
        xy = "%d,%d" % (x, y)
        a.append(x)
        b.append(y)

        cv2.circle(img2, (x, y), 1, (255, 0, 0), thickness=-1)
        cv2.putText(img2, xy, (x, y), cv2.FONT_HERSHEY_PLAIN,
                    1.0, (0, 0, 0), thickness=1)
        cv2.imshow("image2", img2)

cv2.namedWindow("image1")
cv2.namedWindow("image2")
cv2.setMouseCallback("image1", on_EVENT_LBUTTONDOWN1)
cv2.setMouseCallback("image2", on_EVENT_LBUTTONDOWN2)
cv2.imshow("image1", img1)
cv2.imshow("image2", img2)
cv2.waitKey(0)

print(a[3],b[3])
print(a[6],b[6])

cv2.destroyAllWindows()

&#x4E8C;&#x3001;&#x77E9;&#x9635;&#x53D8;&#x6362;

points1 = np.float32([[[a[4],b[4]]],[[a[5],b[5]]],[[a[6],b[6]]],[[a[7],b[7]]]])
points2 = np.float32([[[a[0],b[0]]],[[a[1],b[1]]],[[a[2],b[2]]],[[a[3],b[3]]]])

M  =  cv2.getPerspectiveTransform(points1, points2)

Affine_img = cv2.warpPerspective(img2, M, (img1.shape[1], img1.shape[0]))

&#x4E09;&#x3001;&#x5185;&#x5BB9;&#x66FF;&#x6362;

m=a[2]-a[0]
n=b[2]-b[0]
for j in range(m):
    for i in range(m):
        img1[74+i][125+j] = Affine_img[74+i][125+j]

cv2.namedWindow("image3")
cv2.imshow("image3",Affine_img)     # &#x663E;&#x793A;&#x56FE;&#x7247;
cv2.imshow("image2",np.array(img_cov, dtype = np.uint8 ))
cv2.waitKey(0)

cv2.destroyAllWindows()

四、完整代码

import numpy as np
import cv2
%matplotlib inline

#&#x89C6;&#x9891;&#x7B2C;&#x4E00;&#x5E27;&#x548C;&#x56FE;&#x50CF;&#x7B2C;&#x4E00;&#x5E27;&#x9501;&#x5B9A;

cap = cv2.VideoCapture('2.mp4')
ret, frame = cap.read()      #frame&#x662F;&#x6BCF;&#x4E00;&#x5E27;&#x7684;&#x56FE;&#x50CF;
scaling_factor = 0.5
frame = cv2.resize(frame, None, fx=scaling_factor,
                   fy=scaling_factor, interpolation=cv2.INTER_AREA)
img1 = cv2.imread('face.jpg')

a =[]
b = []

def on_EVENT_LBUTTONDOWN1(event, x, y, flags, param):
    # &#x70B9;&#x51FB;&#x9F20;&#x6807;&#x5DE6;&#x952E;
    if event == cv2.EVENT_LBUTTONDOWN:
        xy = "%d,%d" % (x, y)
        a.append(x)
        b.append(y)
        cv2.circle(frame, (x, y), 1, (255, 0, 0), thickness=-1)
        cv2.putText(frame, xy, (x, y), cv2.FONT_HERSHEY_PLAIN,
                    1.0, (0, 0, 0), thickness=1)
        cv2.imshow("image1", frame)

def on_EVENT_LBUTTONDOWN2(event, x, y, flags, param):
    # &#x70B9;&#x51FB;&#x9F20;&#x6807;&#x5DE6;&#x952E;
    if event == cv2.EVENT_LBUTTONDOWN:
        xy = "%d,%d" % (x, y)
        a.append(x)
        b.append(y)

        cv2.circle(img1, (x, y), 1, (255, 0, 0), thickness=-1)
        cv2.putText(img1, xy, (x, y), cv2.FONT_HERSHEY_PLAIN,
                    1.0, (0, 0, 0), thickness=1)
        cv2.imshow("image2", img1)

cv2.namedWindow("image1")
cv2.setMouseCallback("image1", on_EVENT_LBUTTONDOWN1)
cv2.imshow("image1", frame)

cv2.namedWindow("image2")
cv2.setMouseCallback("image2", on_EVENT_LBUTTONDOWN2)
cv2.imshow("image2", img1)
cv2.waitKey(0)

p0=np.float32([[[a[0],b[0]]],[[a[1],b[1]]],[[a[2],b[2]]],[[a[3],b[3]]]])
print(p0)
cv2.destroyAllWindows()

#&#x5149;&#x6D41;&#x8FFD;&#x8E2A;&#x5173;&#x952E;&#x70B9;

lk_params = dict(winSize=(15,15), maxLevel=2,
                 criteria=(cv2.TERM_CRITERIA_EPS | cv2.TERM_CRITERIA_COUNT, 10, 0.03))
mask = np.zeros_like(frame)

gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)

while True:
    ret, frame = cap.read()
    frame = cv2.resize(frame, None, fx=scaling_factor,
                       fy=scaling_factor, interpolation=cv2.INTER_AREA)
    frame_gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)

    p1, st, err = cv2.calcOpticalFlowPyrLK(gray, frame_gray, p0, None, **lk_params)

    good_new = p1[st == 1]
    good_old = p0[st == 1]

    for i,(new,old) in enumerate(zip(good_new,good_old)):
        e,f = new.ravel()
        e=int(e)
        f=int(f)
        g,h = old.ravel()
        g=int(g)
        h=int(h)
        cv2.line(mask, (e, f),(g, h),(0, 150, 0), 1)
        cv2.circle(frame, (e, f), 3, (0, 255, 0), -1)

    # &#x4E8C;&#x3001;&#x77E9;&#x9635;&#x53D8;&#x6362;

    points1 = np.float32([[[a[4],b[4]]],[[a[5],b[5]]],[[a[6],b[6]]],[[a[7],b[7]]]])
    points2 = np.float32(p1)

    M  =  cv2.getPerspectiveTransform(points1, points2)

    Affine_img = cv2.warpPerspective(img1, M, (frame.shape[1], frame.shape[0]))

    # &#x4E09;&#x3001;&#x5185;&#x5BB9;&#x66FF;&#x6362;

    m = p1[2][0][0]-p1[0][0][0]   #m=a[2]-a[0]
    m=int(m)
    n = p1[2][0][1]-p1[0][0][1]   #n=b[2]-b[0]
    n=int(n)
    a1 = int(p1[0][0][1])
    a2 = int(p1[0][0][0])
    a3 = int(p1[0][0][1])
    a4 = int(p1[0][0][0])
    for i in range(n):
        for j in range(m):
            frame[a1+i][a2+j] = Affine_img[a3+i][a4+j]

    cv2.namedWindow("image3")
    cv2.imshow("image3",Affine_img)     # &#x663E;&#x793A;&#x56FE;&#x7247;
    # cv2.imshow("image2",np.array(img_cov, dtype = np.uint8 ))
    cv2.waitKey(0)

    cv2.destroyAllWindows()

    gray = frame_gray.copy()
    p0 = good_new.reshape(-1, 1, 2)

    img = cv2.add(frame, mask)
    cv2.imshow("Output", img)

    k = cv2.waitKey(30)
    if k == 27:
        break

cap.release()
cv2.destroyAllWindows()

完结撒花！

Original: https://blog.csdn.net/Josepyth/article/details/125288514
Author: Josepyth
Title: Python:计算机视觉实现视频的AI换脸（最基础）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/532461/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

智源社区AI周刊No.107：英伟达推出Magic3D；Stable Diffusion2.0发布

汇聚每周AI热点，不错过重要资讯！欢迎扫码，关注并订阅智源社区AI周刊。英伟达推出Magic3D，性能超过谷歌DreamFusion 近一段时间，让AI生成3D点云成为业界研究…

人工智能 2023年7月30日
0032
python实现spearman相关性检验

python实现spearman相关性检验 Spearman秩相关系数对原始变量的分布不做要求，适用范围较Pearson相关系数广，即使是等级资料，也可适用。但其属于非参数方法，…

人工智能 2023年7月17日
0049
NLP基础任务—序列标注任务

资源下载地址：https://download.csdn.net/download/sheziqiong/86178744资源下载地址：https://download.csdn….

人工智能 2023年5月31日
0063
WARNING: Retrying (Retry(total=4, connect=None, read=None, redirect=None, status=None)) after connec

WARNING: Retrying (Retry(total=4, connect=None, read=None, redirect=None, status=None)) af…

人工智能 2023年7月22日
00186
解决pycharm安装opencv没有函数提醒的问题

问题描述因为项目中涉及到图像处理的相关功能，所以本打算安装opencv来学习一下，但安装了之后，虽然opencv的功能可以正常使用，但是却没有函数引导，换句话说，就是用cv2. …

人工智能 2023年6月19日
0075
YOLO V5 测试图像时 img_size 的设置问题

最近项目用到了 yolo v5。初始图像是 1440×1080 大小的，在训练时显示 “cuda out of memory”，故保持原始长宽比，将图像缩小…

人工智能 2023年7月22日
0078
使用Python和OpenCV中的calcOpticalFlowFarneback函数提取稠密光流并进行映射（warp）

介绍 OpenCV中自带两个提取光流的函数：cv2.calcOpticalFlowPyrLK()cv2.calcOpticalFlowFarneback()其中calcOptica…

人工智能 2023年7月18日
0034
无线安全操作（1）

目录无线安全 AP威胁检测 AP威胁检测介绍 AP威胁检测配置 AP威胁检测举例 AP威胁检测排错帮助 Client威胁检测 Client威胁检测介绍 Client威胁检测配置 …

人工智能 2023年6月2日
0077
深度学习之bottleneck layer

一、 bottleneck layery中文名称：瓶颈层。我初次接触也就是在残差网络中。一般在较深的网络中，如resnet101中使用。一般的结构如下：其中两个1X1flite…

人工智能 2023年6月22日
0070
TensorFlow 2.0 API

数值类型的张量是 TensorFlow 的主要数据载体，根据维度数来区分，可分为:(1)标量(Scalar)。单个的实数，如 1.2, 3.4 等，维度(Dimension)…

人工智能 2023年5月26日
0045
Generalized Few-Shot Object Detection without Forgetting

参考Generalized Few-Shot Object Detection without Forgetting – 云+社区 – 腾讯云 1、摘要近…

人工智能 2023年7月12日
0076
【Sklearn】【API详解】【SVM】- sklearn.svm.SVR参数详解（二）

SVR为Support Vector Regression的简写，顾名思义，其是基于支持向量的回归器模型中的两个自由参数为 C 和 epsilon，自由参数不能通过理论推测，可…

人工智能 2023年6月16日
0084
关于yolo7和gpu

现在说明一下本文绝对没在本站里看贴只是为了给自己收藏没有吹 b的意思给自己看而已也不需要这个站对自己有什么好处目前人体姿态估计总体分为Top-down和Bottom-u…

人工智能 2023年7月10日
0043
C语言源代码系列-管理系统之文件加密任务书

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月30日
0052
的garch预测_CFA教材详解：自回归条件异方差模型（以预测通货膨胀率为例）

更多CFA官方教材详解，请关注”边际实验室”。“边际实验室”是一家专注于金融科技、金融大数据领域的工作室，提供CFA、FRM等金融考…

人工智能 2023年6月18日
0086
结构化数据抽取成三元组_干货丨AI在数据防泄漏中的应用——知识图谱之知识抽取…

随着技术的不断发展，AI(Artificial Intelligence，人工智能)逐渐在社会经济发展的方方面面深入，成为信息化时代最重要的支柱技术之一。在数据安全领域领域，AI…

人工智能 2023年6月1日
0082

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

Python:计算机视觉实现视频的AI换脸（最基础）

大家都在看