OpenCV项目1-OCR识别

2023年5月26日上午7:20 • 人工智能 • 阅读 122

文章目录

项目思路：
*
1、灰度化处理：
2、采用高斯滤波去噪
3、边缘检测
4、查找轮廓并排序：
5、绘制全部轮廓
6、多边形逼近
7、仿射变换
8、写入图片文件
9、扫描读取
10、写入本地

文章处理的图片：

; 项目思路：

思路：我们拿到一张图片不是直接就识别的，而是做一些处理，去除我们不需要的信息，保留我们所需要的信息，再做识别。

通常要做的是对图片进行灰度化处理，再进行滤波，形态学等等去除掉不要的信息。

因为在处理的过程中，我们要对每一步处理后的图片进行查看分析，我们要显示很多次图片，因此我们可以把显示图片的功能封装成一个函数形式来使用：


def cv_show(winname, image):
    cv2.imshow(winname, image)

    cv2.waitKey(0)
    cv2.destroyAllWindows()

我们在拿到一张图片的时候，有时候图片的大小不好处理，比如我们这次处理的图片的大小为3264×2448。我们先对尺寸大小进行处理。

可以将修改尺寸的功能封装成一个函数：


def resize(image, width=None, height=None, inter=cv2.INTER_AREA):
    dim = None
    (h, w) = image.shape[:2]

    if width is None and height is None:
        return image

    if width is None:
        r = height / float(h)
        dim = (int(w * r), height)

    else:
        r = width / float(w)
        dim = (width, int(h * r))
    resized = cv2.resize(image, dim, interpolation=inter)
    return resized

我们修改成高度为500的大小处理图片：

image = resize(image_copy, height = 500)

1、灰度化处理：


gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
cv_show('gray',gray)

2、采用高斯滤波去噪

参考文章：
OpenCV学习笔记8-滤波器原理及代码实现

为后续Canny检测服务：


Gaussian = cv2.GaussianBlur(gray, (5, 5), 0)
cv_show('Gaussian',Gaussian)

3、边缘检测

参考文章：
OpenCV学习笔记8-滤波器原理及代码实现

我们采用Canny找出信息的边缘，为后续查找轮廓做准备：


edged = cv2.Canny(Gaussian, 70, 200)
cv_show('edged',edged)

4、查找轮廓并排序：

参考文章：
OpenCV学习笔记10-图像轮廓的相关知识及代码实现


cnts = cv2.findContours(edged, cv2.RETR_TREE, cv2.CHAIN_APPROX_SIMPLE)[0]

找到轮廓后，我们排序一下，为后面的透视变换和绘制轮廓做准备：


cnts = sorted(cnts, key=cv2.contourArea, reverse=True)

5、绘制全部轮廓

参考文章：
OpenCV学习笔记10-图像轮廓的相关知识及代码实现

注意绘制轮廓会对原图片进行绘制，我们copy一份：


image_contours = cv2.drawContours(image.copy(), cnts, -1, (0, 0, 255), 1)

6、多边形逼近

参考文章：
OpenCV学习笔记10-图像轮廓的相关知识及代码实现

绘制轮廓的方法有可能使得轮廓线粗糙且不平滑，我们用多边形逼近的方法去得到平滑的轮廓，只保留最有用的信息，注意也要对copy的图片进行处理。近似完后，只剩下四个顶点的角的坐标，因此下面的len（approx）=4


for c in cnts:

    perimeter = cv2.arcLength(c, True)

    approx = cv2.approxPolyDP(c, 0.02 * perimeter, True)

    if len(approx) == 4:

        screen_cnt = approx
        break

image_screen_cnt = cv2.drawContours(image.copy(), [screen_cnt], -1, (0, 0, 255), 1)
cv_show('image_screen_cnt', image_screen_cnt)

7、仿射变换

参考文章：
OpenCV学习笔记7-图像的基本变换(附代码实现)

我们对图片进行完预处理后，得到的近似轮廓，因为我们只想处理最有用的信息，其他周围没有用的背景给它去掉，因此我们用仿射变换使得图像变正。

透视变换要找到变换矩阵，因为多边形逼近后只留下四个顶点的坐标，因此我们需要找到原图的四个坐标和仿射变换后的四个坐标。

现在已经找到了原图的4个点的坐标。需要知道变换后的4个坐标，因此我们可以对原图的四个坐标按照角点顺时针或者逆时针排序，封装成一个函数：


def order_points(pts):

    rect = np.zeros((4, 2), dtype='float32')

    s = pts.sum(axis=1)

    rect[0] = pts[np.argmin(s)]
    rect[2] = pts[np.argmax(s)]

    diff = np.diff(pts, axis=1)
    rect[1] = pts[np.argmin(diff)]
    rect[3] = pts[np.argmax(diff)]
    return rect

找到了原图的四个角点的坐标后，计算点与点的距离，得到新的坐标，然后进行仿射变换，我们把仿射变换功能封装成一个函数：


def four_point_transform(image, pts):

    rect = order_points(pts)

    (tl, tr, br, bl) = rect

    widthA = np.sqrt((br[0] - bl[0]) ** 2 + (br[1] - bl[1]) ** 2)
    widthB = np.sqrt((tr[0] - tl[0]) ** 2 + (tr[1] - tl[1]) ** 2)
    max_width = max(int(widthA), int(widthB))
    heightA = np.sqrt((tr[0] - br[0]) ** 2 + (tr[1] - br[1]) ** 2)
    heightB = np.sqrt((tl[0] - bl[0]) ** 2 + (tl[1] - bl[1]) ** 2)
    max_height = max(int(heightA), int(heightB))

    dst = np.array([
        [0, 0],
        [max_width, 0],
        [max_width, max_height],
        [0, max_height]], dtype='float32')

    M = cv2.getPerspectiveTransform(rect, dst)

    warped = cv2.warpPerspective(image, M, (max_width, max_height))
    return warped

调用仿射变换的函数：

进项仿射变换的时候，我们需要将之前的大小还原回来：

&#x8BA1;&#x7B97;&#x6BD4;&#x4F8B;. &#x9650;&#x5B9A;&#x9AD8;&#x5EA6;500
&#x6B64;&#x65F6;&#x50CF;&#x7D20;&#x70B9;&#x90FD;&#x7F29;&#x5C0F;&#x4E86;&#x4E00;&#x5B9A;&#x7684;&#x6BD4;&#x4F8B;&#xFF0C;&#x8FDB;&#x884C;&#x653E;&#x5C04;&#x53D8;&#x6362;&#x65F6;&#x8981;&#x8FD8;&#x539F;
ratio = image.shape[0] / 500.0
&#x62F7;&#x8D1D;&#x4E00;&#x4EFD;
image_copy = image.copy()

进行仿射变换，使图片变正
warped = four_point_transform(image_copy, cv_show('warped', warped)

拉正之后，我们通过二值化处理进行过滤信息，得到有用的信息，方便ocr的扫描和提取：


warped_gray = cv2.cvtColor(warped, cv2.COLOR_BGR2GRAY)

ref = cv2.threshold(warped_gray, 150, 255, cv2.THRESH_BINARY)[1]
cv_show('ref', ref)

8、写入图片文件

将处理好的文件保存下来


_ = cv2.imwrite('./scan.jpg', ref)

9、扫描读取

我们需要导入pytesseract的工具包，进行扫描文字：

我们先打开cmd下载一下：

pip install pytesseract

出现这个情况不要紧，我们修改一下下载路径：

pip install --target=d:\python3.9\lib\site-packages pytesseract

具体可以查看我的这个文章：
已解决：Requirement already satisfied：xxx

pytesseract要求的image不是opencv读进来的image, 而是pillow这个包, 即PIL

所以我们要传入pillow包的图片！

页面分隔模式+OCR引擎模式可以看看我这篇文章：
OpenCV学习笔记11-Tesseract-OCR的安装和使用

pytesseract.image_to_string(Image.open(‘图片路径’), lang=’使用的语言包’, config=’页面分隔模式+OCR引擎模式’)
tesseract5.0配套的traineddata文件某些语言版本不支持老版本的引擎（即oem=0）。

pytesseract&#x8981;&#x6C42;&#x7684;image&#x4E0D;&#x662F;opencv&#x8BFB;&#x8FDB;&#x6765;&#x7684;image, &#x800C;&#x662F;pillow&#x8FD9;&#x4E2A;&#x5305;, &#x5373;PIL
text = pytesseract.image_to_string(Image.open('./scan.jpg'), lang='chi_sim+eng', config='--oem 1')

10、写入本地


with open('output.txt', 'w') as f:
    print(text)
    f.write(str(text))

我们可以在保存的目录下看到已保存的scan和output

查看识别结果：

eee ek RK KOK KOR KOK

WHOLE FOODS MARKET – WESTPORT,CT 06880
399 POST RD WEST – (203) 227-6858

365
365
365
365

uexH TAX

BACON LS
BACON LS
BACON LS
BACON LS

BROTH CHIC
FLOUR ALMOND

CHKN BRST BNLSS SK
HEAVY CREAM
BALSMC REDUCT

BEEF GRND 85/15
JUICE COF CASHEW C

.00

DOCS PINT ORGANIC
HNY ALMOND BUTTER

BAL

NP
NP
NP
NP
NP
NP
NP
NP
NP
NP
NP
NP
NP

4.99
4.99
4.99
4.99
2.19
11.99
18.80
3.39
6.49
5.04
8.99
194.49
9.99
101.33

ae Mees es ieee i en

呃呃呃呃呃，好像识别结果准确率不高，但是大部分还是识别出来了。

完整代码：

import cv2
import numpy as np
import pytesseract
from PIL import Image

&#x663E;&#x793A;&#x56FE;&#x7247;
def cv_show(winname, image):
    cv2.imshow(winname, image)
    # &#x9500;&#x6BC1;&#x7A97;&#x53E3;
    cv2.waitKey(0)
    cv2.destroyAllWindows()
&#x6709;&#x4E9B;&#x539F;&#x56FE;&#x7247;&#x7684;size&#x4E0D;&#x597D;&#x5904;&#x7406;&#xFF0C;&#x6211;&#x4EEC;&#x53EF;&#x4EE5;&#x5C01;&#x88C5;&#x6210;&#x4E00;&#x4E2A;&#x51FD;&#x6570;&#x6765;&#x7EDF;&#x4E00;&#x56FE;&#x7247;&#x7684;size
&#x5C01;&#x88C5;resize&#x529F;&#x80FD;.

def resize(image, width=None, height=None, inter=cv2.INTER_AREA):
    dim = None # &#x7F29;&#x653E;&#x540E;&#x7684;&#x5BBD;&#x548C;&#x9AD8;
    (h, w) = image.shape[:2]
    # &#x4E0D;&#x505A;&#x5904;&#x7406;
    if width is None and height is None:
        return image
    # &#x6307;&#x5B9A;&#x4E86;resize&#x7684;height
    if width is None:
        r = height / float(h) # &#x7F29;&#x653E;&#x6BD4;&#x4F8B;
        dim = (int(w * r), height)
    # &#x6307;&#x5B9A;&#x4E86;resize&#x7684;width
    else:
        r = width / float(w)
        dim = (width, int(h * r))
    resized = cv2.resize(image, dim, interpolation=inter)
    return resized

&#x8FDB;&#x884C;&#x900F;&#x89C6;&#x53D8;&#x6362;.

&#x900F;&#x89C6;&#x53D8;&#x6362;&#x8981;&#x627E;&#x5230;&#x53D8;&#x6362;&#x77E9;&#x9635;
&#x53D8;&#x6362;&#x77E9;&#x9635;&#x8981;&#x6C42;&#x539F;&#x56FE;&#x7684;4&#x4E2A;&#x70B9;&#x5750;&#x6807;&#x548C;&#x53D8;&#x6362;&#x4E4B;&#x540E;&#x7684;4&#x4E2A;&#x70B9;&#x7684;&#x5750;&#x6807;
&#x73B0;&#x5728;&#x5DF2;&#x7ECF;&#x627E;&#x5230;&#x4E86;&#x539F;&#x56FE;&#x7684;4&#x4E2A;&#x70B9;&#x7684;&#x5750;&#x6807;&#x3002;&#x9700;&#x8981;&#x77E5;&#x9053;&#x53D8;&#x6362;&#x540E;&#x7684;4&#x4E2A;&#x5750;&#x6807;
&#x5148;&#x5BF9;&#x83B7;&#x53D6;&#x5230;&#x7684;4&#x4E2A;&#x89D2;&#x70B9;&#x6309;&#x7167;&#x4E00;&#x5B9A;&#x987A;&#x5E8F;&#xFF08;&#x987A;/&#x9006;&#x65F6;&#x9488;&#xFF09;&#x6392;&#x5E8F;
&#x6392;&#x5E8F;&#x529F;&#x80FD;&#x662F;&#x4E00;&#x4E2A;&#x72EC;&#x7ACB;&#x529F;&#x80FD;&#xFF0C;&#x53EF;&#x4EE5;&#x5C01;&#x88C5;&#x6210;&#x4E00;&#x4E2A;&#x51FD;&#x6570;
def order_points(pts):
    # &#x521B;&#x5EFA;&#x5168;&#x662F;0&#x7684;&#x77E9;&#x9635;, &#x6765;&#x63A5;&#x6536;&#x7B49;&#x4E0B;&#x627E;&#x51FA;&#x6765;&#x7684;4&#x4E2A;&#x89D2;&#x7684;&#x5750;&#x6807;.

    rect = np.zeros((4, 2), dtype='float32')
    # &#x5217;&#x76F8;&#x52A0;
    s = pts.sum(axis=1)
    # &#x5DE6;&#x4E0A;&#x7684;&#x5750;&#x6807;&#x4E00;&#x5B9A;&#x662F;x,y&#x52A0;&#x8D77;&#x6765;&#x6700;&#x5C0F;&#x7684;&#x5750;&#x6807;. &#x53F3;&#x4E0B;&#x7684;&#x5750;&#x6807;&#x4E00;&#x5B9A;&#x662F;x,y&#x52A0;&#x8D77;&#x6765;&#x6700;&#x5927;&#x7684;&#x5750;&#x6807;.

    rect[0] = pts[np.argmin(s)]
    rect[2] = pts[np.argmax(s)]
    # &#x53F3;&#x4E0A;&#x89D2;&#x7684;x,y&#x76F8;&#x51CF;&#x7684;&#x5DEE;&#x503C;&#x4E00;&#x5B9A;&#x662F;&#x6700;&#x5C0F;&#x7684;.

    # &#x5DE6;&#x4E0B;&#x89D2;&#x7684;x,y&#x76F8;&#x51CF;&#x7684;&#x5DEE;&#x503C;, &#x4E00;&#x5B9A;&#x662F;&#x6700;&#x5927;.

    # diff&#x7684;&#x4F5C;&#x7528;&#x662F;&#x540E;&#x4E00;&#x5217;&#x51CF;&#x524D;&#x4E00;&#x5217;&#x5F97;&#x5230;&#x7684;&#x5DEE;&#x503C;
    diff = np.diff(pts, axis=1)
    rect[1] = pts[np.argmin(diff)]
    rect[3] = pts[np.argmax(diff)]
    return rect

&#x628A;&#x900F;&#x89C6;&#x53D8;&#x6362;&#x529F;&#x80FD;&#x5C01;&#x88C5;&#x6210;&#x4E00;&#x4E2A;&#x51FD;&#x6570;
def four_point_transform(image, pts):
    # &#x5BF9;&#x8F93;&#x5165;&#x7684;4&#x4E2A;&#x5750;&#x6807;&#x6392;&#x5E8F;
    rect = order_points(pts)
    # top_left&#x7B80;&#x79F0;tl&#xFF0C;&#x5DE6;&#x4E0A;&#x89D2;
    # top_right&#x7B80;&#x79F0;tr&#xFF0C;&#x53F3;&#x4E0A;&#x89D2;
    # bottom_right&#x7B80;&#x79F0;br&#xFF0C;&#x53F3;&#x4E0B;&#x89D2;
    # bottom_left&#x7B80;&#x79F0;bl&#xFF0C;&#x5DE6;&#x4E0B;&#x89D2;
    (tl, tr, br, bl) = rect
    # &#x7A7A;&#x95F4;&#x4E2D;&#x4E24;&#x70B9;&#x7684;&#x8DDD;&#x79BB;&#xFF0C;&#x5E76;&#x4E14;&#x8981;&#x53D6;&#x6700;&#x5927;&#x7684;&#x8DDD;&#x79BB;&#x786E;&#x4FDD;&#x5168;&#x90E8;&#x6587;&#x5B57;&#x90FD;&#x770B;&#x5F97;&#x5230;
    widthA = np.sqrt((br[0] - bl[0]) ** 2 + (br[1] - bl[1]) ** 2)
    widthB = np.sqrt((tr[0] - tl[0]) ** 2 + (tr[1] - tl[1]) ** 2)
    max_width = max(int(widthA), int(widthB))
    heightA = np.sqrt((tr[0] - br[0]) ** 2 + (tr[1] - br[1]) ** 2)
    heightB = np.sqrt((tl[0] - bl[0]) ** 2 + (tl[1] - bl[1]) ** 2)
    max_height = max(int(heightA), int(heightB))
    # &#x6784;&#x9020;&#x53D8;&#x6362;&#x4E4B;&#x540E;&#x7684;&#x5BF9;&#x5E94;&#x5750;&#x6807;&#x4F4D;&#x7F6E;.

    dst = np.array([
        [0, 0],
        [max_width, 0],
        [max_width, max_height],
        [0, max_height]], dtype='float32')
    # &#x8BA1;&#x7B97;&#x53D8;&#x6362;&#x77E9;&#x9635;
    M = cv2.getPerspectiveTransform(rect, dst)
    # &#x900F;&#x89C6;&#x53D8;&#x6362;
    warped = cv2.warpPerspective(image, M, (max_width, max_height))
    return warped

&#x628A;&#x56FE;&#x50CF;&#x9884;&#x5904;&#x7406;&#x7684;&#x529F;&#x80FD;&#x5C01;&#x88C5;&#x6210;&#x4E00;&#x4E2A;&#x51FD;&#x6570;
def Image_Pretreatment(image):
    # &#x56FE;&#x7247;&#x9884;&#x5904;&#x7406;
    # &#x7070;&#x5EA6;&#x5316;&#x5904;&#x7406;
    gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
    # cv_show('gray',gray)
    # &#x9AD8;&#x65AF;&#x5E73;&#x6ED1;
    Gaussian = cv2.GaussianBlur(gray, (5, 5), 0)
    # cv_show('Gaussian',Gaussian)
    # &#x8FB9;&#x7F18;&#x68C0;&#x6D4B;&#xFF0C;&#x5BFB;&#x627E;&#x8FB9;&#x754C;&#xFF08;&#x4E3A;&#x540E;&#x7EED;&#x67E5;&#x627E;&#x8F6E;&#x5ED3;&#x505A;&#x51C6;&#x5907;&#xFF09;
    edged = cv2.Canny(Gaussian, 70, 200)
    # cv_show('edged',edged)
    # &#x67E5;&#x627E;&#x8F6E;&#x5ED3;
    cnts = cv2.findContours(edged, cv2.RETR_TREE, cv2.CHAIN_APPROX_SIMPLE)[0]
    # &#x5C06;&#x8F6E;&#x5ED3;&#x6309;&#x7167;&#x9762;&#x79EF;&#x964D;&#x5E8F;&#x6392;&#x5E8F;
    cnts = sorted(cnts, key=cv2.contourArea, reverse=True)
    # &#x7ED8;&#x5236;&#x6240;&#x6709;&#x8F6E;&#x5ED3;
    image_contours = cv2.drawContours(image.copy(), cnts, -1, (0, 0, 255), 1)
    cv_show('image_contours', image_contours)
    # &#x904D;&#x5386;&#x8F6E;&#x5ED3;&#x627E;&#x51FA;&#x6700;&#x5927;&#x7684;&#x8F6E;&#x5ED3;.

    for c in cnts:
        # &#x8BA1;&#x7B97;&#x8F6E;&#x5ED3;&#x5468;&#x957F;
        perimeter = cv2.arcLength(c, True)
        # &#x591A;&#x8FB9;&#x5F62;&#x903C;&#x8FD1;&#xFF0C;&#x5F97;&#x5230;&#x8FD1;&#x4F3C;&#x7684;&#x8F6E;&#x5ED3;
        # &#x8FD1;&#x4F3C;&#x5B8C;&#x540E;&#xFF0C;&#x53EA;&#x5269;&#x4E0B;&#x56DB;&#x4E2A;&#x9876;&#x70B9;&#x7684;&#x89D2;&#x7684;&#x5750;&#x6807;
        approx = cv2.approxPolyDP(c, 0.02 * perimeter, True)
        # &#x6700;&#x5927;&#x7684;&#x8F6E;&#x5ED3;
        if len(approx) == 4:
            # &#x63A5;&#x6536;approx
            screen_cnt = approx
            break
    # &#x753B;&#x51FA;&#x591A;&#x8FB9;&#x5F62;&#x903C;&#x8FD1;
    image_screen_cnt = cv2.drawContours(image.copy(), [screen_cnt], -1, (0, 0, 255), 1)
    # cv_show('image_screen_cnt', image_screen_cnt)
    # &#x8FDB;&#x884C;&#x4EFF;&#x5C04;&#x53D8;&#x6362;&#xFF0C;&#x4F7F;&#x56FE;&#x7247;&#x53D8;&#x6B63;
    warped = four_point_transform(image_copy, screen_cnt.reshape(4, 2) * ratio)
    # cv_show('warped', warped)
    # &#x4E8C;&#x503C;&#x5904;&#x7406;&#xFF0C;&#x5148;&#x8F6C;&#x6210;&#x7070;&#x5EA6;&#x56FE;
    warped_gray = cv2.cvtColor(warped, cv2.COLOR_BGR2GRAY)
    # &#x518D;&#x4E8C;&#x503C;&#x5316;&#x5904;&#x7406;
    ref = cv2.threshold(warped_gray, 150, 255, cv2.THRESH_BINARY)[1]
    cv_show('ref', ref)
    # &#x65CB;&#x8F6C;&#x53D8;&#x6B63;
    # dst = cv2.rotate(ref, cv2.ROTATE_90_COUNTERCLOCKWISE)
    # cv_show('dst', dst)
    return ref

if __name__ == "__main__":
    # &#x8BFB;&#x53D6;&#x56FE;&#x7247;
    image = cv2.imread('D:/Desktop/daxue/shiyanshi/Project/OCR/images/receipt.jpg')
    # &#x8BA1;&#x7B97;&#x6BD4;&#x4F8B;. &#x9650;&#x5B9A;&#x9AD8;&#x5EA6;500
    # &#x6B64;&#x65F6;&#x50CF;&#x7D20;&#x70B9;&#x90FD;&#x7F29;&#x5C0F;&#x4E86;&#x4E00;&#x5B9A;&#x7684;&#x6BD4;&#x4F8B;&#xFF0C;&#x8FDB;&#x884C;&#x653E;&#x5C04;&#x53D8;&#x6362;&#x65F6;&#x8981;&#x8FD8;&#x539F;
    ratio = image.shape[0] / 500.0
    # &#x62F7;&#x8D1D;&#x4E00;&#x4EFD;
    image_copy = image.copy()
    # &#x4FEE;&#x6539;&#x5C3A;&#x5BF8;
    image = resize(image_copy, height=500)
    # cv_show('image', image)
    # &#x8FD4;&#x56DE;&#x900F;&#x89C6;&#x53D8;&#x6362;&#x7684;&#x7ED3;&#x679C;
    ref = Image_Pretreatment(image)
    # &#x628A;&#x5904;&#x7406;&#x597D;&#x7684;&#x56FE;&#x7247;&#x5199;&#x5165;&#x56FE;&#x7247;&#x6587;&#x4EF6;.

    _ = cv2.imwrite('./scan.jpg', ref)
    # pytesseract&#x8981;&#x6C42;&#x7684;image&#x4E0D;&#x662F;opencv&#x8BFB;&#x8FDB;&#x6765;&#x7684;image, &#x800C;&#x662F;pillow&#x8FD9;&#x4E2A;&#x5305;, &#x5373;PIL
    text = pytesseract.image_to_string(Image.open('./scan.jpg'), lang='chi_sim+eng', config='--oem 1')
    # &#x4FDD;&#x5B58;&#x5230;&#x672C;&#x5730;
    with open('output.txt', 'w') as f:
        print(text)
        f.write(str(text))

附OpenCV目录：OpenCV总目录学习笔记

Original: https://blog.csdn.net/weixin_56197703/article/details/124309367
Author: Aaron-ywl
Title: OpenCV项目1-OCR识别

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/518587/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Python中说no module named ＂torch＂是什么情况?

原因这是一行作为小白时常犯的错，这个报错说明在你电脑当前环境下没有安装torch这个模块解决办法系统环境：Win10+Python3.6 此处推荐第三种方法到官网获取相关安装指令…

人工智能 2023年7月21日
0063
【机器学习sklearn】两个例子轻松搞懂核密度估计KernelDensity

前言作业中遇到了需要使用KernelDensity的情况，但是网上的资料参差不齐，找了不短的时间却失望而归，最后还是靠着自己的理解才弄懂sklearn这个函数的使用，特此纪念。 …

人工智能 2023年7月28日
0088
详解PyTorch可视化工具visdom（一）

在深度学习领域，模型训练是一个必须的过程，因此常常需要实时监听并可视化一些数据，如损失值loss，正确率acc等。在Tensorflow中，最常使用的工具非Tensorboard莫…

人工智能 2023年7月22日
0060
Orbslam2 稠密点云 +D435i实现（Ubuntu18.04）

系统：Ubuntu18.04设备：Realsense D435i 一、安装相关依赖库毕设后写的一篇通俗一些的，适合没接触过或不太会ubuntu的同学，前半部分都是一样的，tips…

人工智能 2023年5月26日
00104
WT588F02B-8S（C006_03)单芯片方案为智能门铃设计降本增效赋能

21世纪以来，随着电子技术、无线技术和网络技术的快速发展，我国经济发展速度加快，人民生活水平不断提高。越来越多的人开始注重营造温馨舒适的家居环境。在多元化智能产品走进千家万户的当下…

人工智能 2023年5月25日
0073
【目标检测-原理讲解导航】

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年7月12日
0082
WIn10系统 Anaconda安装pytorch和TensorFlow的一些坑和解决方法分享

Anaconda中创建虚拟环境安装Anaconda就没什么好说的，如果还没安装的可以去自行搜索教程，我安装的时候很顺利并没有遇到坑。安装pytorch遇到的坑首先，使用默认源…

人工智能 2023年5月24日
0087
python计算平均值画折线图_Python 数据分析测试2 之求平均值及折线图显示

Time: 2020/07/27 Author: Xiaohong 运行环境: OS: Windows 10 Python: 3.7 功能: 导入4份文件(分别对应4个部位)，测算…

人工智能 2023年7月8日
0082
多目标水母搜索（MOJS）算法（Matlab实现）

💥💥💥💞💞💞 欢迎来到本博客❤️❤️❤️💥💥💥 🏆博主优势： 🌞🌞🌞博客内容尽量做到思维缜密，逻辑清晰，为了方便读者。 ⛳️ 座右铭：行百里者，半于九十。 💥1 概述 📚2 运行结…

人工智能 2023年6月29日
0064
PointPillars论文解析和OpenPCDet代码解析

PointPillars是一个来自工业界的模型，整体思想基于图片的处理框架，直接将点云从俯视图的视角划分为一个个的Pillar（立方柱体），从而构成了类似图片的数据，然后在使用2…

人工智能 2023年6月17日
0086
最基本的25道深度学习面试问题和答案

近年来，对深度学习的需求不断增长，其应用程序被应用于各个商业部门。各公司现在都在寻找能够利用深度学习和机器学习技术的专业人士。在本文中，将整理深度学习面试中最常被问到的25个问题和…

人工智能 2023年7月25日
0059
三维目标检测—RPVNet论文解读

更多内容更新于个人博客 twn29004.top RPVNet: A Deep and Efficient Range-Point-Voxel Fusion Network for…

人工智能 2023年7月10日
0055
C#调用OpenCV（C++原版）思路和实现方法（小白教程）

目录：前言：一，下载和安装OpenCV到本地二，主要原理三，C++生成供C#调用OpenCV的.dll * 1.添加头文件 2.添加cpp文件 3.添加模块定义文件四，建…

人工智能 2023年6月18日
0093
YOLO系列 — YOLOV7算法（三）：YOLO V7算法train.py代码解析

YOLO系列 — YOLOV7算法（三）：YOLO V7算法train.py代码解析先介绍下每个参数的含义（直接在代码上写吧） parser = argparse.Argumen…

人工智能 2023年6月16日
00132
项目场景： gyp verb check python checking for Python executable python2 in the PATH

node v16.15.0 npm 8.5.5 npm install 报错 gyp verb check python checking for Python execu…

人工智能 2023年7月5日
0073
复现lio_sam激光slam算法创建点云地图

实验环境：ubuntu16.04+ROSkinetic+robosense16线+xsense_mti_700惯导+pcl1.9.0+gtsam4.0.2 一、LIO_SAM简介 …

人工智能 2023年6月15日
0072

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

OpenCV项目1-OCR识别

文章目录

1、灰度化处理：

2、采用高斯滤波去噪

3、边缘检测

4、查找轮廓并排序：

5、绘制全部轮廓

6、多边形逼近

7、仿射变换

8、写入图片文件

9、扫描读取

10、写入本地

大家都在看