分类算法中，KNN(K临近分类法)是最简单且用的最多的一种方法。通过将要分类的对象与训练集中已知类标记的所有对象进行对比，并由k近邻对指派到哪个类进行投票。这种方法分类效果较好但还是会出现很多弊端，如同K-means聚类算法一样，需要进行k值的预设，k值的选择将会影响分类的性能；此外这种方法还要求将整个训练集存储起来，当训练集非常大时，搜索将会变的很慢。因此对于大的训练集采取某些装箱形式通常会减少对比的次数。

实现最基本的KNN形式非常简单。给定训练样本集和对应的标记列表，下面的代码可以用来完成这一工作，这些训练集样本和标记可以在一个数组里成行摆放或者干脆摆放在列表里。

class KnnClassifier(object):

    def __init__(self,labels,samples):
        """ &#x4F7F;&#x7528;&#x8BAD;&#x7EC3;&#x6570;&#x636E;&#x521D;&#x59CB;&#x5316;&#x5206;&#x7C7B;&#x5668; """

        self.labels = labels
        self.samples = samples

    def classify(self,point,k=3):
        """ &#x5728;&#x8BAD;&#x7EC3;&#x6570;&#x636E;&#x4E0A;&#x91C7;&#x7528;k&#x8FD1;&#x90BB;&#x5206;&#x7C7B;&#xFF0C;&#x5E76;&#x8FD4;&#x56DE;&#x6807;&#x8BB0; """

        # &#x8BA1;&#x7B97;&#x6240;&#x6709;&#x8BAD;&#x7EC3;&#x6570;&#x636E;&#x70B9;&#x7684;&#x8DDD;&#x79BB;
        dist = array([L2dist(point,s) for s in self.samples])

        # &#x5BF9;&#x5B83;&#x4EEC;&#x8FDB;&#x884C;&#x6392;&#x5E8F;
        ndx = dist.argsort()

        # &#x4F7F;&#x7528;&#x5B57;&#x5178;&#x5B58;&#x50A8;k&#x8FD1;&#x90BB;
        votes = {}
        for i in range(k):
            label = self.labels[ndx[i]]
            votes.setdefault(label,0)
            votes[label] += 1

        return max(votes)

def L2dist(p1,p2):
    return sqrt( sum( (p1-p2)**2) )

def L1dist(v1,v2):
    return sum(abs(v1-v2))

定义一个类并用训练集数据初始化非常简单，每次相对某些东西进行分类时，用KNN方法就没必要存储并将训练数据作为参数来传递。用一个字典来存储邻近标记，我们就可以使用文本字符串或数字来表示标记。

1.1 简单二维示例

建立一些简单的二维示例数据集来说明并可视化分类器的工作原理：

from numpy.random import randn
from numpy import *
import pickle

&#x521B;&#x5EFA;&#x4E8C;&#x7EF4;&#x6837;&#x672C;&#x6570;&#x636E;
n = 200
&#x4E24;&#x4E2A;&#x6B63;&#x6001;&#x5206;&#x5E03;&#x6570;&#x636E;&#x96C6;
class_1 = 0.6 * randn(n, 2)
class_2 = 1.2 * randn(n, 2) + array([5, 1])
labels = hstack((ones(n), -ones(n)))
&#x7528;pickle&#x6A21;&#x5757;&#x4FDD;&#x5B58;
with open('points_normal_test.pkl', 'w') as f:
    pickle.dump(class_1, f)
    pickle.dump(class_2, f)
    pickle.dump(labels, f)
&#x6B63;&#x6001;&#x5206;&#x5E03;&#xFF0C;&#x5E76;&#x4F7F;&#x6570;&#x636E;&#x6210;&#x73AF;&#x7ED5;&#x72B6;&#x5206;&#x5E03;
class_1 = 0.6 * randn(n, 2)
r = 0.8 * randn(n, 1) + 5
angle = 2 * pi * randn(n, 1)
class_2 = hstack((r * cos(angle), r * sin(angle)))
labels = hstack((ones(n), -ones(n)))
&#x7528;pickle&#x4FDD;&#x5B58;
with open('points_ring.pkl_test', 'w') as f:
    pickle.dump(class_1, f)
    pickle.dump(class_2, f)
    pickle.dump(labels, f)

根据书中给出代码运行程序，出现报错：

这是由于python3给open函数添加了名为encoding的新参数，默认值为utf-8，不在接受包含二进制数据bytes的参数。这里需要将

with open('points_normal_test.pkl', 'w') as f:

改成

with open('points_normal_test.pkl', 'wb') as f:

此时就能成功运行了，生成两个pkl文件。

现在观察如何用KNN分类器来完成：

import pickle
from pylab import *
from numpy import *
from PCV.classifiers import knn
from PCV.tools import imtools

&#x7528;pickle&#x8F7D;&#x5165;&#x4E8C;&#x7EF4;&#x6570;&#x636E;&#x70B9;
with open('points_normal.pkl', 'rb') as f:
    class_1 = pickle.load(f)
    class_2 = pickle.load(f)
    labels = pickle.load(f)
model = knn.KnnClassifier(labels, vstack((class_1, class_2)))

&#x7528;pickle&#x6A21;&#x5757;&#x8F7D;&#x5165;&#x6D4B;&#x8BD5;&#x6570;&#x636E;
with open('points_normal_test.pkl', 'rb') as f:
    class_1 = pickle.load(f)
    class_2 = pickle.load(f)
    labels = pickle.load(f)

&#x5728;&#x6D4B;&#x8BD5;&#x6570;&#x636E;&#x96C6;&#x7684;&#x7B2C;&#x4E00;&#x4E2A;&#x6570;&#x636E;&#x70B9;&#x4E0A;&#x8FDB;&#x884C;&#x6D4B;&#x8BD5;
print(model.classify(class_1[0]))

&#x5B9A;&#x4E49;&#x7ED8;&#x5236;&#x51FD;&#x6570;
def classify(x, y, model=model):
    return array([model.classify([xx, yy]) for (xx, yy) in zip(x,y)])

&#x7ED8;&#x5236;&#x5206;&#x7C7B;&#x8FB9;&#x754C;
imtools.plot_2D_boundary([-6, 6, -6, 6],[class_1, class_2],classify,[1,-1])
show()

使用Pickle模块创建一个KNN分类器模型，载入两个数据集，并在控制台上打印第一个数据点估计出来的类标记。利用classify函数可视化所有测试数据点的分类，并展示分类器将两个不同的类分开的怎么样。

输出结果为：

这里使用了plot_2D_boundary()函数：

def plot_2D_boundary(plot_range,points,decisionfcn,labels,values=[0]):
    """    Plot_range&#x662F;(xmin,xmax,ymin,ymax), points&#x662F;&#x7C7B;&#x6570;&#x636E;&#x70B9;&#x5217;&#x8868;, decisionfcn&#x4E3A;&#x8BC4;&#x4F30;&#x51FD;&#x6570;,
        labels&#x662F;&#x51FD;&#x6570;decidionfcn&#x5173;&#x4E8E;&#x6BCF;&#x4E2A;&#x7C7B;&#x8FD4;&#x56DE;&#x7684;&#x6807;&#x8BB0;&#x5217;&#x8868;,
"""

    clist = ['b','r','g','k','m','y'] # &#x4E0D;&#x540C;&#x7C7B;&#x7528;&#x4E0D;&#x540C;&#x989C;&#x8272;

    # &#x5728;&#x7F51;&#x683C;&#x4E0A;&#x8FDB;&#x884C;&#x8BC4;&#x4F30;&#xFF0C;&#x5E76;&#x753B;&#x51FA;&#x51B3;&#x7B56;&#x51FD;&#x6570;&#x7684;&#x8FB9;&#x754C;
    x = arange(plot_range[0],plot_range[1],.1)
    y = arange(plot_range[2],plot_range[3],.1)
    xx,yy = meshgrid(x,y)
    xxx,yyy = xx.flatten(),yy.flatten() # &#x7F51;&#x683C;&#x4E2D;&#x7684;x&#xFF0C;y&#x5750;&#x6807;&#x70B9;&#x5217;&#x8868;
    zz = array(decisionfcn(xxx,yyy))
    zz = zz.reshape(xx.shape)
    # &#x4EE5;value&#x753B;&#x51FA;&#x8FB9;&#x754C;
    contour(xx,yy,zz,values)

    # &#x5BF9;&#x4E8E;&#x6BCF;&#x4E2A;&#x7C7B;&#xFF0C;&#x7528;*&#x753B;&#x51FA;&#x5206;&#x7C7B;&#x6B63;&#x786E;&#x7684;&#x70B9;&#xFF0C;&#x7528;o&#x753B;&#x51FA;&#x5206;&#x7C7B;&#x4E0D;&#x6B63;&#x786E;&#x7684;&#x70B9;
    for i in range(len(points)):
        d = decisionfcn(points[i][:,0],points[i][:,1])
        correct_ndx = labels[i]==d
        incorrect_ndx = labels[i]!=d
        plot(points[i][correct_ndx,0],points[i][correct_ndx,1],'*',color=clist[i])
        plot(points[i][incorrect_ndx,0],points[i][incorrect_ndx,1],'o',color=clist[i])

    axis('equal')

从上图的结果中我们可以看到分界线将两个数据集分割开，其中星号为正确的分类的点，圈点为分类错误的点，分割线又可以称为决策边界。

1.2 用稠密SIFT作为图像特征

要对图像进行分类时，需要一个特征向量来表示一幅图像，前面有学过用平均RGB像素值和PCA系数作为图像的特征向量，这里将用稠密SIFT特征向量。

在整幅图像上用一个规划的网格应用SIFT描述子可以得到稠密SIFT的表达形式。

def process_image_dsift(imagename,resultname,size=20,steps=10,force_orientation=False,resize=None):
    """ &#x7528;&#x5BC6;&#x96C6;&#x91C7;&#x6837;&#x7684;SIFT&#x63CF;&#x8FF0;&#x5B50;&#x5904;&#x7406;&#x4E00;&#x5E45;&#x56FE;&#x50CF;&#xFF0C;&#x5E76;&#x5C06;&#x7ED3;&#x679C;&#x4FDD;&#x5B58;&#x5728;&#x4E00;&#x4E2A;&#x6587;&#x4EF6;&#x91CC;&#xFF0C;&#x53EF;&#x9009;&#x7684;&#x8F93;&#x5165;&#xFF1A;
     size&#xFF1A; &#x7279;&#x5F81;&#x7684;&#x5927;&#x5C0F;
     steps&#xFF1A; &#x4F4D;&#x7F6E;&#x4E4B;&#x95F4;&#x7684;&#x6B65;&#x957F;
     force_orientation&#xFF1A;&#x662F;&#x5426;&#x5F3A;&#x8FEB;&#x8BA1;&#x7B97;&#x63CF;&#x8FF0;&#x5B50;&#x7684;&#x65B9;&#x4F4D;&#xFF08;False&#x8868;&#x793A;&#x6240;&#x6709;&#x65B9;&#x4F4D;&#x90FD;&#x662F;&#x671D;&#x4E0A;&#x7684;&#xFF09;&#xFF0C;&#x7528;&#x4E8E;&#x8C03;&#x6574;&#x56FE;&#x50CF;&#x5927;&#x5C0F;&#x7684;&#x5143;&#x7EC4;
"""

    im = Image.open(imagename).convert('L')
    if resize!=None:
        im = im.resize(resize)
    m,n = im.size

    if imagename[-3:] != 'pgm':
        # &#x521B;&#x5EFA;&#x4E00;&#x4E2A;pgm&#x6587;&#x4EF6;
        im.save('tmp.pgm')
        imagename = 'tmp.pgm'

    # &#x521B;&#x5EFA;&#x5E27;&#xFF0C;&#x5E76;&#x4FDD;&#x5B58;&#x5230;&#x4E34;&#x65F6;&#x6587;&#x4EF6;
    scale = size/3.0
    x,y = meshgrid(range(steps,m,steps),range(steps,n,steps))
    xx,yy = x.flatten(),y.flatten()
    frame = array([xx,yy,scale*ones(xx.shape[0]),zeros(xx.shape[0])])
    savetxt('tmp.frame',frame.T,fmt='%03.3f')

    if force_orientation:
        cmmd = str("sift "+imagename+" --output="+resultname+
                    " --read-frames=tmp.frame --orientations")
    else:
        cmmd = str("sift "+imagename+" --output="+resultname+
                    " --read-frames=tmp.frame")
    os.system(cmmd)
    print ('processed', imagename, 'to', resultname)

不同于先前的process_image()函数，为了使用命令行处理，用savetext()将帧数组存储在一个文本文件中，函数的最后一个参数可以在提取描述子之前对图像的大小进行调整。当force_orientation为真，则提取出的描述子会基于局部主梯度方向进行归一化，否则只能简单的朝上。

计算稠密SIFT描述子的具体代码如下：

from PIL import Image
from pylab import *
from numpy import *
from PCV.localdescriptors import dsift,sift

dsift.process_image_dsift('D:\\picture\\test4.jpg', 'empire.sift', 90, 40, True)
l,d = sift.read_features_from_file('empire.sift')
im = array(Image.open('D:\\picture\\test4.jpg'))
sift.plot_features(im, l, True)
show()

1.3 图像分类：手势识别

在这个应用中，通过使用稠密SIFT描述子来表示这些手势图像，并建立一个简单的手势识别系统，使用的是书中给出的图像集。

from PCV.localdescriptors import sift, dsift
from pylab import *
import os
from PIL import Image

imlist = ['D:\\picture\\train\\C-uniform02.ppm', 'D:\\picture\\train\\B-uniform01.ppm',
          'D:\\picture\\train\\A-uniform01.ppm', 'D:\\picture\\train\\Five-uniform01.ppm',
          'D:\\picture\\train\\Point-uniform01.ppm', 'D:\\picture\\train\\V-uniform01.ppm']

figure()
for i, im in enumerate(imlist):
    print(im)
    dsift.process_image_dsift(im, im[:-3] + 'dsift', 10, 5, True, resize=(50,50))
    l, d = sift.read_features_from_file(im[:-3] + 'dsift')
    dirpath, filename = os.path.split(im)
    im = array(Image.open(im))
    # &#x663E;&#x793A;&#x624B;&#x52BF;&#x542B;&#x4E49;title
    titlename = filename[:-14]
    subplot(2, 3, i + 1)
    sift.plot_features(im, l, True)
    title(titlename)
show()

结果图如下：

首先对每幅图像创建一个特征文件，文件名后缀为.dift，同时还将图片的分辨率调成了常见的固定大小。

这里定义一个复制函数，用以从文件中读取稠密SIFT描述子：

from pylab import *
import os
from PCV.classifiers import knn
from PCV.localdescriptors import sift, dsift

def read_gesture_features_labels(path):
    featlist = [os.path.join(path,f) for f in os.listdir(path) if f.endswith('.dsift')]
    features = []
    for featfile in featlist:
        l,d = sift.read_features_from_file(featfile)
        features.append(d.flatten())
    features = array(features)
    labels = [featfile.split('/')[-1][0] for featfile in featlist]
    return features,array(labels)

def print_confusion(res,test_labels,classnames):
    n = len(classnames)
    class_ind=dict([(classnames[i],i)for i in range(n)])
    confuse = zeros((n,n))
    for i in range(len(test_labels)):
        confuse[class_ind[res[i]],class_ind[test_labels[i]]]+=1
    print('Confusion matrix for')
    print(classnames)
    print(confuse)

def get_imlist(path):

    return [os.path.join(path, f) for f in os.listdir(path) if f.endswith('.ppm')]

features,labels = read_gesture_features_labels('D:\\picture\\train\\')
test_features,test_labels = read_gesture_features_labels('D:\\picture\\test\\')
classnames = unique(labels)

&#x6D4B;&#x8BD5; kNN
k = 1
knn_classifier = knn.KnnClassifier(labels,features)
res = array([knn_classifier.classify(test_features[i],k) for i in range(len(test_labels))])
accuracy
acc = sum(1.0*(res == test_labels)) / len(test_labels)
print('Accuracy:', acc)
print_confusion(res,test_labels,classnames)

二、贝叶斯分类器

除了KNN外另一种简单有效的分类器叫做贝叶斯分类器，这个分类器是一种基于贝叶斯条件概率定理的概率分类器，假设特征是彼此独立不相关的。它可以被非常有效的训练出来，原因在于每一个特征模型都是独立选取的。

尽管贝叶斯分类器很简单，但在实际应用中很有效尤其是对垃圾邮件的过滤，另外，一旦学习了这个模型就没有必要存储训练数据了，只需存储模型参数。

使用高斯概率分布模型的贝叶斯分类器的基本实现：

class BayesClassifier(object):

    def __init__(self):
        """ &#x4F7F;&#x7528;&#x8BAD;&#x7EC3;&#x96C6;&#x521D;&#x59CB;&#x5316;&#x5206;&#x7C7B;&#x5668; """

        self.labels = []    # &#x7C7B;&#x6807;&#x7B7E;
        self.mean = []        # &#x7C7B;&#x5747;&#x503C;
        self.var = []        # &#x7C7B;&#x65B9;&#x5DEE;
        self.n = 0            # &#x7C7B;&#x522B;&#x6570;

    def train(self,data,labels=None):
        """ &#x5728;&#x6570;&#x636E;data&#x4E0A;&#x8BAD;&#x7EC3;&#xFF0C;&#x6807;&#x8BB0;labels&#x662F;&#x53EF;&#x9009;&#x7684;&#xFF0C;&#x9ED8;&#x8BA4;0....n-1 """

        if labels==None:
            labels = range(len(data))
        self.labels = labels
        self.n = len(labels)

        for c in data:
            self.mean.append(mean(c,axis=0))
            self.var.append(var(c,axis=0))

    def classify(self,points):
        """ &#x901A;&#x8FC7;&#x8BA1;&#x7B97;&#x5F97;&#x51FA;&#x7684;&#x6BCF;&#x4E00;&#x7C7B;&#x7684;&#x6982;&#x7387;&#x5BF9;&#x6570;&#x636E;&#x70B9;&#x8FDB;&#x884C;&#x5206;&#x7C7B;&#xFF0C;&#x5E76;&#x8FD4;&#x56DE;&#x6700;&#x53EF;&#x80FD;&#x7684;&#x6807;&#x8BB0; """

        # &#x8BA1;&#x7B97;&#x6BCF;&#x4E00;&#x7C7B;&#x7684;&#x6982;&#x7387;
        est_prob = array([gauss(m,v,points) for m,v in zip(self.mean,self.var)])

        print ('est prob',est_prob.shape,self.labels)
        # get index of highest probability, this gives class label
        ndx = est_prob.argmax(axis=0)

        est_labels = array([self.labels[n] for n in ndx])

        return est_labels, est_prob

模型中的每一个类都含有两个变量，即类均值和协方差。在上面的代码中，train()方法用于获取特征数组列表(每一个门类对应一个特征数组)，并计算每个特征数组的均值和协方差。而classify()方法计算数据点构成的数组的类概率，并选择概率最高的那个类，最终放回预测的类标记及概率值，同时也需要一个高斯辅助函数：

def gauss(m,v,x):
    """ &#x7528;&#x72EC;&#x7ACB;&#x5747;&#x503C;m&#x548C;&#x65B9;&#x5DEE;v&#x8BC4;&#x4F30;d&#x7EF4;&#x9AD8;&#x65AF;&#x5206;&#x5E03; """

    if len(x.shape)==1:
        n,d = 1,x.shape[0]
    else:
        n,d = x.shape

    # &#x534F;&#x65B9;&#x5DEE;&#x77E9;&#x9635;&#xFF0C;&#x51CF;&#x53BB;&#x5747;&#x503C;
    S = diag(1/v)
    x = x-m
    # &#x6982;&#x7387;&#x7684;&#x4E58;&#x79EF;
    y = exp(-0.5*diag(dot(x,dot(S,x.T))))

    # &#x5F52;&#x4E00;&#x5316;&#x5E76;&#x8FD4;&#x56DE;
    return y * (2*pi)**(-d/2.0) / ( sqrt(prod(v)) + 1e-6)

这个函数多用于计算单个告诉分布的乘积，并返回给一定模型m和参数v的概率。

现在使用贝叶斯分类器处理上面使用的二维数据，并训练出一个分类器：

import pickle
from numpy import *
from pylab import *
from PCV.classifiers import bayes
from PCV.tools import imtools

&#x7528;pickle&#x6A21;&#x5757;&#x5728;&#x9014;&#x4E8C;&#x7EF4;&#x6837;&#x672C;&#x70B9;
with open('points_normal.pkl','rb') as f:
    class_1 = pickle.load(f)
    class_2 = pickle.load(f)
    labels = pickle.load(f)
&#x8BAD;&#x7EC3;&#x8D1D;&#x53F6;&#x65AF;&#x5206;&#x7C7B;&#x5668;
bc = bayes.BayesClassifier()
bc.train([class_1, class_2], [1, -1])
pickle&#x6A21;&#x5757;&#x8F7D;&#x5165;&#x6D4B;&#x8BD5;&#x6570;&#x636E;
with open('points_normal_test.pkl','rb') as f:
    class_1 = pickle.load(f)
    class_2 = pickle.load(f)
    labels = pickle.load(f)
&#x5728;&#x67D0;&#x4E9B;&#x6570;&#x636E;&#x70B9;&#x4E0A;&#x8FDB;&#x884C;&#x6D4B;&#x8BD5;
print(bc.classify(class_1[:10])[0])
&#x7ED8;&#x5236;&#x8FD9;&#x4E9B;&#x4E8C;&#x7EF4;&#x6570;&#x636E;&#x70B9;&#x53CA;&#x51B3;&#x7B56;&#x8FB9;&#x754C;
def classify(x,y,bc=bc):
    points = vstack((x,y))
    return bc.classify(points.T)[0]
imtools.plot_2D_boundary([-6,6,-6,6],[class_1,class_2],classify,[1,-1])
show()

输出结果如下图，该脚本将前10个二维数据点的分类结果打印输出到控制台。

使用PCA降维

由于稠密SIFT描述子的特征向量非常庞大，用数据拟合模型进行降维处理就是一个很好的处理方法了。PCA非常适合用于降维处理。下面是利用pca.py进行的PCA降维处理代码：

features, labels = read_gesture_features_labels('D:\\picture\\train\\')
test_features, test_labels = read_gesture_features_labels('D:\\picture\\test\\')
classnames = unique(labels)

V, S, m = pca.pca(features)
&#x4FDD;&#x6301;&#x6700;&#x91CD;&#x8981;&#x7684;&#x6210;&#x5206;
V = V[:50]
features = array([dot(V, f - m) for f in features])
test_features = array([dot(V, f - m) for f in test_features])

&#x6D4B;&#x8BD5;&#x8D1D;&#x53F6;&#x65AF;&#x5206;&#x7C7B;&#x5668;
bc = bayes.BayesClassifier()
blist = [features[where(labels == c)[0]] for c in classnames]

bc.train(blist, classnames)
res = bc.classify(test_features)[0]
acc = sum(1.0 * (res == test_labels)) / len(test_labels)
print('Accuracy:', acc)
print_confusion(res, test_labels, classnames)

三、支持向量机

SVM是一类强大的分类器，可以在很多分类问题中给出出现有水准很高的分类结果，最简单的SVM通过在高维空间中寻找一个最优线性分类面，并尽可能的将两类数据分开。

对于特征向量x的决策函数：

w是常规超平面，b是偏移量常数。函数的月阈值为0，能够很好地将两类数据分开，使其一类为正数，另一类为负数。通过在训练集上求解带有标记的特征向量的最优化问题，使得超平面在两类间具有最大分开间隔，从而找到上面决策函数中的参数w和b。决策函数的常规解是训练集上某些特征向量的线性组合：

所以决策函数又可以写成：

i是从训练集中选出的部分样本，这个样本称为支持向量。

SVM的一个优势是可以使用核函数，该函数能够将特征向量映射到另一个不同维度的空间中，比如说高维度空间。使用核函数映射可以很有效的解决非线性或者很难的分类问题。

常见的核函数：

1、线性是最简单的情况，即在特征空间中的超平面是线性的，

2、多项式用次数为d的多项式对特征进行映射，

3、径向基函数，通常指数函数是一种极其有效的选择，

4、Sigmoid函数，一个光滑的超平面替代方案，

3.1 使用LibSVM

LibSVM是最好的、使用最为广泛的SVM实现工具包，可以在https://www.lfd.uci.edu/~gohlke/pythonlibs/#libsvm中下在对应版本的whl文件通过pip install文件名的指令进行安装。

下面为LibSVM在二维样本数据点上的运行：

import pickle
from libsvm.svmutil import *
from PCV.tools import imtools

&#x7528;pickle&#x6A21;&#x5757;&#x5728;&#x9014;&#x4E8C;&#x7EF4;&#x6837;&#x672C;&#x70B9;
with open('points_normal.pkl','rb') as f:
    class_1 = pickle.load(f)
    class_2 = pickle.load(f)
    labels = pickle.load(f)

&#x8F6C;&#x5316;&#x6210;&#x5217;&#x8868;&#xFF0C;&#x4FBF;&#x4E8E;&#x4F7F;&#x7528;LibSVM
class_1 = list(map(list, class_1))
class_2 = list(map(list, class_2))
labels = list(labels)
samples = class_1 + class_2  # &#x8FDE;&#x63A5;&#x4E24;&#x4E2A;&#x5217;&#x8868;
&#x521B;&#x5EFA;SVM
prob = svm_problem(labels,samples)
param = svm_parameter('-t 2')
&#x5728;&#x6570;&#x636E;&#x4E0A;&#x8BAD;&#x7EC3;SVM
m = svm_train(prob,param)
&#x5728;&#x6570;&#x636E;&#x4E0A;&#x5206;&#x7C7B;&#x6548;&#x679C;&#x5982;&#x4F55;
res = svm_predict(labels,samples,m)

使用的是径向基函数训练SVM分类器。以下为得到的结果。

不同于前面的例子，这里再载入数据集后要将数组转换成列表，这是因为LibSVM不支持数组对象的输入，使用使用了内建函数map()进行转换，map()函数中用到了对角一个元素都会进行转换的list()函数。创建svm_problem对象，并为期设置一些参数，调用svm_train()求解该优化问题用以确定模型参数，之后就对其进行预测。

下面是核函数类型的介绍：

载入其他数据集进行测试：

import pickle

from pylab import *
from numpy import *
from libsvm.svmutil import *
from PCV.tools import imtools

&#x7528;pickle&#x6A21;&#x5757;&#x5728;&#x9014;&#x4E8C;&#x7EF4;&#x6837;&#x672C;&#x70B9;
with open('points_normal_test.pkl','rb') as f:
    class_1 = pickle.load(f)
    class_2 = pickle.load(f)
    labels = pickle.load(f)

&#x8F6C;&#x5316;&#x6210;&#x5217;&#x8868;&#xFF0C;&#x4FBF;&#x4E8E;&#x4F7F;&#x7528;LibSVM
class_1 = list(map(list, class_1))
class_2 = list(map(list, class_2))
labels = list(labels)
samples = class_1 + class_2  # &#x8FDE;&#x63A5;&#x4E24;&#x4E2A;&#x5217;&#x8868;
&#x521B;&#x5EFA;SVM
prob = svm_problem(labels,samples)
param = svm_parameter('-t 2')
&#x5728;&#x6570;&#x636E;&#x4E0A;&#x8BAD;&#x7EC3;SVM
m = svm_train(prob,param)

&#x5B9A;&#x4E49;&#x7ED8;&#x5236;&#x51FD;&#x6570;
def predict(x,y,model=m):
    return array(svm_predict([0]*len(x),list(zip(x,y)),model)[0])

&#x7ED8;&#x5236;&#x5206;&#x7C7B;&#x8FB9;&#x754C;
imtools.plot_2D_boundary([-6,6,-6,6],[array(class_1),array(class_2)],predict,[-1,1])
show()

结果如下图所示，显示了两个不同数据集在二维平面上的分布情况

要注意的是：

书中给出的代码中：

return array(svm_predict([0]*len(x),zip(x,y),model)[0])

在运行后会报出：

TypeError: type of x:

这里要对zip函数添加限制，将其转换为list()

return array(svm_predict([0]*len(x),list(zip(x,y)),model)[0])

此时就能成功运行了。

四、光学字符识别

OCR(光学字符识别)是一个理解手写或机写文本图像的处理过程，常见的例子九三通过扫码文件来提取文本。

4.1 训练分类器

对于这类分类问题，有10个类：数字1…9，以及一些什么也没有的单元格。给定没有东西的单元格类标号为0，则所有类标号是0-9。

4.2 选取特征

首先确定选取怎样的特征向量来表示每一个单元格里的图像。这里将会用一些简单而有效的特征。输入一个特征，使用如下函数使得返回一个拉成一组数组后的灰度值特征向量：

def scipy_misc_imresize(arr, size, interp='bilinear', mode=None):
   im = Image.fromarray(arr, mode=mode)
   ts = type(size)
   if np.issubdtype(ts, np.signedinteger):
      percent = size / 100.0
      size = tuple((np.array(im.size)*percent).astype(int))
   elif np.issubdtype(type(size), np.floating):
      size = tuple((np.array(im.size)*size).astype(int))
   else:
      size = (size[1], size[0])
   func = {'nearest': 0, 'lanczos': 1, 'bilinear': 2, 'bicubic': 3, 'cubic': 3}
   imnew = im.resize(size, resample=func[interp]) # &#x8C03;&#x7528;PIL&#x5E93;&#x4E2D;&#x7684;resize&#x51FD;&#x6570;
   return np.array(imnew)

def compute_feature(im):
    """ &#x5BF9;&#x4E00;&#x4E2A;ocr&#x56FE;&#x50CF;&#x5757;&#x8FD4;&#x56DE;&#x4E00;&#x4E2A;&#x7279;&#x5F81;&#x5411;&#x91CF; """
    # &#x8C03;&#x6574;&#x5927;&#x5C0F;&#x5E76;&#x53BB;&#x9664;&#x8FB9;&#x754C;
    norm_im = scipy_misc_imresize(im, (30,30))
    norm_im = norm_im[3:-3,3:-3]
    return norm_im.flatten()

imresize()用于减少特征向量的长度。接下来用函数训练数据：

def load_ocr_data(path):
    """ &#x8FD4;&#x56DE;&#x8DEF;&#x5F84;&#x4E2D;&#x6240;&#x6709;&#x56FE;&#x50CF;&#x7684;&#x6807;&#x8BB0;&#x53CA;OCR&#x7279;&#x5F81; """
    # &#x5BF9;&#x4EE5;.jpg&#x4E3A;&#x540E;&#x7F00;&#x7684;&#x6240;&#x6709;&#x6587;&#x4EF6;&#x521B;&#x5EFA;&#x4E00;&#x4E2A;&#x5217;&#x8868;
    imlist = [os.path.join(path, f) for f in os.listdir(path) if f.endswith('.jpg')]
    # &#x521B;&#x5EFA;&#x6807;&#x8BB0;
    labels = [int(imfile.split('\\')[-1][0]) for imfile in imlist]
    # &#x4ECE;&#x56FE;&#x50CF;&#x4E2D;&#x521B;&#x5EFA;&#x7279;&#x5F81;
    features = []
    for imname in imlist:
        im = array(Image.open(imname).convert('L'))
        features.append(compute_feature(im))
    return array(features), labels

该函数是将每个jpeg文件的文件名的第一个字母提取出来做类标记，并将其作为整形数据存储在labels列表里。

4.3 多类支持向量机

得到训练数据后，学习一个分类器，这里使用多类支持向量机。

from pylab import *
import numpy as np
from PIL import Image
from libsvm.svmutil import *
from PCV.tools import imtools
import os
def scipy_misc_imresize(arr, size, interp='bilinear', mode=None):
   im = Image.fromarray(arr, mode=mode)
   ts = type(size)
   if np.issubdtype(ts, np.signedinteger):
      percent = size / 100.0
      size = tuple((np.array(im.size)*percent).astype(int))
   elif np.issubdtype(type(size), np.floating):
      size = tuple((np.array(im.size)*size).astype(int))
   else:
      size = (size[1], size[0])
   func = {'nearest': 0, 'lanczos': 1, 'bilinear': 2, 'bicubic': 3, 'cubic': 3}
   imnew = im.resize(size, resample=func[interp]) # &#x8C03;&#x7528;PIL&#x5E93;&#x4E2D;&#x7684;resize&#x51FD;&#x6570;
   return np.array(imnew)

def compute_feature(im):
    """ &#x5BF9;&#x4E00;&#x4E2A;ocr&#x56FE;&#x50CF;&#x5757;&#x8FD4;&#x56DE;&#x4E00;&#x4E2A;&#x7279;&#x5F81;&#x5411;&#x91CF; """
    # &#x8C03;&#x6574;&#x5927;&#x5C0F;&#x5E76;&#x53BB;&#x9664;&#x8FB9;&#x754C;
    norm_im = scipy_misc_imresize(im, (30,30))
    norm_im = norm_im[3:-3,3:-3]
    return norm_im.flatten()

def load_ocr_data(path):
    """ &#x8FD4;&#x56DE;&#x8DEF;&#x5F84;&#x4E2D;&#x6240;&#x6709;&#x56FE;&#x50CF;&#x7684;&#x6807;&#x8BB0;&#x53CA;OCR&#x7279;&#x5F81; """
    # &#x5BF9;&#x4EE5;.jpg&#x4E3A;&#x540E;&#x7F00;&#x7684;&#x6240;&#x6709;&#x6587;&#x4EF6;&#x521B;&#x5EFA;&#x4E00;&#x4E2A;&#x5217;&#x8868;
    imlist = [os.path.join(path, f) for f in os.listdir(path) if f.endswith('.jpg')]
    # &#x521B;&#x5EFA;&#x6807;&#x8BB0;
    labels = [int(imfile.split('\\')[-1][0]) for imfile in imlist]
    # &#x4ECE;&#x56FE;&#x50CF;&#x4E2D;&#x521B;&#x5EFA;&#x7279;&#x5F81;
    features = []
    for imname in imlist:
        im = array(Image.open(imname).convert('L'))
        features.append(compute_feature(im))
    return array(features), labels
&#x8BAD;&#x7EC3;&#x6570;&#x636E;
features, labels = load_ocr_data('D:\\BaiduNetdiskDownload\\PCV-book-data\\data\\sudoku_images\\sudoku_images\\ocr_data\\training\\')
&#x6D4B;&#x8BD5;&#x6570;&#x636E;
test_features, test_labels = load_ocr_data('D:\\BaiduNetdiskDownload\\PCV-book-data\\data\\sudoku_images\\sudoku_images\\ocr_data\\testing\\')
&#x8BAD;&#x7EC3;&#x4E00;&#x4E2A;&#x7EBF;&#x6027;SVM&#x5206;&#x7C7B;&#x5668;
features = list(map(list, features))
test_features = map(list, test_labels)
prob = svm_problem(labels, features)
param = svm_parameter('-t 0')
m = svm_train(prob, param)
res = svm_predict(labels, features, m)
res = svm_predict(test_labels, test_features, m)

代码会训练出一个线性SVM分类器，并在测试集上对该分类器的性能进行测试，理论上可以输出结果:

不过在运行后却出现了报错：

目前还不知道如何处理，有待进一步理解。

Original: https://blog.csdn.net/jgq1466693/article/details/126358565
Author: jgq1466693
Title: python计算机视觉学习第8章——图像内容分类

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/662384/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Python之字符串

雾都之菜魚与Python恋爱的第三天 “字符串” 一、什么是字符串（大家好！！！我是菜魚，在与Python恋爱的第二天我有浅浅的提到什么是字符串今天呢我将详…

人工智能 2023年7月5日
0062
MVSNet代码复现问题解决、cuBlas call failed status=13问题

简介这篇文章记录复现MVSNet中遇到的一些问题。最近在复现 MVSNet 的代码，是一篇2018年的论文，使用的是tensorflow-gpu>=1.5的代码源码中是…

人工智能 2023年5月25日
00102
微信支付APIv3

文章目录微信支付 * 之前我的密钥啥的都是放到配置文件里面以后可以再写一个文件基础支付APIv3介绍获取验签和HttpClient – APIv3证书与密钥使用说…

人工智能 2023年5月30日
00117
[面向对象与多线程综合实验]数据挖掘系统

Spring-_-Bear 的 CSDN 博客导航文章目录一、快速开始二、系统简介三、需求分析四、任务分配五、功能要求六、项目结构七、效果展示 * 7.1 用户注册…

人工智能 2023年7月17日
0080
目标检测基础知识（1）–目标检测任务描述

本文是目标检测基础知识相关的第1次学习记录，主要包括目标检测的任务描述，目标检测的常用算法。在目标检测工程中，主要的项目结构包括三层，分别是数据采集层、深度模型层、用户层，这三个…

人工智能 2023年7月12日
0099
【车牌识别】基于matlab GUI汽车出入库收费系统（带面板）【含Matlab源码 735期】

⛄一、车牌识别简介摘要：为改进车牌识别的精确度，在 MATLAB 平台下通过 GUI 图形用户界面，调用相应算子与算法对图像进行调整与优化。通过对图像进行粗定位、灰度化、倾斜矫…

人工智能 2023年5月25日
0086
win11部署Torch，tf-GPU环境（复现文章Requests）

需求1：在win11指定文件夹中安装torch环境，默认已经安装 Anaconda3，可以使用conda指令1.在指定文件夹下进入cmd（或在CMD中CD到指定文件夹）2.在C…

人工智能 2023年5月25日
00148
21句话入门机器学习

这是一篇关于机器学习工具包Scikit-learn的入门级读物。对于程序员来说，机器学习的重要性毋庸赘言。也许你还没有开始，也许曾经失败过，都没有关系，你将在这里找到或者重拾自信。…

人工智能 2023年5月31日
00120
基于YOLOv5-v6.2全新版本模型构建自己的图像识别模型超详细教程

不得不说YOLOv5的作者真的是强，更新的频率也是真的很高了，就在前天刚刚发布了最新版本的YOLOv5模型，分支命名为YOLOv5-6.2，与上一版本6.1不同的是这次6.2最大的…

人工智能 2023年7月22日
00173
Python数据分析-绘图-2-Seaborn进阶绘图-4-分类图

一、分类散点图 1.stripplot 函数：seaborn.stripplot 常用参数： x,y,hue接收data中的变量名，表示选入的绘图变量，hue传入分类变量，以对颜色…

人工智能 2023年7月2日
0094
C语言习题练习4–函数递归

1.接受一个整型值（无符号），按照顺序打印它的每一位。 #include void print(int n) { if (n > 9) { print(n/10); } pr…

人工智能 2023年6月29日
0097
微信原生组件｜基于小程序实现音视频通话

1 微信小程序原生推拉流组件功能简介本文将介绍如何使用微信小程序原生推拉流组件由于微信小程序原生推拉流组件使用起来比较复杂，推荐开发者使用即构封装的音视频SDK 2 实现微信小…

人工智能 2023年6月3日
00183
如何从0到1搭建一个个人网站

前言如何从0到1搭建一个可以外网访问的项目？我就用自己的服务器给大家举例，怎么从0到1搭建一个学生和新手可以用来面试的项目，老手也可以回忆一下自己逝去的青春。服务器在激活的时…

人工智能 2023年6月26日
00111
Anaconda使用清华源安装不同版本的Pytorch

步骤目录 * – + Pytorch版本的选择 + 设置清华源安装Pytorch + 验证我们安装的Pytorch并查看GPU\CPU个数 + 卸载我们安装的Pytor…

人工智能 2023年7月22日
0072
pytorch 多机多卡卡住问题汇总

前言先说一下写这篇文章的动机，事情起因是笔者在使用pytorch进行多机多卡训练的时候，遇到了卡住的问题，登录了相关的多台机器发现GPU利用率均为100%，而且单卡甚至是单机多卡…

人工智能 2023年6月25日
00111
TaxoNN: ensemble of neural networks on stratified microbiome data for disease prediction阅读报告

该文的主要工作作者提出了一种通过肠道微生物组数据来预测疾病状态的技术，该技术使用了一种新的神经网络集成，结合了分层的方式先将OTU根据门分组，然后通过提出的两种新的排序方式tax…

人工智能 2023年5月31日
0094

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

python计算机视觉学习第8章——图像内容分类