聚类算法——KMeans(K-均值)

2023年7月19日下午2:57 • 人工智能 • 阅读 62

聚类的概念

聚类是一种机器学习技术，它涉及到数据点的分组。给定一组数据点，我们可以使用聚类算法将每个数据点划分为一个特定的组。理论上，同一组中的数据点应该具有相似的属性和/或特征，而不同组中的数据点应该具有高度不同的属性和/或特征。聚类是一种无监督学习的方法，是许多领域中常用的统计数据分析技术。

聚类和分类最大的不同在于：分类的目标是事先已知的，而聚类则不一样，聚类事先不知道目标变量是什么，类别没有像分类那样被预先定义出来。这也是聚类存在的意义。

聚类的过程

数据准备：包括 特征标准化和降维；
特征选择：从最初的特征中选择最有效的特征,并将其存储于向量中；
特征提取：通过对所选择的特征进行转换形成新的突出特征；
聚类(或分组)：首先选择合适特征类型的某种距离函数(或构造新的距离函数)进行接近程度的度量，而后执行聚类或分组；
聚类结果评估：是指对聚类结果进行评估，评估主要有3种：外部有效性评估、内部有效性评估和相关性测试评估。

良好聚类算法的特征

良好的可伸缩性
处理不同类型数据的能力
处理噪声数据的能力
对样本顺序的不敏感性
约束条件下的表现
易解释性和易用性

聚类分析的要求

不同的聚类算法有不同的应用背景，有的适合于大数据集，可以发现任意形状的聚簇；有的算法思想简单，适用于小数据集。总的来说，数据挖掘中针对聚类的典型要求包括：

（1）可伸缩性： 当数据量从几百上升到几百万时，聚类结果的准确度能一致。
（2） 处理不同类型属性的能力：许多算法针对的数值类型的数据。但是，实际应用场景中，会遇到二元类型数据，分类/标称类型数据，序数型数据。
（3）发现任意形状的类簇：许多聚类算法基于距离（欧式距离或曼哈顿距离）来量化对象之间的相似度。基于这种方式，我们往往只能发现相似尺寸和密度的球状类簇或者凸型类簇。但是，实际中类簇的形状可能是任意的。
（4）初始化参数的需求最小化：很多算法需要用户提供一定个数的初始参数，比如期望的类簇个数，类簇初始中心点的设定。 聚类的结果对这些参数十分敏感，调参数需要大量的人力负担，也非常影响聚类结果的准确性。
（5）处理噪声数据的能力： 噪声数据通常可以理解为影响聚类结果的干扰数据，包含孤立点，错误数据等，一些算法对这些噪声数据非常敏感，会导致低质量的聚类。
（6）增量聚类和对输入次序的不敏感：一些算法不能将新加入的数据快速插入到已有的聚类结果中，还有一些算法针对不同次序的数据输入，产生的聚类结果差异很大。
（7）高维性：有些算法只能处理2到3维的低纬度数据，而处理高维数据的能力很弱， 高维空间中的数据分布十分稀疏，且高度倾斜。
（8）可解释性和可用性：我们希望得到的聚类结果都能用特定的语义、知识进行解释，和实际的应用场景相联系。

聚类的分类

基于划分的聚类(k‐均值算法、k‐medoids算法、k‐prototype算法)
基于层次的聚类
基于密度的聚类(DBSCAN算法、OPTICS算法、DENCLUE算法)
基于网格的聚类
基于模型的聚类(模糊聚类、Kohonen神经网络聚类)

下面以K-均值聚类算法为例：

KMeans

聚类算法有很多种（几十种），K-Means是聚类算法中的最常用的一种，算法最大的特点是简单，好理解，运算速度快，但是 只能应用于连续型的数据，并且一定要在聚类前需要手工指定要分成几类

上面两张图应该很好理解

注意问题

K如何确定
kmenas算法 首先选择K个初始质心，其中K是用户指定的参数，即所期望的簇的个数。这样做的前提是我们已经知道数据集中包含多少个簇，但很多情况下，我们并不知道数据的分布情况，实际上聚类就是我们发现数据分布的一种手段，这就陷入了鸡和蛋的矛盾。如何有效的确定K值，这里大致提供几种方法，若各位有更好的方法，欢迎探讨。

1. 与层次聚类结合
经常会产生较好的聚类结果的一个有趣策略是，首先采用层次凝聚算法决定结果粗的数目，并找到一个初始聚类，然后用迭代重定位来改进该聚类。

2. 稳定性方法
稳定性方法对一个数据集进行2次重采样产生2个数据子集，再用相同的聚类算法对2个数据子集进行聚类，产生2个具有k个聚类的聚类结果，计算2个聚类结果的相似度的分布情况。2个聚类结果具有高的相似度说明k个聚类反映了稳定的聚类结构，其相似度可以用来估计聚类个数。采用次方法试探多个k，找到合适的k值

API

double cv::kmeans(
    InputArray data,
    int K,
    InputOutputArray bestLabels,
    TermCriteria criteria,
    int attempts,
    int flags,
    OutputArray centers = noArray()
)

参数说明

data

待聚类的数据集，数据集的每一个样本是一个N维的点，点坐标都是float型的，例如：有m个样本，每个样本有n个维度，那data的格式就为cv::Mat dataSet(m,n,CV_32F)
K

聚类数，即要把数据集聚成k类
bestLabels

存储data中每一个样本的标签，数据类型为int型
criteria

opencv中
迭代算法的终止条件

，例如迭代的次数限制，或者迭代的精度达到要求时，算法迭代终止
attempts

使用不同的初始聚类中心执行算法的次数
flags

cv::KmeansFlags见下表，选择
聚类中心的初始化方式 centers

集群中心输出矩阵，每个集群中心一行

. cv::KmeansFlags

KMEANS_RANDOM_CENTERS在每次尝试中选择随机的初始中心KMEANS_PP_CENTERSUse kmeans++ center initialization by Arthur and Vassilvitskii [Arthur2007].KMEANS_USE_INITIAL_LABELS

在第一次(可能是唯一一次)尝试中，使用用户提供的标签，而不是从初始中心计算它们。对于第二次和以后的尝试，使用随机或半随机中心。使用KMEANS_*_CENTERS标志之一来指定确切的方法

利用OpenCV 的 API 实现

#include <opencv2 opencv.hpp>
#include <iostream>
using namespace cv;
using namespace std;
int main()
{
    Mat src = imread("tahiti.jpg");
    Mat img(500, 500, CV_8UC3);
    RNG rng(12345);
    Scalar colorTab[] = {
        Scalar(30,30,240),
        Scalar(240, 30, 30),
        Scalar(30, 240, 30),
        Scalar(240, 240, 30),
        Scalar(30,240,240)
    };
    int numCluster = rng.uniform(2, 5);
    cout << "number of clusters: " << numCluster << endl;
    int sampleCount = rng.uniform(5, 1000);
    Mat points(sampleCount, 1, CV_32FC2);
    Mat labels, centers;

    // &#x751F;&#x6210;&#x968F;&#x673A;&#x6570;
    for (int k = 0; k < numCluster; k++)
    {
        Point center;
        center.x = rng.uniform(0, img.cols);
        center.y = rng.uniform(0, img.rows);
        Mat pointChunk = points.rowRange(k * sampleCount / numCluster, k == numCluster - 1 ? sampleCount: (k + 1) * sampleCount / numCluster);
        rng.fill(pointChunk, RNG::NORMAL, Scalar(center.x, center.y), Scalar(img.cols * 0.05, img.rows * 0.05));
    }
    randShuffle(points, 1, &rng);  // &#x968F;&#x673A;&#x5316;&#x51FD;&#x6570;

    // &#x4F7F;&#x7528;kmeans
    kmeans(points, numCluster, labels, TermCriteria(TermCriteria::EPS+TermCriteria::COUNT,10,0.1),3,KMEANS_PP_CENTERS,centers);  // TermCriteria&#x662F;&#x8FED;&#x4EE3;&#x7EC8;&#x6B62;&#x51FD;&#x6570;

    // &#x7528;&#x4E0D;&#x540C;&#x989C;&#x8272;&#x663E;&#x793A;&#x5206;&#x7C7B;
    img = Scalar::all(255);
    for (int i = 0; i < sampleCount; i++)
    {
        int index = labels.at<int>(i);
        Point p = points.at<point2f>(i);
        circle(img, p, 2, colorTab[index],-1,8);
    }
    for (int i = 0; i < centers.rows; i++)
    {
        int x = centers.at<float>(i, 0);
        int y = centers.at<float>(i, 1);
        cout << "c.x = "<< x << "c.y" << y << endl;
        circle(img, Point(x, y), 40, colorTab[i], 1, LINE_AA);
    }
    imshow("KMeans-Data", img);

    waitKey(0);
    return 0;
}</float></float></point2f></int></iostream></opencv2>

导入的原图：

实现效果：

利用KMeans聚类算法实现用颜色进行图像分割

#include <opencv2 opencv.hpp>
#include <iostream>
using namespace cv;
using namespace std;
int main()
{
    Scalar colorTab[] = {
        Scalar(30,30,240),
        Scalar(240, 30, 30),
        Scalar(30, 240, 30),
        Scalar(240, 240, 30),
        Scalar(30,240,240)
    };
    Mat src = imread("tahiti.jpg");
    if (src.empty())
    {
        cout << "could not load image\n";
        return -1;
    }
    namedWindow("input image", WINDOW_AUTOSIZE);
    imshow("&#x539F;&#x56FE;", src);

    int width = src.cols;
    int height = src.rows;
    int dims = src.channels();

    // &#x521D;&#x59CB;&#x5316;&#x5B9A;&#x4E49;
    int sampleCount = width * height;
    int clusterCount = 4;
    Mat points(sampleCount, dims, CV_32F, Scalar(10));
    Mat labels;
    Mat centers(clusterCount, 1, points.type());

    // RGB &#x6570;&#x636E;&#x8F6C;&#x6362;&#x5230;&#x6837;&#x672C;&#x6570;&#x636E;

    for (int row = 0; row < height; row++)
    {
        for (int col = 0; col < width; col++)
        {
            int index = row * width + col;
            Vec3b bgr = src.at<vec3b>(row, col);
            points.at<float>(index, 0) = static_cast<int>(bgr(0));
            points.at<float>(index, 0) = static_cast<int>(bgr(1));
            points.at<float>(index, 0) = static_cast<int>(bgr(2));
        }
    }

    // &#x8FD0;&#x884C;K-means
    TermCriteria criteria = TermCriteria(TermCriteria::EPS + TermCriteria::COUNT, 10, 0.1);
    kmeans(points, clusterCount, labels, criteria, 3, KMEANS_PP_CENTERS, centers);

    // &#x663E;&#x793A;&#x56FE;&#x50CF;&#x5206;&#x5272;&#x7ED3;&#x679C;
    Mat result = Mat::zeros(src.size(), src.type());
    for (int row = 0; row < height; row++)
    {
        for (int col = 0; col < width; col++)
        {
            int index = row * width + col;
            int label = labels.at<int>(index, 0);
            result.at<vec3b>(row, col)[0] = colorTab[label](0);
            result.at<vec3b>(row, col)[1] = colorTab[label](1);
            result.at<vec3b>(row, col)[2] = colorTab[label](2);
        }
    }
    imshow("output", result);
    waitKey(0);
    return 0;
}</vec3b></vec3b></vec3b></int></int></float></int></float></int></float></vec3b></iostream></opencv2>

用C++ 实现KMeans

(我只能说我看不懂)

#include<iostream>
#include<graphics.h>
#include<cmath>
#include<cstdlib>
#include<easyx.h>
#include<vector>
using namespace std;

//&#x968F;&#x673A;&#x751F;&#x6210;&#x7684;&#x70B9;&#x7684;&#x6570;&#x76EE;
#define POINT_NUM 8000
//&#x7A97;&#x53E3;&#x7684;&#x5927;&#x5C0F;
#define WIDTH 600
#define HEIGHT 600

struct point
{
    double x;          //&#x8BE5;&#x70B9;&#x7684;X&#x5750;&#x6807;
    double y;        //&#x8BE5;&#x70B9;&#x7684;Y&#x5750;&#x6807;
    int cluster;     //&#x8BE5;&#x5E97;&#x6240;&#x5C5E;&#x805A;&#x7C7B;&#x7684;&#x7D22;&#x5F15;
};
/**
    &#x7ED8;&#x5236;&#x6BCF;&#x4E2A;&#x805A;&#x7C7B;&#x6240;&#x7528;&#x7684;&#x989C;&#x8272;
**/
COLORREF color[15]=
{
    WHITE,YELLOW,RED,BLUE,GREEN,
    BROWN,LIGHTCYAN,MAGENTA,LIGHTRED,
    CYAN,LIGHTBLUE,LIGHTGREEN, DARKGRAY,
    LIGHTMAGENTA,LIGHTGRAY,
};

//&#x521D;&#x59CB;&#x5316;&#x805A;&#x7C7B;&#x70B9;
void initCluster(vector<struct point*>& pointList,int num);

//&#x968F;&#x673A;&#x751F;&#x6210;&#x805A;&#x7C7B;&#x4E2D;&#x5FC3;
void generateCenter(vector<struct point*>& center,int Num);

//&#x753B;&#x51FA;&#x6240;&#x6709;&#x7684;&#x70B9;
void drawCluster(vector<struct point*>& pointList);

//&#x83B7;&#x5F97;&#x4E00;&#x4E2A;&#x805A;&#x7C7B;&#x7684;&#x4E2D;&#x5FC3;
struct point* getCenter(vector<struct point*>& cluster);

//&#x83B7;&#x5F97;&#x4E24;&#x70B9;&#x4E4B;&#x95F4;&#x7684;&#x6B27;&#x5F0F;&#x8DDD;&#x79BB;
double getDistance(struct point* pt1,struct point* pt2);

//&#x83B7;&#x5F97;&#x8BE5;&#x70B9;&#x6240;&#x5C5E;&#x7684;&#x805A;&#x7C7B;&#x7684;&#x7D22;&#x5F15;
int getNearestCluster(vector<struct point*>& center,struct point* tempPoint);
//&#x8FDB;&#x884C;&#x8FED;&#x4EE3;
void iteration(vector<struct point*>& pointList,vector<struct point*>& center,int iterNum,int Knum);
//&#x66F4;&#x65B0;&#x805A;&#x7C7B;&#x4E2D;&#x5FC3;
void updateCenter(vector<struct point*>& pointList,vector<struct point*>& center,int num);
//&#x5355;&#x72EC;&#x753B;&#x51FA;&#x6BCF;&#x4E2A;&#x805A;&#x7C7B;&#x7684;&#x4E2D;&#x5FC3;
void drawCenter(vector<struct point*>& center);

int main()
{
    //&#x7528;&#x6765;&#x5B58;&#x653E;&#x8FD9;&#x4E9B;&#x70B9;&#x7684;&#x5750;&#x6807;
    vector<struct point*> pointList;

    //&#x7528;&#x4E8E;&#x5B58;&#x50A8;&#x805A;&#x7C7B;&#x7684;&#x4E2D;&#x5FC3;
    vector<struct point*> center;

    //&#x805A;&#x7C7B;&#x7684;&#x6570;&#x76EE;
    int Knum;
    int iteratorNum;        //&#x8FED;&#x4EE3;&#x6B21;&#x6570;
    cout<<"please input the k number"<<endl; cin>>Knum;
    cout<<"please input the iteratornum number"<<endl; cin>>iteratorNum;
    initgraph(WIDTH,HEIGHT,SHOWCONSOLE);
    setbkcolor(BLACK);
    cleardevice();

    //&#x521D;&#x59CB;&#x5316;&#x79CD;&#x7FA4;
    initCluster(pointList,POINT_NUM);
    //&#x968F;&#x673A;&#x751F;&#x6210;&#x805A;&#x7C7B;&#x4E2D;&#x5FC3;
    generateCenter(center,Knum);

    //&#x8FED;&#x4EE3;&#x5904;&#x7406;
    iteration(pointList,center,iteratorNum,Knum);

    //&#x753B;&#x51FA;&#x6240;&#x6709;&#x7684;&#x70B9;
    drawCluster(pointList);
    drawCenter(center);
    system("pause");
    closegraph();
    return 0;
}

/**
    &#x968F;&#x673A;&#x751F;&#x6210;&#x79CD;&#x5B50;&#x70B9;
**/
void initCluster(vector<struct point*>& pointList,int num)
{
    cout<<"************************************"<<endl; cout<<" init cluster "<<endl; for(int num="0;num<POINT_NUM;num++)" { struct point* temppoint="new" point; temppoint->x=rand()%WIDTH;
        tempPoint->y=rand()%HEIGHT;
        pointList.push_back(tempPoint);
    }
    cout<<"************************************"<<endl; } ** 这个是最终的绘图函数 void drawcluster(vector<struct point*>& pointList)
{
    cout<<"***********************************"<<endl; cout<<" draw cluster"<<endl; for(vector<struct point*>::iterator it=pointList.begin();it!=pointList.end();it++)
    {
        setfillcolor(color[(*it)->cluster]);
        bar((int)(*it)->x,(int)(*it)->y,(int)(*it)->x+2,(int)(*it)->y+2);
    }
    cout<<"***********************************"<<endl; } ** 初始化聚类中心 void generatecenter(vector<struct point*>& center,int Num)
{
    cout<<"************************************"<<endl; cout<<" generate cluster center "<<endl; for(int i="0;i<Num;i++)" { struct point* tempcenter="new" point; tempcenter->x = rand()%WIDTH;
        tempCenter->y = rand()%HEIGHT;
        center.push_back(tempCenter);
    }
    for(vector<struct point*>::iterator it=center.begin();it!=center.end();it++)
    {
        cout<<"x "<<(*it)->x<<" y "<<(*it)->y<<endl; } cout<<"************************************"<<endl; ** * 使用均值求得一个点群的中心 struct point* getcenter(vector<struct>& cluster)
{
    double x=0;
    double y=0;
    struct point* tempCenter=new point;
    for(vector<struct point*>::iterator it=cluster.begin();it!=cluster.end();it++)
    {
        x+=(*it)->x;
        y+=(*it)->y;
    }
    tempCenter->x = x/cluster.size();
    tempCenter->y = y/cluster.size();
    return tempCenter;
}

/**
*&#x5F97;&#x5230;&#x4E00;&#x4E2A;&#x70B9;&#x6240;&#x5C5E;&#x7684;&#x805A;&#x7C7B;&#x7684;&#x7D22;&#x5F15;
**/
int getNearestCluster(vector<struct point*>& center,struct point* tempPoint)
{
    //&#x7B2C;&#x4E00;&#x4E2A;&#x70B9;&#x548C;&#x4E2D;&#x5FC3;&#x7684;&#x4E00;&#x4E2A;&#x70B9;&#x4E4B;&#x95F4;&#x7684;&#x5750;&#x6807;
    vector<struct point*>::iterator it=center.begin();
    double  min =getDistance(tempPoint,*it);
    int index=0;
    double dist;
    for(int i=0;it!=center.end();it++,i++)
    {
        dist=getDistance(tempPoint,*it);
        if(dist<min) { 只有出现更近的点时才会出现 min="dist;" index="i;" } return index; ** 返回两个坐标点之间的欧式距离 double getdistance(struct point* pt1,struct pt2) deltax="pt1-">x - pt2->x;
    double deltaY=pt1->y - pt2->y;
    return sqrt(deltaX*deltaX+deltaY*deltaY);
}

/**
* &#x8FED;&#x4EE3;&#x5904;&#x7406;
**/
void iteration(vector<struct point*>& pointList,vector<struct point*>& center,int itNum,int Knum)
{
    int iterNum=0;
    //&#x8FED;&#x4EE3;&#x7684;&#x6B21;&#x6570;
    while(iterNum++<itnum) { cout<<"第 "<<iternum-1<<" 次迭代"<<endl; 找到每个聚类的中心 for(vector<struct point*>::iterator it=pointList.begin();it!=pointList.end();it++)
        {
            int index=getNearestCluster(center,*it);
            (*it)->cluster = index;
        }
        //&#x66F4;&#x65B0;&#x805A;&#x7C7B;&#x7684;&#x4E2D;&#x5FC3;
        updateCenter(pointList,center,Knum);
    }
}

/**
*&#x7136;&#x540E;&#x5F97;&#x5230;]&#x6BCF;&#x4E2A;&#x805A;&#x7C7B;&#x7684;&#x4E2D;&#x5FC3;
**/
void updateCenter(vector<struct point*>& pointList,vector<struct point*>& center,int num)
{
    //&#x6E05;&#x7A7A;&#x4EE5;&#x524D;&#x7684;&#x4E2D;&#x5FC3;
    center.clear();
    double x;
    double y;
    int pointNumber;
    int count=0;
    //&#x5F97;&#x5230;&#x6BCF;&#x4E2A;&#x805A;&#x7C7B;&#x7684;&#x4E2D;&#x5FC3;
    while(count<num) { x="0;" y="0;" pointnumber="0;" for(vector<struct point*>::iterator it=pointList.begin();it!=pointList.end();it++)
        {
            if((*it)->cluster==count)
            {
                x+=(*it)->x;
                y+=(*it)->y;
                pointNumber++;
            }
        }
        struct point* tempCenter= new point;
        tempCenter->x = x/pointNumber;
        tempCenter->y = y/pointNumber;
        center.push_back(tempCenter);
        count++;
    }
}
/**
    &#x5728;&#x7A97;&#x53E3;&#x4E0A;&#x7ED8;&#x5236;&#x805A;&#x7C7B;&#x7684;&#x4E2D;&#x5FC3;
**/
void drawCenter(vector<struct point*>& center)
{
    cout<<"***********************************"<<endl; cout<<" draw center"<<endl; for(vector<struct point*>::iterator it=center.begin();it!=center.end();it++)
    {
        setfillcolor(WHITE);
        fillcircle((int)(*it)->x,(int)(*it)->y,3);
    }
    cout<<"***********************************"<<endl; }< code></"***********************************"<<endl;></"***********************************"<<endl;></struct></num)></struct></struct></itnum)></struct></struct></min)></struct></struct></struct></endl;></"></"x></struct></"************************************"<<endl;></"***********************************"<<endl;></"***********************************"<<endl;></"************************************"<<endl;></"************************************"<<endl;></struct></"please></"please></struct></struct></struct></struct></struct></struct></struct></struct></struct></struct></struct></struct></vector></easyx.h></cstdlib></cmath></graphics.h></iostream>

Original: https://blog.csdn.net/m0_61897853/article/details/123956282
Author: DDsoup
Title: 聚类算法——KMeans(K-均值)

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/703060/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Adaboost多分类与回归35

import numpy as np from sklearn.ensemble import AdaBoostClassifier from sklearn import dat…

人工智能 2023年7月2日
0064
基于Python的股市市场情绪分析

源码下载地址：https://download.csdn.net/download/sheziqiong/85629795 情绪与股市情绪与股市关系的研究由来已久，情绪是市场的一…

人工智能 2023年5月28日
0066
pandas输出列名_使用Pandas的字典键和值的列名

我正在使用pandas将一些数据转储到excel文件中。数据是字典格式的，我使用下面的代码来转储它。df1 = pd.DataFrame.from_dict(weights_dic…

人工智能 2023年7月8日
0060
7 个实用 TypeScript 单行代码

一般更少的代码通常意味着是更好的代码，因此，今天，我将跟大家分享7个TypeScript的单行代码，其中不乏泛型、断言等高级用法，希望对大家有所帮助。 1、底部可见确定页面底部是…

人工智能 2023年6月28日
0046
图像分块原理和实现【个人理解和整理】

1、无重叠分块 2、有重叠分块把一幅大尺寸图像分块的目的除为了实现并行处理之外，还能够将子块分次调入内存处理，增强算法的适用性，避免过大图像处理不了的问题。大尺寸图像被分块后，减…

人工智能 2023年6月20日
00227
聚类个数的选择：轮廓系数（计算公式和原理）

单一样本i i i 的轮廓系数：s ( i ) = b ( i ) − a ( i ) max ⁡ { a ( i ) , b ( i ) } s(i)=\frac{b(i)-a(…

人工智能 2023年6月16日
0085
别再说难了，年轻小伙教你如何爬取“新一线城市”二手房信息

别再说难了，年轻小伙教你如何爬取”新一线城市”二手房信息主页面信息爬取 * 主页面分析主页面url获取获取页面数据页面数据解析及保存详情页 url…

人工智能 2023年7月16日
0070
文本数据挖掘—-数据预处理

一、数据预处理简介 1、为什么要进行数据预处理一开始拿到的数据在数据的质量方面或多或少有一些问题，即在数据的准确性、完整性、一致性、合时性（实时性）、可信性、解释性等方面可能存…

人工智能 2023年7月17日
0098
入门电机系列之4步进电机

入门电机系列，基于STM32硬件本文章学习借鉴于野火团队资料，以表感谢。官网http://products.embedfire.com/舵机的原理与应用。文章目录入门电机系列…

人工智能 2023年6月28日
0082
Tensorflow教程

前言 1、TensorFlow 是由 Google Brain 团队为深度神经网络（DNN）开发的功能强大的开源软件库； 2、TensorFlow 允许将深度神经网络的计算部署到…

人工智能 2023年5月23日
0063
缺陷检测中的分类、检测与分割网络

缺陷检测中的分类、检测与分割网络前言 1. 分类网络 2. 检测网络 3. 分割网络前言根据缺陷检测的三个阶段其方法大致可以分为三类分别是分类网络、检测网络、分割网络。…

人工智能 2023年7月3日
0081
数据分析常用技巧之：读取 xls 后缀文件、数据相关性可视化、异常值替换和删除、求各列数据之间的相关性、数据分箱、数据排序、数据标准化和归一化

文章目录常用工具包读取 xls 结尾的文件删除整列（或行）都为 nan 的列（或行）筛选文中是否存在异常值数据标准化和归一化对 dataframe 中的不同列计算相关性…

人工智能 2023年7月6日
0082
协同过滤算法中是否考虑到时间维度进行推荐？如果是，如何处理

问题背景介绍协同过滤是一种常用的推荐算法，它基于用户之间的相似性或物品之间的相似性来进行推荐。在协同过滤算法中，我们通常考虑用户或物品的相似度计算，但是是否考虑时间维度对推荐的影…

人工智能 2024年1月4日
0031
cartographer接入2D雷达laser+imu实时建图

最近也是需要稍微看一下cartographer，然后用来跑2D建图，且需要融入imu数据这篇文章也是自己在搞的过程中记录下来，以免自己以后忘记了，也希望能给小伙伴们们提供帮助另…

人工智能 2023年6月2日
0066
jupyter notebook简单用法

记录一些自己用的（可能会忘的），（并不全面）只是给自己看的。 1. 如何打开点击lunch即可或者通过命令行，输入jupyter notebook或者是jupyter-note…

人工智能 2023年5月26日
0093
OpenCV-Python实战（2）——图像与视频文件的处理

OpenCV-Python实战（2）——图像与视频文件的处理 * – 0. 前言 – 1. 图像与视频文件处理基础 – 2. 图像的读取与写入 …

人工智能 2023年6月17日
0053

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31