决策树之挑选西瓜

2023年6月16日上午10:27 • 人工智能 • 阅读 64

五.用sk-learn库对西瓜数据集，分别进行ID3、C4.5和CART的算法代码实现

一.决策树

决策树是一种基于树结构来进行决策的分类算法，我们希望从给定的训练数据集学得一个模型（即决策树），用该模型对新样本分类。决策树可以非常直观展现分类的过程和结果，一旦模型构建成功，对新样本的分类效率也相当高。最经典的决策树算法有ID3、C4.5、CART，其中ID3算法是最早被提出的，它可以处理离散属性样本的分类，C4.5和CART算法则可以处理更加复杂的分类问题.

二.西瓜挑选问题描述

举个例子：夏天买西瓜时，我一般先选瓜皮有光泽的（新鲜），再拍一拍选声音清脆的（成熟），这样挑出来的好瓜的可能就比较大了。那么我挑西瓜的决策树是这样的：

下面，我们就对以下表格中的西瓜样本构建决策树模型。

三.利用信息增益选择最优划分属性

样本有多个属性，该先选哪个样本来划分数据集呢？原则是随着划分不断进行，我们希望决策树的分支节点所包含的样本尽可能属于同一分类，即”纯度”越来越高。先来学习一下”信息熵”和”信息增益”。

信息熵（information entropy）
样本集合D中第k类样本所占的比例（k=1,2,…,|Y|），|Y|为样本分类的个数，则D的信息熵为：

_Ent(D)_的值越小，则 _D_的纯度越高。直观理解一下：假设样本集合有2个分类，每类样本的比例为1/2， _Ent(D)=1；_只有一个分类，Ent（D）= 0，显然后者比前者的纯度高。

在西瓜样本集中，共有17个样本，其中正样本8个，负样本9个，样本集的信息熵为：

信息增益（information gain）
使用属性a对样本集D进行划分所获得的”信息增益”的计算方法是，用样本集的总信息熵减去属性a的每个分支的信息熵与权重（该分支的样本数除以总样本数）的乘积，通常，信息增益越大，意味着用属性a进行划分所获得的”纯度提升”越大。因此，优先选择信息增益最大的属性来划分。设属性a有V个可能的取值，则属性a的信息增益为：

西瓜样本集中，以属性”色泽”为例，它有3个取值{青绿、乌黑、浅白}，对应的子集（色泽=青绿）中有6个样本，其中正负样本各3个，（色泽=乌黑）中有6个样本，正样本4个，负样本2个，（色泽=浅白）中有5个样本，正样本1个，fuya负样本4个。

四.用Python求解

代码

#&#x5BFC;&#x5165;&#x6A21;&#x5757;
import pandas as pd
import numpy as np
from collections import Counter
from math import log2

#&#x6570;&#x636E;&#x83B7;&#x53D6;&#x4E0E;&#x5904;&#x7406;
def getData(filePath):
    data = pd.read_excel(filePath)
    return data

def dataDeal(data):
    dataList = np.array(data).tolist()
    dataSet = [element[1:] for element in dataList]
    return dataSet

    #&#x83B7;&#x53D6;&#x5C5E;&#x6027;&#x540D;&#x79F0;
def getLabels(data):
    labels = list(data.columns)[1:-1]
    return labels

    #&#x83B7;&#x53D6;&#x7C7B;&#x522B;&#x6807;&#x8BB0;
def targetClass(dataSet):
    classification = set([element[-1] for element in dataSet])
    return classification

    #&#x5C06;&#x5206;&#x652F;&#x7ED3;&#x70B9;&#x6807;&#x8BB0;&#x4E3A;&#x53F6;&#x7ED3;&#x70B9;&#xFF0C;&#x9009;&#x62E9;&#x6837;&#x672C;&#x6570;&#x6700;&#x591A;&#x7684;&#x7C7B;&#x4F5C;&#x4E3A;&#x7C7B;&#x6807;&#x8BB0;
def majorityRule(dataSet):
    mostKind = Counter([element[-1] for element in dataSet]).most_common(1)
    majorityKind = mostKind[0][0]
    return majorityKind

    #&#x8BA1;&#x7B97;&#x4FE1;&#x606F;&#x71B5;
def infoEntropy(dataSet):
    classColumnCnt = Counter([element[-1] for element in dataSet])
    Ent = 0
    for symbol in classColumnCnt:
        p_k = classColumnCnt[symbol]/len(dataSet)
        Ent = Ent-p_k*log2(p_k)
    return Ent

    #&#x5B50;&#x6570;&#x636E;&#x96C6;&#x6784;&#x5EFA;
def makeAttributeData(dataSet,value,iColumn):
    attributeData = []
    for element in dataSet:
        if element[iColumn]==value:
            row = element[:iColumn]
            row.extend(element[iColumn+1:])
            attributeData.append(row)
    return attributeData

    #&#x8BA1;&#x7B97;&#x4FE1;&#x606F;&#x589E;&#x76CA;
def infoGain(dataSet,iColumn):
    Ent = infoEntropy(dataSet)
    tempGain = 0.0
    attribute = set([element[iColumn] for element in dataSet])
    for value in attribute:
        attributeData = makeAttributeData(dataSet,value,iColumn)
        tempGain = tempGain+len(attributeData)/len(dataSet)*infoEntropy(attributeData)
        Gain = Ent-tempGain
    return Gain

    #&#x9009;&#x62E9;&#x6700;&#x4F18;&#x5C5E;&#x6027;
def selectOptimalAttribute(dataSet,labels):
    bestGain = 0
    sequence = 0
    for iColumn in range(0,len(labels)):#&#x4E0D;&#x8BA1;&#x6700;&#x540E;&#x7684;&#x7C7B;&#x522B;&#x5217;
        Gain = infoGain(dataSet,iColumn)
        if Gain>bestGain:
            bestGain = Gain
            sequence = iColumn
        print(labels[iColumn],Gain)
    return sequence

    #&#x5EFA;&#x7ACB;&#x51B3;&#x7B56;&#x6811;
def createTree(dataSet,labels):
    classification = targetClass(dataSet) #&#x83B7;&#x53D6;&#x7C7B;&#x522B;&#x79CD;&#x7C7B;&#xFF08;&#x96C6;&#x5408;&#x53BB;&#x91CD;&#xFF09;
    if len(classification) == 1:
        return list(classification)[0]
    if len(labels) == 1:
        return majorityRule(dataSet)#&#x8FD4;&#x56DE;&#x6837;&#x672C;&#x79CD;&#x7C7B;&#x8F83;&#x591A;&#x7684;&#x7C7B;&#x522B;
    sequence = selectOptimalAttribute(dataSet,labels)
    print(labels)
    optimalAttribute = labels[sequence]
    del(labels[sequence])
    myTree = {optimalAttribute:{}}
    attribute = set([element[sequence] for element in dataSet])
    for value in attribute:

        print(myTree)
        print(value)
        subLabels = labels[:]
        myTree[optimalAttribute][value] =  \
                createTree(makeAttributeData(dataSet,value,sequence),subLabels)
    return myTree

    def main():
    filePath = 'D:/watermelondata.xls'
    data = getData(filePath)
    dataSet = dataDeal(data)
    labels = getLabels(data)
    myTree = createTree(dataSet,labels)
    return myTree

    if __name__ == '__main__':
    myTree = main()

输出

&#x8272;&#x6CFD; 0.10812516526536531
&#x6839;&#x8482; 0.14267495956679277
&#x6572;&#x58F0; 0.14078143361499584
&#x7EB9;&#x7406; 0.3805918973682686
&#x8110;&#x90E8; 0.28915878284167895
&#x89E6;&#x611F; 0.006046489176565584
['&#x8272;&#x6CFD;', '&#x6839;&#x8482;', '&#x6572;&#x58F0;', '&#x7EB9;&#x7406;', '&#x8110;&#x90E8;', '&#x89E6;&#x611F;']
{'&#x7EB9;&#x7406;': {}}
&#x7A0D;&#x7CCA;
&#x8272;&#x6CFD; 0.3219280948873623
&#x6839;&#x8482; 0.07290559532005603
&#x6572;&#x58F0; 0.3219280948873623
&#x8110;&#x90E8; 0.17095059445466865
&#x89E6;&#x611F; 0.7219280948873623
['&#x8272;&#x6CFD;', '&#x6839;&#x8482;', '&#x6572;&#x58F0;', '&#x8110;&#x90E8;', '&#x89E6;&#x611F;']
{'&#x89E6;&#x611F;': {}}
&#x786C;&#x6ED1;
{'&#x89E6;&#x611F;': {'&#x786C;&#x6ED1;': '&#x5426;'}}
&#x8F6F;&#x7C98;
{'&#x7EB9;&#x7406;': {'&#x7A0D;&#x7CCA;': {'&#x89E6;&#x611F;': {'&#x786C;&#x6ED1;': '&#x5426;', '&#x8F6F;&#x7C98;': '&#x662F;'}}}}
&#x6A21;&#x7CCA;
{'&#x7EB9;&#x7406;': {'&#x7A0D;&#x7CCA;': {'&#x89E6;&#x611F;': {'&#x786C;&#x6ED1;': '&#x5426;', '&#x8F6F;&#x7C98;': '&#x662F;'}}, '&#x6A21;&#x7CCA;': '&#x5426;'}}
&#x6E05;&#x6670;
&#x8272;&#x6CFD; 0.04306839587828004
&#x6839;&#x8482; 0.45810589515712374
&#x6572;&#x58F0; 0.33085622540971754
&#x8110;&#x90E8; 0.45810589515712374
&#x89E6;&#x611F; 0.45810589515712374
['&#x8272;&#x6CFD;', '&#x6839;&#x8482;', '&#x6572;&#x58F0;', '&#x8110;&#x90E8;', '&#x89E6;&#x611F;']
{'&#x6839;&#x8482;': {}}
&#x786C;&#x633A;
{'&#x6839;&#x8482;': {'&#x786C;&#x633A;': '&#x5426;'}}
&#x7A0D;&#x8737;
&#x8272;&#x6CFD; 0.2516291673878229
&#x6572;&#x58F0; 0.0
&#x8110;&#x90E8; 0.0
&#x89E6;&#x611F; 0.2516291673878229
['&#x8272;&#x6CFD;', '&#x6572;&#x58F0;', '&#x8110;&#x90E8;', '&#x89E6;&#x611F;']
{'&#x8272;&#x6CFD;': {}}
&#x4E4C;&#x9ED1;
&#x6572;&#x58F0; 0.0
&#x8110;&#x90E8; 0.0
&#x89E6;&#x611F; 1.0
['&#x6572;&#x58F0;', '&#x8110;&#x90E8;', '&#x89E6;&#x611F;']
{'&#x89E6;&#x611F;': {}}
&#x786C;&#x6ED1;
{'&#x89E6;&#x611F;': {'&#x786C;&#x6ED1;': '&#x662F;'}}
&#x8F6F;&#x7C98;
{'&#x8272;&#x6CFD;': {'&#x4E4C;&#x9ED1;': {'&#x89E6;&#x611F;': {'&#x786C;&#x6ED1;': '&#x662F;', '&#x8F6F;&#x7C98;': '&#x5426;'}}}}
&#x9752;&#x7EFF;
{'&#x6839;&#x8482;': {'&#x786C;&#x633A;': '&#x5426;', '&#x7A0D;&#x8737;': {'&#x8272;&#x6CFD;': {'&#x4E4C;&#x9ED1;': {'&#x89E6;&#x611F;': {'&#x786C;&#x6ED1;': '&#x662F;', '&#x8F6F;&#x7C98;': '&#x5426;'}}, '&#x9752;&#x7EFF;': '&#x662F;'}}}}
&#x8737;&#x7F29;

五.用sk-learn库对西瓜数据集，分别进行ID3、C4.5和CART的算法代码实现

1.ID3算法

熵和信息增益
设S是训练样本集，它包括n个类别的样本，这些方法用Ci表示，那么熵和信息增益用下面公式表示：
信息熵：

其中pi表示Ci的概率
样本熵：

其中Si表示根据属性A划分的S的第i个子集，S和Si表示样本数目
信息增益：

代码

&#x8BFB;&#x53D6;&#x897F;&#x74DC;&#x6570;&#x636E;&#x96C6;
import numpy as np
import pandas as pd
df = pd.read_table(r'D:/watermelon.txt',encoding='utf8',delimiter=',',index_col=0)
df.head()
&#x7531;&#x4E8E;&#x4E0A;&#x9762;&#x7684;&#x6570;&#x636E;&#x4E2D;&#x5305;&#x542B;&#x4E86;&#x4E2D;&#x6587;&#x6C49;&#x5B57;&#xFF0C;&#x6240;&#x4EE5;&#x9700;&#x8981;&#x5BF9;&#x6570;&#x636E;&#x8FDB;&#x4E00;&#x6B65;&#x5904;&#x7406;
'''
&#x5C5E;&#x6027;&#xFF1A;
&#x8272;&#x6CFD; 1-3&#x4EE3;&#x8868; &#x6D45;&#x767D; &#x9752;&#x7EFF; &#x4E4C;&#x9ED1; &#x6839;&#x8482; 1-3&#x4EE3;&#x8868; &#x7A0D;&#x8737; &#x8737;&#x7F29; &#x786C;&#x633A;
&#x6572;&#x58F0; 1-3&#x4EE3;&#x8868; &#x6E05;&#x8106; &#x6D4A;&#x54CD; &#x6C89;&#x95F7; &#x7EB9;&#x7406; 1-3&#x4EE3;&#x8868; &#x6E05;&#x6670; &#x7A0D;&#x7CCA; &#x6A21;&#x7CCA;
&#x8110;&#x90E8; 1-3&#x4EE3;&#x8868; &#x5E73;&#x5766; &#x7A0D;&#x51F9; &#x51F9;&#x9677; &#x89E6;&#x611F; 1-2&#x4EE3;&#x8868; &#x786C;&#x6ED1; &#x8F6F;&#x7C98;
&#x6807;&#x7B7E;&#xFF1A;
&#x597D;&#x74DC; 1&#x4EE3;&#x8868; &#x662F; 0 &#x4EE3;&#x8868; &#x4E0D;&#x662F;
'''
df['&#x8272;&#x6CFD;']=df['&#x8272;&#x6CFD;'].map({'&#x6D45;&#x767D;':1,'&#x9752;&#x7EFF;':2,'&#x4E4C;&#x9ED1;':3})
df['&#x6839;&#x8482;']=df['&#x6839;&#x8482;'].map({'&#x7A0D;&#x8737;':1,'&#x8737;&#x7F29;':2,'&#x786C;&#x633A;':3})
df['&#x6572;&#x58F0;']=df['&#x6572;&#x58F0;'].map({'&#x6E05;&#x8106;':1,'&#x6D4A;&#x54CD;':2,'&#x6C89;&#x95F7;':3})
df['&#x7EB9;&#x7406;']=df['&#x7EB9;&#x7406;'].map({'&#x6E05;&#x6670;':1,'&#x7A0D;&#x7CCA;':2,'&#x6A21;&#x7CCA;':3})
df['&#x8110;&#x90E8;']=df['&#x8110;&#x90E8;'].map({'&#x5E73;&#x5766;':1,'&#x7A0D;&#x51F9;':2,'&#x51F9;&#x9677;':3})
df['&#x89E6;&#x611F;'] = np.where(df['&#x89E6;&#x611F;']=="&#x786C;&#x6ED1;",1,2)
df['&#x597D;&#x74DC;'] = np.where(df['&#x597D;&#x74DC;']=="&#x662F;",1,0)
#&#x7531;&#x4E8E;&#x897F;&#x74DC;&#x6570;&#x636E;&#x96C6;&#x6837;&#x672C;&#x6BD4;&#x8F83;&#x5C11;&#xFF0C;&#x6240;&#x4EE5;&#x4E0D;&#x5212;&#x5206;&#x6570;&#x636E;&#x96C6;&#xFF0C;&#x5C06;&#x6240;&#x6709;&#x7684;&#x897F;&#x74DC;&#x6570;&#x636E;&#x7528;&#x6765;&#x8BAD;&#x7EC3;&#x6A21;&#x578B;
Xtrain = df.iloc[:,:-1]
Xtrain = np.array(Xtrain)
Ytrain = df.iloc[:,-1]
&#x8C03;&#x7528;sklearn&#x5185;&#x7F6E;&#x7684;&#x51B3;&#x7B56;&#x6811;&#x7684;&#x5E93;&#x548C;&#x753B;&#x56FE;&#x5DE5;&#x5177;
from sklearn import tree
import graphviz
&#x91C7;&#x7528;ID3&#x7B97;&#x6CD5;&#xFF0C;&#x5229;&#x7528;&#x4FE1;&#x606F;&#x71B5;&#x6784;&#x5EFA;&#x51B3;&#x7B56;&#x6811;&#x6A21;&#x578B;
clf = tree.DecisionTreeClassifier(criterion="entropy")
clf = clf.fit(Xtrain,Ytrain)
&#x7ED8;&#x5236;&#x51B3;&#x7B56;&#x6811;&#x7684;&#x56FE;&#x5F62;
feature_names = ["&#x8272;&#x6CFD;","&#x6839;&#x8482;","&#x6572;&#x58F0;","&#x7EB9;&#x7406;","&#x8110;&#x90E8;","&#x89E6;&#x611F;"]
dot_data = tree.export_graphviz(clf
,feature_names=feature_names
,class_names=["&#x597D;&#x74DC;","&#x574F;&#x74DC;"]
,filled=True
,rounded=True
)
graph = graphviz.Source(dot_data)
graph

2. C4.5算法

（一）对比ID3的改进点
C4.5算法是用于生成决策树的一种经典算法，是ID3算法的一种延伸和优化。C4.5算法对ID3算法进行了改进，改进点主要有：

用信息增益率来选择划分特征，克服了用信息增益选择的不足，
信息增益率对可取值数目较少的属性有所偏好；
能够处理离散型和连续型的属性类型，即将连续型的属性进行离散化处理；
能够处理具有缺失属性值的训练数据；
在构造树的过程中进行剪枝；
（二）特征选择
特征选择也即选择最优划分属性，从当前数据的特征中选择一个特征作为当前节点的划分标准。随着划分过程不断进行，希望决策树的分支节点所包含的样本尽可能属于同一类别，即节点的”纯度”越来越高。

（三）信息增益率
信息增益准则对可取值数目较多的属性有所偏好，为减少这种偏好可能带来的不利影响，C4.5算法采用信息增益率来选择最优划分属性。增益率公式

3. CART算法

只需要将DecisionTreeClassifier函数的参数criterion的值改为gini：

clf = tree.DecisionTreeClassifier(criterion=”gini”) #实例化
clf = clf.fit(x_train, y_train)
score = clf.score(x_test, y_test)
print(score)

画决策树

&#x52A0;&#x4E0A;Graphviz2.38&#x7EDD;&#x5BF9;&#x8DEF;&#x5F84;
import os
os.environ["PATH"] += os.pathsep + 'D:/Some_App_Use/Anaconda/Anaconda3/Library/bin/graphviz'

feature_name = ["&#x8272;&#x6CFD;","&#x6839;&#x8482;","&#x6572;&#x58F0;","&#x7EB9;&#x7406;","&#x8110;&#x90E8;","&#x89E6;&#x611F;"]
dot_data = tree.export_graphviz(clf ,feature_names= feature_name,class_names=["&#x597D;&#x74DC;","&#x574F;&#x74DC;"],filled=True,rounded=True,out_file =None)
graph = graphviz.Source(dot_data)
graph
&#x52A0;&#x4E0A;Graphviz2.38&#x7EDD;&#x5BF9;&#x8DEF;&#x5F84;
import os
os.environ["PATH"] += os.pathsep + 'D:/Some_App_Use/Anaconda/Anaconda3/Library/bin/graphviz'

feature_name = ["&#x8272;&#x6CFD;","&#x6839;&#x8482;","&#x6572;&#x58F0;","&#x7EB9;&#x7406;","&#x8110;&#x90E8;","&#x89E6;&#x611F;"]
dot_data = tree.export_graphviz(clf ,feature_names= feature_name,class_names=["&#x597D;&#x74DC;","&#x574F;&#x74DC;"],filled=True,rounded=True,out_file =None)
graph = graphviz.Source(dot_data)
graph

六.总结

通过对决策树的了解，以及相关的算法的代码实现，让我更深刻了解人工智能挑选过程.

参考链接：
https://blog.csdn.net/leaf_zizi/article/details/82848682
https://www.cnblogs.com/dennis-liucd/p/7905793.html
https://blog.csdn.net/keyue123/article/details/82253538
https://blog.csdn.net/qq_41775769/article/details/110822101

Original: https://blog.csdn.net/IT23131/article/details/121068259
Author: IT23131
Title: 决策树之挑选西瓜

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/623363/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

SPICE: Semantic Pseudo-labeling for Image Clustering（用于图像聚类的语义伪标记）

SPICE: Semantic Pseudo-labeling for Image Clustering（用于图像聚类的语义伪标记） * – 方法 – + …

人工智能 2023年6月2日
0085
ESMap 城市三维地图在气象数据监测的应用-智慧城市数字孪生

智慧城市数字孪生简介随着 5G、物联网、大数据、人工智能等技术的发展与广泛应用，城市的管理模式正在由传统的二维向三维可视化的模式过渡，智慧城市的内涵在不断丰富，建设 3D 可视化…

人工智能 2023年6月4日
00111
风控策略的开发与场景应用

近期一段时间，番茄风控给大家分享了两次关于策略探索与开发的主题课程，干货满满，精华尽出，番茄课堂分别对应：第78次课《信贷场景多维特征交叉策略的实战分析》第79次课《信贷风控策略体…

人工智能 2023年6月19日
0086
【编程生活】python实现成绩可视化数据分析

考试成绩可视化分析软件 0. 这个软件是做什么的呢？ * 设计这个软件的初衷软件要实现的功能 1.功能实现 * 输入成绩并输出可视化结果 – 1. 输入成绩 + 1….

人工智能 2023年7月15日
0094
多智能体强化学习之MAPPO理论解读

本文主要是结合文章Joint Optimization of Handover Control and Power Allocation Based on Multi-Agent …

人工智能 2023年7月12日
0077
云知声（Unisound）蜂鸟系列AI离线语音识别芯片方案介绍

云知声（Unisound）作为行业内领先的人工智能企业，拥有全栈式的语音技术，将语音识别、语义理解、自然语言处理、语音合成、声音降噪算法、海量语音数据、专用芯片开发等技术融合实现…

人工智能 2023年5月23日
00151
Windows 配置OPENCV扩展库opencv_contrib（3.4.16）

本人其实已经配好了opencv，但是发现有的需要扩展库，于是参考了很多开始配置的漫漫长路整个过程可参考以下3个结合着看，本文主要记录自己的过程及补充，格式混乱请别介意 1、ope…

人工智能 2023年7月19日
0060
基于机器学习算法的钢材缺陷检测分类

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年6月19日
0070
R构建泊松回归模型（Poisson Regression）

R构建泊松回归模型（Poisson Regression）泊松回归模型（Poisson Regression） Original: https://blog.csdn.net/z…

人工智能 2023年6月18日
0078
基于Tensorflow 2.0实现的图片风格迁移

** 基于Tensorflow 2.0实现的图片风格迁移 ** 摘要神经风格迁移是一种优化技术，用于将两个图像（一个内容图像和一个风格参考图像）混合在一起，使输出的噪声图像看起…

人工智能 2023年5月25日
0072
CVPR2022论文速递(2022.7.1) 3D目标检测 GLENet网络-利用生成标签不确定估计法

GLENet: Boosting 3D Object Detectors with Generative Label Uncertainty EstimationGLENet：增强…

人工智能 2023年6月10日
0090
戴口罩的人脸识别

上一次写技术文章是去年4月份了，时隔一整年终于又恬不知耻的上线了！其实这中间有好多事都想要写，找实习，找工作，申博，考试等但人的惰性太大了，停笔容易，但是想再拾起笔可真是太难了…

人工智能 2023年7月11日
0077
【Opencv】图像分割——区域分裂合并

文章目录 1 环境 2 效果 3 原理 4 代码 1 环境 Python 3.8.8 PyCharm 2021 opencv-python 2 效果 ; 3 原理区域生长是从某个…

人工智能 2023年7月18日
0048
逻辑回归中的损失函数是什么，为什么使用这个函数

逻辑回归中的损失函数是什么？为什么使用这个函数？逻辑回归是一种二分类算法，用于预测某个样本属于某一类的概率。为了进行模型训练，我们需要定义一个合适的损失函数来衡量预测值和真实值之…

人工智能 2023年12月31日
0037
unbuntu20.04下载opencv4.5.2

最近因为某种原因不小心把电脑格式化了（啥也别说，就是一个大写的惨啊，呜呜呜呜，而且还没有备份文件）所以这里提醒大家，文件一定要备份！一定！一定！一定。重装系统之后，现在下载回各种软…

人工智能 2023年7月18日
0048
python 关闭某个程序_python程序怎么结束

需要终止程序，可以使用sys.exit()退出程序。sys.exit()会引发一个异常如果这个异常没有被捕获，那么python编译器将会退出，后面的程序将不会执行。如果这个异常…

人工智能 2023年7月7日
0079

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

决策树之挑选西瓜

1.ID3算法

2. C4.5算法

3. CART算法

大家都在看