AI学习–机器学习概述

学习框架

AI学习--机器学习概述

AI学习--机器学习概述
AI学习--机器学习概述
AI学习--机器学习概述

AI学习--机器学习概述

01-人工智能概述

AI学习--机器学习概述

AI学习--机器学习概述
* *机器学习、人工智能与深度学习的关系
AI学习--机器学习概述

AI学习--机器学习概述

达特茅斯会议-人工智能的起点

AI学习--机器学习概述
机器学习是人工智能的一个实现途径
AI学习--机器学习概述
深度学习是机器学习的一个方法发展而来(人工神经网络)
AI学习--机器学习概述

AI学习--机器学习概述
AI学习--机器学习概述
AI学习--机器学习概述

AI学习--机器学习概述
从图上可以看出,人工智能最开始是用于实现人机对弈,到后面的开始处理垃圾邮件过滤【机器学习,机器去模仿人工神经网络】,到最后的图片识别效果显著【深度神经网络,在图像识别中取得好的成绩】,也就是人工智能发展的3个历程。
AI学习--机器学习概述

AI学习--机器学习概述
* *机器学习、深度学习的应用
AI学习--机器学习概述

AI学习--机器学习概述
传统预测: 店铺销量预测,移动用户流量消费预测,
AI学习--机器学习概述
图像识别: 人脸识别、无人驾驶
AI学习--机器学习概述
自然语言处理: 英文翻译、文本分类、感情分析、只能客服
AI学习--机器学习概述

AI学习--机器学习概述
AI学习--机器学习概述
AI学习--机器学习概述

AI学习--机器学习概述

02-机器学习

AI学习--机器学习概述

AI学习--机器学习概述
* *什么是机器学习
AI学习--机器学习概述

AI学习--机器学习概述
机器学习就是从 数据中自动分析获得模型,并利用模型对未知的数据 进行预测
AI学习--机器学习概述

AI学习--机器学习概述

大量的数量 –》 发布预测模型 –》 结果预测

AI学习--机器学习概述

AI学习--机器学习概述
AI学习--机器学习概述
AI学习--机器学习概述

AI学习--机器学习概述
例如,我们将大量的猫图片,利用Py转换为二进制的文件,然后交给机器去学习,去发现一定的规律后,下次机器就可以在大量的图片中发现包含猫的图片。
AI学习--机器学习概述

AI学习--机器学习概述
* *数据集的构成: 特征值 + 目前值
AI学习--机器学习概述

AI学习--机器学习概述
AI学习--机器学习概述
AI学习--机器学习概述

AI学习--机器学习概述
说明:有些数据我们没有目标值,但是也是可以根据他们的特征进行归类(有专门的算法)
AI学习--机器学习概述

AI学习--机器学习概述

AI学习--机器学习概述

AI学习--机器学习概述

03-机器学习算法分类

AI学习--机器学习概述

AI学习--机器学习概述
根据我们机器学习的结果有无目标值分为 监督学习无监督学习
AI学习--机器学习概述

AI学习--机器学习概述
监督学习根据输入的数据特征分为 分类学习回归学习
AI学习--机器学习概述

AI学习--机器学习概述
AI学习--机器学习概述
AI学习--机器学习概述

AI学习--机器学习概述
AI学习--机器学习概述
AI学习--机器学习概述

AI学习--机器学习概述

监督学习:

AI学习--机器学习概述
目标值:类别 – 分类问题(猫狗的识别)
AI学习--机器学习概述
k-近邻算法、贝叶斯分类、决策树与随机森林、逻辑回归
AI学习--机器学习概述
目标值:连续型的数据 – 回归问题(房屋价格预测,看做曲线)
AI学习--机器学习概述
线性回归、岭回归
AI学习--机器学习概述
无监督学习:
AI学习--机器学习概述
目标值:无 – 无监督学习
AI学习--机器学习概述
聚类 k-means
AI学习--机器学习概述
生活案例:
AI学习--机器学习概述
1、预测明天的气温是多少度? 回归
AI学习--机器学习概述
2、预测明天是阴、晴还是雨? 分类
AI学习--机器学习概述
3、人脸年龄预测? 可回归/可分类
AI学习--机器学习概述
4、人脸识别? 分类
AI学习--机器学习概述

AI学习--机器学习概述

04-机器学习开发流程

AI学习--机器学习概述

AI学习--机器学习概述
机器学习开发流程:
AI学习--机器学习概述
1)获取数据(数据量越大,数据越精确)
AI学习--机器学习概述
2)数据处理(对不符合要求的数据进行剔除,对不完整的数据进行数据完整)
AI学习--机器学习概述
3)特征工程(把数据处理成符合我们具有特征值的数据)
AI学习--机器学习概述
4)机器学习算法训练 –》 产生模型
AI学习--机器学习概述
5)模型评估(用一系列的方法对产生的模型进行评估,如果符合要求,则继续,否则轮训继续进行数据处理和特征工程)
AI学习--机器学习概述
6)应用(用模型对未知的数据进行预测)
AI学习--机器学习概述

AI学习--机器学习概述
AI学习--机器学习概述
AI学习--机器学习概述

AI学习--机器学习概述

05-学习框架介绍

AI学习--机器学习概述

AI学习--机器学习概述
学习框架和资料介绍:
AI学习--机器学习概述
1)算法是核心,数据与计算是基础【很消耗计算性能,需要能支持它计算的硬件设备,CPU和GPU等】
AI学习--机器学习概述

AI学习--机器学习概述
2)我们做的都是基于专业的算法工程师的基础上进行数据分析、业务分析、常见算法的整合以及结合特征工程进行参数的调优、优化
AI学习--机器学习概述
3) 实战类书籍推荐:
AI学习--机器学习概述

AI学习--机器学习概述
机器学习 -“西瓜书”- 周志华
AI学习--机器学习概述
统计学习方法 – 李航
AI学习--机器学习概述
深度学习 – “花书”
AI学习--机器学习概述

AI学习--机器学习概述
4)开源框架:
AI学习--机器学习概述

AI学习--机器学习概述
AI学习--机器学习概述
AI学习--机器学习概述

AI学习--机器学习概述

06-可用数据集

AI学习--机器学习概述

AI学习--机器学习概述
我们的数据集分为 训练集测试集合,机器学习主要用到了sklearn,下面介绍sklearn数据集
AI学习--机器学习概述

AI学习--机器学习概述
* *可用数据集
AI学习--机器学习概述

AI学习--机器学习概述
互联网公司内部接口: 借用百度
AI学习--机器学习概述
学习阶段可以用的数据集:
AI学习--机器学习概述
1)sklearn
AI学习--机器学习概述
2)kaggle(数据挖掘)
AI学习--机器学习概述
3)UCI(加州大学的一个研究机构)
AI学习--机器学习概述

AI学习--机器学习概述
AI学习--机器学习概述
AI学习--机器学习概述

AI学习--机器学习概述
UCI数据集:https://archive.ics.uci.edu/ml/datasets/Iris
AI学习--机器学习概述

AI学习--机器学习概述
* *Scikit-learn工具介绍
AI学习--机器学习概述

AI学习--机器学习概述
AI学习--机器学习概述
AI学习--机器学习概述

AI学习--机器学习概述
* *Scikit-Learn安装
AI学习--机器学习概述

AI学习--机器学习概述
java;auto-links:true;collapse:false;first-line:1;gutter:true;html-script:false;light:false;ruler:false;smart-tabs:true;tab-size:4;toolbar:true; <img alt="AI学习--机器学习概述" src="https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png" /></p> <h1>会帮助我们去安装一下中间的插件,例如Numpy, Scipy等库</h1> <p><img alt="AI学习--机器学习概述" src="https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png" /></p> <pre><code>![AI学习--机器学习概述](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png) ![AI学习--机器学习概述](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png) ;auto-links:true;collapse:false;first-line:1;gutter:true;html-script:false;light:false;ruler:false;smart-tabs:true;tab-size:4;toolbar:true;
![AI学习–机器学习概述](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png)
pip3 install Scikit-learn
![AI学习–机器学习概述](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png)

AI学习--机器学习概述

AI学习--机器学习概述
AI学习--机器学习概述
AI学习--机器学习概述

AI学习--机器学习概述
* *Scikit-learn包含的内容
AI学习--机器学习概述

AI学习--机器学习概述
AI学习--机器学习概述
AI学习--机器学习概述

AI学习--机器学习概述
* *sklearn数据集API的使用
AI学习--机器学习概述

AI学习--机器学习概述

load_ 获取小规模数据集,例如后面的鸢尾花, iris = load_iris()
AI学习--机器学习概述
fetch_
获取大规模数据集

AI学习--机器学习概述

AI学习--机器学习概述
AI学习--机器学习概述
AI学习--机器学习概述

AI学习--机器学习概述

sklearn小数据集(鸢尾花案例)
AI学习--机器学习概述
sklearn.datasets.load_iris()

AI学习--机器学习概述

AI学习--机器学习概述
AI学习--机器学习概述
AI学习--机器学习概述

AI学习--机器学习概述
AI学习--机器学习概述
AI学习--机器学习概述

AI学习--机器学习概述

sklearn大数据集
AI学习--机器学习概述
sklearn.datasets.fetch_20newsgroups(data_home=None,subset=’train’)

AI学习--机器学习概述

AI学习--机器学习概述
AI学习--机器学习概述
AI学习--机器学习概述

AI学习--机器学习概述

数据集的返回值
AI学习--机器学习概述
datasets.base.Bunch(继承自字典)

AI学习--机器学习概述
dict[“key”] = values
AI学习--机器学习概述
bunch.key = values # 可以根据.属性的方式 获取values值
AI学习--机器学习概述

AI学习--机器学习概述
AI学习--机器学习概述
AI学习--机器学习概述

AI学习--机器学习概述
java;auto-links:true;collapse:false;first-line:1;gutter:true;html-script:false;light:false;ruler:false;smart-tabs:true;tab-size:4;toolbar:true; <img alt="AI学习--机器学习概述" src="https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png" /></p> <h1>例子1:简单使用</h1> <p><img alt="AI学习--机器学习概述" src="https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png" /> from sklearn.datasets import load_iris <img alt="AI学习--机器学习概述" src="https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png" /> import json <img alt="AI学习--机器学习概述" src="https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png" /> def datasets_demo(): <img alt="AI学习--机器学习概述" src="https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png" /> ''' <img alt="AI学习--机器学习概述" src="https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png" /> datasets数据集的使用 <img alt="AI学习--机器学习概述" src="https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png" /> :return: <img alt="AI学习--机器学习概述" src="https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png" /> ''' <img alt="AI学习--机器学习概述" src="https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png" /> iris = load_iris() <img alt="AI学习--机器学习概述" src="https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png" /> print(type(iris.data)) <img alt="AI学习--机器学习概述" src="https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png" /> # print("鸢尾花全部数据集:", iris) # 返回值是一个bunch类型 <img alt="AI学习--机器学习概述" src="https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png" /> print('查看数据集目标值(利用字典形式)',iris['target_names'])# <img alt="AI学习--机器学习概述" src="https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png" /> # 查看数据集目标值(字典形式) ['setosa' 'versicolor' 'virginica'] <img alt="AI学习--机器学习概述" src="https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png" /></p> <p><img alt="AI学习--机器学习概述" src="https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png" /> print('查收数据集描述信息(利用bunch形式)', iris.DESCR) <img alt="AI学习--机器学习概述" src="https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png" /> ''' <img alt="AI学习--机器学习概述" src="https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png" /> =============查收数据集(利用bunch形式) <img alt="AI学习--机器学习概述" src="https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png" /> <strong>Data Set Characteristics:</strong> <img alt="AI学习--机器学习概述" src="https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png" /></p> <p><img alt="AI学习--机器学习概述" src="https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png" /> :Number of Instances: 150 (50 in each of three classes) <img alt="AI学习--机器学习概述" src="https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png" /> :Number of Attributes: 4 numeric, predictive attributes and the class <img alt="AI学习--机器学习概述" src="https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png" /> :Attribute Information: # 花的属性信息 <img alt="AI学习--机器学习概述" src="https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png" /> - sepal length in cm <img alt="AI学习--机器学习概述" src="https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png" /> - sepal width in cm <img alt="AI学习--机器学习概述" src="https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png" /> - petal length in cm <img alt="AI学习--机器学习概述" src="https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png" /> - petal width in cm <img alt="AI学习--机器学习概述" src="https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png" /> - class: # 目标值,也就是对鸢尾花进行分类 <img alt="AI学习--机器学习概述" src="https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png" /> - Iris-Setosa <img alt="AI学习--机器学习概述" src="https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png" /> - Iris-Versicolour <img alt="AI学习--机器学习概述" src="https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png" /> - Iris-Virginica <img alt="AI学习--机器学习概述" src="https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png" /></p> <p><img alt="AI学习--机器学习概述" src="https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png" /> :Summary Statistics: # 鸢尾花的信息统计 <img alt="AI学习--机器学习概述" src="https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png" /></p> <p><img alt="AI学习--机器学习概述" src="https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png" /> ============== ==== ==== ======= ===== ==================== <img alt="AI学习--机器学习概述" src="https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png" /> Min Max Mean SD Class Correlation(相关系数) <img alt="AI学习--机器学习概述" src="https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png" /> ============== ==== ==== ======= ===== ==================== <img alt="AI学习--机器学习概述" src="https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png" /> sepal length: 4.3 7.9 5.84 0.83 0.7826 <img alt="AI学习--机器学习概述" src="https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png" /> sepal width: 2.0 4.4 3.05 0.43 -0.4194 <img alt="AI学习--机器学习概述" src="https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png" /> petal length: 1.0 6.9 3.76 1.76 0.9490 (high!) <img alt="AI学习--机器学习概述" src="https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png" /> petal width: 0.1 2.5 1.20 0.76 0.9565 (high!) <img alt="AI学习--机器学习概述" src="https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png" /> ============== ==== ==== ======= ===== ==================== <img alt="AI学习--机器学习概述" src="https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png" /></p> <p><img alt="AI学习--机器学习概述" src="https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png" /> :Missing Attribute Values: None <img alt="AI学习--机器学习概述" src="https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png" /> :Class Distribution: 33.3% for each of 3 classes. <img alt="AI学习--机器学习概述" src="https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png" /></p> <p><img alt="AI学习--机器学习概述" src="https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png" /> :Creator: R.A. Fisher <img alt="AI学习--机器学习概述" src="https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png" /> :Donor: Michael Marshall (MARSHALL%PLU@io.arc.nasa.gov) <img alt="AI学习--机器学习概述" src="https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png" /> :Date: July, 1988 <img alt="AI学习--机器学习概述" src="https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png" /> ''' <img alt="AI学习--机器学习概述" src="https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png" /></p> <p><img alt="AI学习--机器学习概述" src="https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png" /> print("鸢尾花标本:", iris.data) # 返回时一个ndarray类型,属于numpy类,二维数组 <img alt="AI学习--机器学习概述" src="https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png" /> ''' <img alt="AI学习--机器学习概述" src="https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png" /> 鸢尾花标本: <img alt="AI学习--机器学习概述" src="https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png" /> [[5.1 3.5 1.4 0.2] <img alt="AI学习--机器学习概述" src="https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png" /> [4.9 3. 1.4 0.2] <img alt="AI学习--机器学习概述" src="https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png" /> [4.7 3.2 1.3 0.2] <img alt="AI学习--机器学习概述" src="https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png" /> [4.6 3.1 1.5 0.2]] <img alt="AI学习--机器学习概述" src="https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png" /> ''' <img alt="AI学习--机器学习概述" src="https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png" /></p> <p><img alt="AI学习--机器学习概述" src="https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png" /> print("查看样本数量:", iris.data.shape) # iris.data是一个numpy.ndarray类型;.shape可以直接看到几行几列 <img alt="AI学习--机器学习概述" src="https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png" /> # 查看样本数量: (150, 4) ==》 150个样本,每个样本有4个特征值 <img alt="AI学习--机器学习概述" src="https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png" /> return None <img alt="AI学习--机器学习概述" src="https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png" /></p> <p><img alt="AI学习--机器学习概述" src="https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png" /> if <strong>name</strong> =='<strong>main</strong>': <img alt="AI学习--机器学习概述" src="https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png" /> datasets_demo() <img alt="AI学习--机器学习概述" src="https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png" /></p> <pre><code>![AI学习--机器学习概述](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png) ![AI学习--机器学习概述](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png) **说明:**我们获取到的数据不能全部用于训练数据,因为有一部分的数据是需要用来进行对训练出来的模型进行模型评估的。 ![AI学习--机器学习概述](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png) ![AI学习--机器学习概述](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png) * **数据集的划分* ![AI学习--机器学习概述](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png) ![AI学习--机器学习概述](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png) ![AI学习--机器学习概述](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195109103-592173122.png) ![AI学习--机器学习概述](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png) ![AI学习--机器学习概述](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png) > ![AI学习--机器学习概述](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png) ![AI学习--机器学习概述](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png) * **sklearn中数据集划分API的使用* ![AI学习--机器学习概述](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png) ![AI学习--机器学习概述](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png) </code></pre> <p><img alt="AI学习--机器学习概述" src="https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png" /> sklearn.model_selection.train_test_split(arrays, *option) <img alt="AI学习--机器学习概述" src="https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png" /></p> <pre><code>![AI学习--机器学习概述](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png) ![AI学习--机器学习概述](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png) </code></pre> <p><img alt="AI学习--机器学习概述" src="https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png" /></p> <p><img alt="AI学习--机器学习概述" src="https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png" /></p> <pre><code>![AI学习--机器学习概述](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png) ![AI学习--机器学习概述](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png) </code></pre> <p><img alt="AI学习--机器学习概述" src="https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png" /> 参数: <img alt="AI学习--机器学习概述" src="https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png" /></p> <pre><code>![AI学习--机器学习概述](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png) ![AI学习--机器学习概述](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png) </code></pre> <p><img alt="AI学习--机器学习概述" src="https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png" /> x: 特征值【必须】 <img alt="AI学习--机器学习概述" src="https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png" /></p> <pre><code>![AI学习--机器学习概述](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png) ![AI学习--机器学习概述](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png) </code></pre> <p><img alt="AI学习--机器学习概述" src="https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png" /> y: 目标值【必须】 <img alt="AI学习--机器学习概述" src="https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png" /></p> <pre><code>![AI学习--机器学习概述](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png) ![AI学习--机器学习概述](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png) </code></pre> <p><img alt="AI学习--机器学习概述" src="https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png" /> test_size: 测试集的大小,一般为浮点数,例如0.2,默认0.25【可选】 <img alt="AI学习--机器学习概述" src="https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png" /></p> <pre><code>![AI学习--机器学习概述](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png) ![AI学习--机器学习概述](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png) </code></pre> <p><img alt="AI学习--机器学习概述" src="https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png" /> random_state: 划分数据集的时候,是随机划分的,借助一个随机数种子产生随机,不同的随机数种子产生的结果是不一样的【可选】 <img alt="AI学习--机器学习概述" src="https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png" /></p> <pre><code>![AI学习--机器学习概述](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png) ![AI学习--机器学习概述](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png) </code></pre> <p><img alt="AI学习--机器学习概述" src="https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png" /> 返回值: <img alt="AI学习--机器学习概述" src="https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png" /></p> <pre><code>![AI学习--机器学习概述](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png) ![AI学习--机器学习概述](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png) </code></pre> <p><img alt="AI学习--机器学习概述" src="https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png" /> x_train, x_test, y_train, y_test <img alt="AI学习--机器学习概述" src="https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png" /></p> <pre><code>![AI学习--机器学习概述](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png) ![AI学习--机器学习概述](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png) </code></pre> <p><img alt="AI学习--机器学习概述" src="https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png" /> 训练集特征值、测试集特征值、训练集目标值、测试集目标值 <img alt="AI学习--机器学习概述" src="https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png" /></p> <pre><code>![AI学习--机器学习概述](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png) ![AI学习--机器学习概述](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png) ![AI学习--机器学习概述](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/"image") ![AI学习--机器学习概述](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png) ![AI学习--机器学习概述](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png) 完整版Demo ![AI学习--机器学习概述](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png) ![AI学习--机器学习概述](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png) ;auto-links:true;collapse:false;first-line:1;gutter:true;html-script:false;light:false;ruler:false;smart-tabs:true;tab-size:4;toolbar:true;
![AI学习–机器学习概述](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png)
from sklearn.model_selection import train_test_split
![AI学习–机器学习概述](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png)
from sklearn.datasets import load_iris
![AI学习–机器学习概述](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png)
def datasets_demo():
![AI学习–机器学习概述](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png)

![AI学习–机器学习概述](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png)
iris = load_iris()
![AI学习–机器学习概述](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png)
print(‘查看数据集目标值(利用字典形式)’,iris[‘target_names’])#
![AI学习–机器学习概述](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png)
print(‘查收数据集描述信息(利用bunch形式)’, iris.DESCR)
![AI学习–机器学习概述](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png)
print("鸢尾花标本:", iris.data) # 返回时一个ndarray类型,属于numpy类,二维数组
![AI学习–机器学习概述](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png)
print("查看特征值:", iris.data) # iris.data是一个numpy.ndarray类型;.shape可以直接看到几行几列,共计150,4
![AI学习–机器学习概述](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png)
# 数据集划分
![AI学习–机器学习概述](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png)
x_train, x_test, y_train, y_test = train_test_split(iris.data, iris.target, test_size=0.2, random_state=2019)
![AI学习–机器学习概述](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png)
print(‘训练集的特征值x_train’, x_train)
![AI学习–机器学习概述](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png)
print(‘训练集的特征值x_train有多少行多少列’, x_train.shape) # (120,4) 即150*0.8
![AI学习–机器学习概述](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png)
print(‘测试集的特征值x_test’, x_test)
![AI学习–机器学习概述](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png)

![AI学习–机器学习概述](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png)
return None
![AI学习–机器学习概述](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png)

![AI学习–机器学习概述](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png)
if __name__ ==’__main__’:
![AI学习–机器学习概述](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png)
datasets_demo()
![AI学习–机器学习概述](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20220813/519608-20190308195111146-1525160127.png)

Original: https://www.cnblogs.com/ftl1012/p/10493332.html
Author: 小a玖拾柒
Title: AI学习–机器学习概述

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/9591/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

免费咨询
免费咨询
扫码关注
扫码关注
联系站长

站长Johngo!

大数据和算法重度研究者!

持续产出大数据、算法、LeetCode干货,以及业界好资源!

2022012703491714

微信来撩,免费咨询:xiaozhu_tec

分享本页
返回顶部
最近整理资源【免费获取】:   👉 程序员最新必读书单  | 👏 互联网各方向面试题下载 | ✌️计算机核心资源汇总