sklearn快速入门教程：标准化

2023年6月25日上午6:01 • 人工智能 • 阅读 74

标准化：

让数据服从标准正态分布

StandardScaler

实现

from sklearn.preprocessing import StandardScaler
data = [[-1, 2], [-0.5, 6], [0, 10], [1, 18]]
scaler = StandardScaler()#实例化
scaler.fit(data) #生成了均值&方差
result = scaler.transform(data) #通过transform接口导出标准化结果
result
scaler.fit_transform(data) #将上面3行一步到位

array([[-1.18321596, -1.18321596],
       [-0.50709255, -0.50709255],
       [ 0.16903085,  0.16903085],
       [ 1.52127766,  1.52127766]])

result的两列一模一样，可见：

data中0、1两列提供的信息量是一样的。

逆转标准化：

scaler.inverse_transform(result)

array([[-1. ,  2. ],
       [-0.5,  6. ],
       [ 0. , 10. ],
       [ 1. , 18. ]])

解析

scaler.mean_ #属性mean_:查看均值

array([-0.125,  9.   ])

StandardScaler object中，默认按列处理数据。因为data有2列数据，所以均值有2个

scaler.var_ #属性var_:查看方差

array([ 0.546875, 35.      ])

StandardScaler object中，默认按列处理数据。因为data有2列数据，所以方差有2个

result.mean() #numpy.ndarray object的函数mean():查看result（数组均值

0.0

result.var() #numpy.ndarray object的函数var():查看方差

1.0

Original: https://blog.csdn.net/ykrsgs/article/details/126255132
Author: Erick Yu
Title: sklearn快速入门教程：标准化

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/650356/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

一文尽览 | 基于点云、多模态的3D目标检测算法综述！（Point/Voxel/Point-Voxel）

点击下方卡片，关注” 自动驾驶之心“公众号 ADAS巨卷干货，即可获取点击进入→ 后台回复【ECCV2022】获取ECCV2022所有自动驾驶方向论文！…

人工智能 2023年7月25日
00181
Python Pandas用法整理

Pandas简介 Pandas是一-种基于NumPy的开源的数据分析工具包,提供了高性能、简单易用的数据结构和数据分析函数。Pandas提供了方便的类表格和类SQL的操作，同时提…

人工智能 2023年7月7日
0065
TensorFlow实现条件批归一化（Conditional Batch Normalization）

条件批归一化（Conditional Batch Normalization）批归一化 (Batch Normalization, BN) 是深度学习中常用的网络训练技巧，它不仅…

人工智能 2023年5月23日
0068
逻辑回归模型在处理大规模数据时会遇到什么问题

问题描述在处理大规模数据时，逻辑回归模型可能会遇到一些问题。本文将详细介绍逻辑回归算法的原理和公式推导，并给出计算步骤和复杂的Python代码示例。我们将使用虚拟数据集进行演示。…

人工智能 2023年12月31日
0041
【第二弹】Python题库刷题—从基础到进阶

您好，我是码农飞哥（wei158556），感谢您阅读本文，欢迎一键三连哦。💪🏻 1. Python基础专栏，基础知识一网打尽，9.9元买不了吃亏，买不了上当。Python从入门到…

人工智能 2023年6月28日
00104
最新CCF会议|2022-2023顶会会议时间+投稿时间+官网链接（视觉+多媒体+数据挖掘+数据库+通用人工智能）

图形学与多媒体序号刊物简称链接出版社截至日期类别会议地点会议举办日期1ACM MM ACM International Conference on Multimedia2022….

人工智能 2023年7月25日
0060
【pointNet】基于pointNet的三维点云目标分类识别matlab仿真

1.软件版本 matlab2021a 2.系统概述这里，采用的pointnet网络结构如下图所示：在整体网络结构中，首先进行set abstraction，这一部分主要即对点…

人工智能 2023年7月1日
0084
OD-Model【6】：YOLOv2

系列文章目录 YOLO目标检测系列（一）：OD-Model【5】：YOLOv1YOLO目标检测系列（二）：OD-Model【6】：YOLOv2YOLO目标检测系列（三）：OD-Mo…

人工智能 2023年7月10日
0065
Python OpenCV – namedWindow() 函数

# Python Program to explain namedWindow() method # Importing OpenCV import cv2 # Path to i…

人工智能 2023年7月19日
0067
【Sklearn】【API详解】【SVM】- sklearn.svm.SVR参数详解（二）

SVR为Support Vector Regression的简写，顾名思义，其是基于支持向量的回归器模型中的两个自由参数为 C 和 epsilon，自由参数不能通过理论推测，可…

人工智能 2023年6月16日
0097
图像相似算法最全总结

图像相似算法比如有图像A和图像B，分别计算两幅图像的直方图，HistA，HistB，然后计算两个直方图的归一化相关系数（巴氏距离，直方图相交距离）等等。这种思想是基于简单的数学…

人工智能 2023年6月17日
0066
[山东科技大学OJ]1107 Problem A: 编写函数：Swap (I) (Append Code)

Time Limit: 1 Sec Memory Limit: 16 MB Submit: 17642 Solved: 11482 [Submit][Status] Descrip…

人工智能 2023年6月27日
0089
YOLOV5 网络结构 yaml 文件参数理解

YOLOV5：训练自己数据集YOLOV5: Mosaic 数据增强YOLOV5：网络模块理解这里对 YOLOV5 代码中解析模型部分代码进行理解。文章目录前言一、ymal …

人工智能 2023年5月26日
0098
NLP-D9-第一场大数据比赛D1&知识蒸馏&翻译论文&CATTI备考-第一套综合

，第一步是安装Spark和Spark 。您可以从官方网站下载Spark和Spark 的二进制文件，也可以使用Maven或SBT等构建工具安装它们。安装完成后，您可以使用Spark…

人工智能 2023年5月28日
0064
机器学习-DBSCAN聚类算法

文章目录 DBSCAN算法原理 DBSCAN算法流程 DBSCAN的参数选择 DBSCAN优缺点总结 K-Means算法和Mean Shift算法都是基于距离的聚类算法，基于距离的…

人工智能 2023年6月2日
0071
基于Prompt的MLM文本分类

简介常规NLP做文本分类时常用Transfer Learning的方式，在预训练bert上加一个分类层，哪个输出节点概率最大则划分到哪一类别。而基于Prompt的MLM文本分类是…

人工智能 2023年5月30日
0062

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

sklearn快速入门教程：标准化

实现

解析

大家都在看