TypeError: fit_transform() missing 1 required positional argument: ‘X‘——报错

2023年7月22日上午2:21 • 人工智能 • 阅读 90

文章目录

1 解决过程【成功】
2 学习Sklearn之数据预处理——StandardScaler
*
2.1 数据处理——标准化、归一化
2.2 为什么要归一化？
2.3 归一化的适用范围
2.4 归一化公式
2.5 标准化公式
3 标准化和归一化区别？
4 数据处理时的选择

1 解决过程【成功】

源代码如下：


import pandas as pd
from sklearn.preprocessing import StandardScaler

def load_data() -> pd.DataFrame:
    data = pd.read_excel('data3.xlsx')
    print(data)
    data.columns = ['BillingDate', 'VolumnHL']
    print("======================")
    print(data)
    return data

def max_min_normalization(data:pd.DataFrame) ->pd.DataFrame:

    volume = data.VolumnHL.values
    print("===max_min_normalizetion===================")
    print(volume)
    volume1 = volume.reshape(-1, 1)
    volume2 = volume.reshape(len(volume), 1)

    volume = StandardScaler.fit_transform(volume2)
    print(volume)

data = load_data()
max_min_normalization(data)

输出的报错信息：
解决：就是少了一个括号!!

TypeError: fit_transform() missing 1 required positional argument: ‘X‘——报错

* 当然，在很多代码中，还有很多教程喜欢这样去写:

scaler = StandardScaler()
x_train = scaler.fit_transform(x_train)

总而言之就是 StanderScaler后面的 ()千万不要忘记！ *否则报错之后很难排查出来！

2 学习Sklearn之数据预处理——StandardScaler

2.1 数据处理——标准化、归一化

数据标准化和归一化，都属于数据特征无量纲的一种方式。
【”无量纲”——将不同规格的数据转换都统一规格，或不同分布的数据转换到某个特定分布的需求】
特别是对于需要计算梯度和矩阵的模型（例如逻辑回归中通过梯度下降求解损失函数），无量纲化之后的数据特征对于模型求解有加速作用！
在k近邻、聚类算法中，需要计算距离时，使用无量纲化可以提升模型精度，避免 异常值对整体计算造成的影响。
中心化处理：让所有记录减去一个固定值，即让数据样本平移到某个位置；
缩放处理：通过除以某一个固定值，将数据固定在某个范围之内！

2.2 为什么要归一化？

归一化后加快了梯度下降求最优解的速度；
如果机器学习模型使用梯度下降Q法求最优解时，归一化往往非常有必要，否则很难收敛甚至不能收敛。
归一化有可能提高精度；
一些分类器需要计算样本之间的距离(如欧氏距离Q)，例如KNN。如果一个特征值域范围非常大，那么距离计算就主要取决于这个特征，从而与实际情况相悖(此如这时实际情况是值域范围小的特征更重要)。

2.3 归一化的适用范围

概率模型（树型模型）不需要做归一化

2.4 归一化公式

Normalization和Min-Max Scaling都是数据归一化：数据x按照最小值中心化之后，再按极差（最大值-最小值）进行缩放，最终会被收敛到[0,1]之间！

; 2.5 标准化公式

标准化：数据x按照均值中心化之后，再按标准差缩放， *数据就会服从均值为0，方差为1的标准正态分布，这个过程就叫做数据标准化。

如果本篇文章对你有帮助的话，麻烦收藏+点赞+关注我哦！

3 标准化和归一化区别？

首先明确，标准化和归一化都不会改变数据的分布。
归一化会严格限制数据变化后的范围，默认是[0,1]
标准化则没有严格的区间，变化之后的数据没有范围，只是数据整体的均值为0，标准差为1

4 数据处理时的选择

在大多数机器学习算法中，因为 归一化MinMaxScaler对异常值敏感，所以都会选择 标准化StandardScaler进行特征缩放，例如聚类、逻辑回归、支持向量机、PCA算法等等。
如果在缩放时，不涉及距离、梯度等的计算，并且对数据的范围有严格要求，就可以使用归一化进行缩放。

Original: https://blog.csdn.net/weixin_42521185/article/details/123990006
Author: 谜底是你_
Title: TypeError: fit_transform() missing 1 required positional argument: ‘X‘——报错

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/708261/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

主流深度学习算法简介

** 深度学习算法简介** 1、深度学习主流算法包括: 1.1 CNN (卷积神经网络)卷积神经网络（CNN）是最常见的深度学习方法之一。自20 世纪80 年代后期以来，CNN…

人工智能 2023年6月16日
0083
python pandas 数据处理：删除特定行、列

dropna() 方法过滤任何含有缺失值的行 pandas.DataFrame里，如果一行数据有任意值为空，则过滤掉整行，这时候使用 dropna()方法是合适的。下面的案例，任意…

人工智能 2023年7月6日
0059
OpenCV——Canny边缘检测（cv2.Canny()）

Canny边缘检测 Canny 边缘检测是一种使用多级边缘检测算法检测边缘的方法。1986 年，John F. Canny 发表了著名的论文 A Computational App…

人工智能 2023年6月23日
0085
python指定间隔内数据_python – 在pandas中重新采样不规则间隔的数据

是否可以在不规则间隔的数据上使用重采样？ (我知道文档说它是”重新采样常规时间序列数据”,但我想尝试它是否适用于不规则数据.也许它没有,或者我做错了.) 在…

人工智能 2023年7月9日
0073
Python Pandas merge 连接参数详解数据合并数据拼接

; pd.merge 根据一个或多个键将 两个DataFrame 进行 行 连接（横向 / 左右连接），类似于SQ…

人工智能 2023年7月7日
0091
K-means算法手动实现

1. K-means算法 k均值聚类算法（k-means clustering algorithm）是一种迭代求解的聚类分析算法，其步骤是，预将数据分为K组，则随机选取K个对象作为…

人工智能 2023年6月2日
0080
2022机器学习实战课内容笔记 – Lesson 3、线性回归手动实现与模型局限

Lesson 3.3 线性回归手动实现与模型局限 *知识点补充相关性系数计算 import numpy as np import pandas as pd import matp…

人工智能 2023年6月11日
0091
深度学习之路2

TensorFlow的特点与介绍 CPU与GPU的对比一个通俗易懂的理解： TensorFlow的结构分析所以，写TensorFlow代码时，一个是构建图的阶段（流程图，定义数…

人工智能 2023年5月25日
0073
selenium用法详解【从入门到实战】【Python爬虫】【4万字】

👉跳转文末👈 获取实战源码与作者联系方式，共同学习进步文章目录 * – 简介 – selenium安装 – 安装浏览器驱动 –…

人工智能 2023年7月3日
0081
使用BERT + Bi-LSTM + CRF 实现命名实体识别

文章目录 1.前言 2.数据预处理 * – 2.1本地查看数据转换后的结果 3.构建数据集 4.数据集分割 5.模型架构 * – 5.1模型初始化 5.2前…

人工智能 2023年5月27日
0075
Informer：比Transformer更有效的长时间序列预测

目录 AAAI 2021最佳论文：比Transformer更有效的长时间序列预测 Background Why attention 编辑编辑编辑 Methods:the de…

人工智能 2023年6月16日
0077
yoloV5 使用——训练速度慢，加速训练

首先大家会按照官方的readme文件进行安装，连接：https://github.com/ultralytics/yolov5 此时有两点需要注意： 1、强烈建议大家使用conda…

人工智能 2023年7月12日
00240
基于python的语音识别毕业设计_基于matlab的语音识别系统的设计本科毕设毕业论文…

语音识别的主要目的是让机器理解人们在说什么，也就是在各种情况下准确识别语音的内容。 [En] The main purpose of speech recognition is t…

人工智能 2023年5月25日
0076
使用Pytorch快速搭建神经网络模型（附详细注释和讲解）

文章目录 0 前言 1 数据读入 2 模型搭建 3 模型训练 4 模型测试 5 模型保存 6 参考博客 0 前言代码参考了知乎上”10分钟快速入门PyTorch&#8…

人工智能 2023年7月6日
0084
从DDPM到DDIM：深入解读《Denoising Diffusion Implicit Models》

Diffusion Models专栏文章汇总：入门与实战 _前言：_DDIM发表在ICRL2021上，是DDPM重要的改进之一，能显著提高DDPM的样本质量、减少采样时间，并且已经…

人工智能 2023年6月23日
00128
利用DCT进行jpg压缩；对图像进行二值化【matlab代码】

源码链接: https://blog.csdn.net/qq_44394952/article/details/122588241. 一、任务及目标在远程抄表系统中，需要将采集的…

人工智能 2023年6月20日
00105

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31