SVM ValueError: y should be a 1d array, got an array of shape (1, 250) instead. Found input variable

2023年7月29日下午11:25 • 人工智能 • 阅读 66

阅读前请看一下：我是一个热衷于记录的人，每次写博客会反复研读，尽量不断提升博客质量。文章设置为仅粉丝可见，是因为写博客确实花了不少精力。希望互相进步谢谢！！

文章目录

阅读前请看一下：我是一个热衷于记录的人，每次写博客会反复研读，尽量不断提升博客质量。文章设置为仅粉丝可见，是因为写博客确实花了不少精力。希望互相进步谢谢！！
1、问题描述：
2、分析与解决办法：
3、DataConversionWarning: A column-vector y was passed when a 1d array was expected. Please change the shape of y to (n_samples, ), for example using ravel().

1、问题描述：

背景：机器学习时关于SVM的学习，之前线性回归、逻辑回归切分数据集时均是将X切分为（输入特征维数，样本数），例如（5，250）代表输入特征是5维，样本数是250个。那是因为之前手敲线性、逻辑回归时用到的数学公式要求维度是这样。但是如果直接使用sklearn库里的现成函数，需要的恰恰相反，即需要（样本数，输入特征维数）这样的格式作为参数的输入。否则报错。

函数：svm.SVC中的 fit() 函数

bug：

ValueError: y should be a 1d array, got an array of shape (1, 250) instead.
ValueError: Found input variables with inconsistent numbers of samples: [5, 250].
ValueError: X has 250 features, but SVC is expecting 5 features as input.
DataConversionWarning: A column-vector y was passed when a 1d array was expected. Please change the shape of y to (n_samples, ), for example using ravel().

code：


res = svm.SVC(C=svm_C, kernel=svm_kernel)
res.fit(train_set_X, train_set_y)
train_predict_y = res.predict(train_set_X)
test_predict_y = res.predict(test_set_X)

2、分析与解决办法：

1、首先运行上方原代码，会报错：

ValueError: y should be a 1d array, got an array of shape (1, 250) instead。

查看变量列表如下图

SVM ValueError: y should be a 1d array, got an array of shape (1, 250) instead. Found input variable

可以看到train_set_y的shape是(1,250)，而这里期望的shape是(250,)。

所以解决办法：

二维转一维即可，我习惯用reshape(-1)，当然还有flatten()、ravel()、squeeze()函数都能实现。


res = svm.SVC(C=svm_C, kernel=svm_kernel)
res.fit(train_set_X, train_set_y.reshape(-1))

train_predict_y = res.predict(train_set_X)
test_predict_y = res.predict(test_set_X)

2、但运行上述代码又报错：

ValueError: Found input variables with inconsistent numbers of samples: [5, 250]

意思是”样本数和输入变量不一致”。想不通，就去查看源码的说明，如下：

可以看到上图，当我们将train_set_y由 (1,250) 变为 (250,) 并将其作为y传入时，250会被视作样本个数，自己也确实是250个样本的标注，这一点符合。

但是请注意，这里train_set_X的shape是（5，250），按照上图注释的意思，5会被视作样本数，250被实作输入特征的维数，而后面train_set_y是被视作有250个样本，故自然报错不匹配。

所以解决办法：

1、使用.T属性，将train_set_X的shape由（5，250）转为（250，5）;
2、既然train_set_X使用了.T属性，为了好看，train_set_y也先使用.T属性有（1，250）转为（250，1），再使用.reshape(-1)即可；


res = svm.SVC(C=svm_C, kernel=svm_kernel)
res.fit(train_set_X.T, train_set_y.T.reshape(-1))

train_predict_y = res.predict(train_set_X)
test_predict_y = res.predict(test_set_X)

其实吧，不用这么麻烦，直接最初切分数据集时变成需要的不就行了？不然之后用一次还要.T转一次。

2、但运行上述代码还报错：

-> 67 train_predict_y = res.predict(train_set_X) #训练集上的预测
ValueError: X has 250 features, but SVC is expecting 5 features as input.

那这里的分析就不难了，再使用.T就行了。故修正code如下：


res = svm.SVC(C=svm_C, kernel=svm_kernel)
res.fit(train_set_X.T, train_set_y.T.reshape(-1))

train_predict_y = res.predict(train_set_X.T)
test_predict_y = res.predict(test_set_X.T)

3、DataConversionWarning: A column-vector y was passed when a 1d array was expected. Please change the shape of y to (n_samples, ), for example using ravel().

自己后来看老师标准代码时，老师传入的X是（250，5），y是（250，1）。自己产生了疑惑，定义里不是说了y应该为（250，）。于是自己尝试按照老师的运行了下，发现给了个警告。所以虽然不用管也能运行，但还是按照规范吧。

解决方法：

见之前写的文章《DataConversionWarning: A column-vector y was passed when a 1d array was expected. Please change the》

码字不易，谢谢点赞！！！
码字不易，谢谢点赞！！！
码字不易，谢谢点赞！！！

Original: https://blog.csdn.net/qq_40967086/article/details/127437453
Author: 一只菜得不行的鸟
Title: SVM ValueError: y should be a 1d array, got an array of shape (1, 250) instead. Found input variable

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/723115/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

网卡驱动黄字三步曲

最近连日下雨，空气湿度很高，某日打开笔记本发现连不上网，不显示可用无线网络。折腾了几天。大概经历了如下的几步（省流版：跳到第5步）： 1、检查驱动更新连有线网下载了驱动精灵，显…

人工智能 2023年6月4日
0061
python数据分析基础010 -利用pandas带你玩转excel表格（终篇）

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年7月7日
0072
语音识别模型网络结构_语音识别端到端模型解读：FSMN及其变体模型

摘要：在很长一段时间内，语音识别领域最常用的模型是GMM-HMM。但近年来随着深度学习的发展，出现了越来越多基于神经网络的语音识别模型。一、概述在很长一段时间内，语音识别领域最…

人工智能 2023年5月27日
00101
什么是神经网络

人工智能 2024年1月6日
0093
激光雷达和相机联合标定

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年6月24日
0068
精选23个pandas常用函数

公众号：尤而小屋作者：Peter编辑：Peter 大家好，我是Peter~ 从26个字母中精选出23个Pandas常用的函数，将它们的使用方法介绍给大家。其中o、y、z没有相应的函…

人工智能 2023年7月6日
0096
python模块pandas库常用操作小结

记录一些个人在python的pandas库常用的操作的小结，方便后续开发记录，同时助人助己。持续更新中按数据格式，读取excel、csv等，输出列名、获取总量。 import …

人工智能 2023年7月8日
0070
Windows OpenGL ES 图像褐色

Original: https://blog.csdn.net/ZhaDeNianQu/article/details/127815857Author: 猿说编程Title: Wi…

人工智能 2023年6月26日
0068
【数据处理与分析】电商订单数据计算

任务详情：请根据系统提供的订单数据表，按要求完成以下三个任务：传入一个字符串，返回订单总金额 (quantity * item_price)最大或最小的商品，并返回商品的名称(…

人工智能 2023年7月7日
00190
python dataframe遍历_python中如何按行遍历Dataframe

在python的DataFrame中，因为数据中可以有多个行和列。而且每行代表一个数据样本，我们可以将DataFrame看作数据表，那你知道如何按照数据表中的行遍历吗？本文介绍py…

人工智能 2023年7月7日
0086
机器学习——基于python的鸢尾花SVM练习（包含超参数批量筛选、交叉验证）

写在前面——虽然本人一直对机器学习感兴趣，但是一直没有动手实践，每次都是看一点入门就放弃了。现在因为课题需要，刚好可以边实践边学习。前面写了一个基于R语言的SVM练习，后来发现还是…

人工智能 2023年6月15日
0078
目标检测学习1——iou计算与非极大值抑制NMS

刚开始学习目标检测，都是在学习一些经典的目标检测框架，个人认为在大量阅读和理解别人现成的代码时，也要懂得去动手模仿，尝试着去修改别人的代码，即使是自己抄一遍别人的代码，也难免会发生…

人工智能 2023年7月10日
0070
PC语音识别GUI设计（接上篇）

复制就行不多逼逼 import tkinter as tk from tkinter import * from tkinter import messagebox import…

人工智能 2023年5月25日
0087
【云原生】一篇打通微服务架构，nacos + gateway + Redis + MySQL + docker

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年5月30日
0086
入门激光雷达点云的3D目标检测

前言虽然业界有很多的争论，但是LiDAR在目前的L3/L4级自动驾驶系统中依然是不可或缺的传感器，因为它可以提供稠密的3D点云，非常精确的测量物体在3D空间中的位置和形状，而这是…

人工智能 2023年6月17日
0092
KNN算法数字识别完整代码——打开就可以跑

目录 1、原理 2、数据集 3、代码以及注释 1. 数据准备： 2. 构建训练数据集： 3. 测试集数据测试： 4、运行结果 5、总结 6、致谢 1、原理邻近算法，或者说K最近邻…

人工智能 2023年7月16日
0072

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

SVM ValueError: y should be a 1d array, got an array of shape (1, 250) instead. Found input variable

文章目录

大家都在看