癌症分类预测-良／恶性乳腺癌肿瘤预测

2023年7月2日上午10:10 • 人工智能 • 阅读 59

import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.linear_model import LogisticRegression

#ssl&#x62A5;&#x9519;&#x7684;&#x8BDD;&#x5C31;&#x5BFC;&#x5165;
import ssl
ssl._create_default_https_context = ssl._create_unverified_context

1.&#x83B7;&#x53D6;&#x6570;&#x636E;
names = ['Sample code number', 'Clump Thickness', 'Uniformity of Cell Size', 'Uniformity of Cell Shape',
                   'Marginal Adhesion', 'Single Epithelial Cell Size', 'Bare Nuclei', 'Bland Chromatin',
                   'Normal Nucleoli', 'Mitoses', 'Class']

data = pd.read_csv("https://archive.ics.uci.edu/ml/machine-learning-databases/breast-cancer-wisconsin/breast-cancer-wisconsin.data",
                  names=names)
data.head()

上述代码可以直接导入先看看结果，因为列名不对所以才用names指定列名

2.&#x57FA;&#x672C;&#x6570;&#x636E;&#x5904;&#x7406;
2.1 &#x7F3A;&#x5931;&#x503C;&#x5904;&#x7406;
data = data.replace(to_replace="?", value=np.NaN)
data = data.dropna()
2.2 &#x786E;&#x5B9A;&#x7279;&#x5F81;&#x503C;,&#x76EE;&#x6807;&#x503C;
x = data.iloc[:, 1:10]
x.head()
y = data["Class"]
y.head()
2.3 &#x5206;&#x5272;&#x6570;&#x636E;
x_train, x_test, y_train, y_test = train_test_split(x, y, random_state=22)

data.ioc[:,1:10] 解释

：表示所有行

1:10 表示1到10列

3.&#x7279;&#x5F81;&#x5DE5;&#x7A0B;(&#x6807;&#x51C6;&#x5316;)
transfer = StandardScaler()
x_train = transfer.fit_transform(x_train)
x_test = transfer.transform(x_test)

以上是对数据进行标准化处理

4.&#x673A;&#x5668;&#x5B66;&#x4E60;(&#x903B;&#x8F91;&#x56DE;&#x5F52;)
estimator = LogisticRegression()
estimator.fit(x_train, y_train)

采用逻辑回归将训练数据和训练的目标值y 传进去

自动出结果

5.&#x6A21;&#x578B;&#x8BC4;&#x4F30;
y_predict = estimator.predict(x_test)
y_predict
estimator.score(x_test, y_test)

用测试数据苹果预测结果！

Original: https://blog.csdn.net/weixin_44199723/article/details/126508227
Author: H A I
Title: 癌症分类预测-良／恶性乳腺癌肿瘤预测

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/665222/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

第十八天计算机视觉之语义分割

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年5月26日
0089
【机器学习sklearn】高斯朴素贝叶斯 Gaussian naive bayes

贝叶斯Bayes – Thomas Bayes 前言一、贝叶斯决策论（Bayesian decision theory）二、实例：高斯朴素贝叶斯 Gaussian …

人工智能 2023年6月30日
0069
最小价格 (爱思创算法四)(期中测试)(答案记录)

这篇文章还是是为了帮助一些像我这样的菜鸟找到简单的题解题目描述小思老师和小爱老师经常会结伴一起去超市购物，一天她们分别买了东西放在2个购物车（分别记为A车、B车）里， A…

人工智能 2023年6月27日
0097
【深度学习】（三）图像分类

; 图像分类🍉 文章目录 * – 图像分类🍉* 前言🎠* 一、ILSVRC竞赛* 二、卷积神经网络（CNN）发展* – 1.网络进化 – 2.A…

人工智能 2023年7月3日
0056
刘二大人 PyTorch深度学习实践笔记 P11 卷积神经网络（高级篇）

刘二大人 PyTorch深度学习实践笔记 P11 卷积神经网络（高级篇） 1、GoogleNet * I 网络结构 II 减少代码冗余思想(减少代码重复) 2、Inception…

人工智能 2023年7月22日
0055
学习笔记：C++环境下OpenCV的findContours函数的参数详解及优化

这个是Visual Studio2019版本在OpenCV环境配置好后所显示的 6个参数，也即为全部参数但是，常用参数仅有四个(参见程序里的第二行注释) cv::void fi…

人工智能 2023年6月17日
0085
R语言与数据分析练习：K-Means聚类

R语言与数据分析练习：K-Means聚类 k-means实现 k-means算法，是一种最广泛使用的聚类算法。k-means以k作为参数，把数据分为k个组，通过迭代计算过程，将各个…

人工智能 2023年6月2日
0090
机器学习算法六：多层感知机（MLP）

感知机模型：将线性可分的数据，利用一个线性超平面将其分类；（感知机只有输出层神经元进行激活函数处理，即只有一层功能神经元）其模型公式为：其中感知机模型损失定义：其中M表示误分类…

人工智能 2023年7月13日
0066
EX3：神经网络手写数字识别（多类分类）

EX3：神经网络手写数字识别（多类分类）之前实现了多类逻辑回归来识别手写数字。然而，逻辑回归不能形成更复杂的假设，因为它只是一个线性分类器。（虽然可以向其中添加多项式特征，但…

人工智能 2023年7月14日
0057
数据分析——统计学多指标统计方法

一、多变量分析方法的选择https://pan.baidu.com/s/1ogCfSwcNvxlJXPhPzeHlGQ 提取码: qs3d；分析的目的：区分有监督分析和无监督分析1…

人工智能 2023年6月11日
0061
用python实现神经网络

一、BP神经网络这里介绍目前常用的BP神经网络，其网络结构及数学模型如下： x为 n 维向量， y 为 n 维向量，隐含层有 q 个神经元。假设 N 有个样本数据， 𝑦 𝑡 , …

人工智能 2023年7月27日
0057
CNN中的底层、高层特征、上下文信息、多尺度

一、CNN中的底层、高层特征: 简短总结：分类要求特征有较多的高级信息，回归（定位）要求特征包含更多的细节信息 1）图像的低层特征（对定位任务帮助大，我们可以想想比如轮廓信息都不…

人工智能 2023年7月29日
0056
Java实战-用Java mail实现Exchange发邮件给你喜欢的人

目录 1. 官方指导文章 2. 需要用到com.microsoft.ews-java-api * 2.1 maven中添加 2.2 gradle中添加 3. 完整代码：新建一个Ma…

人工智能 2023年7月29日
0083
机器学习-多元分类/回归决策树模型(tree包)

决策树(Decision Tree)：Tree-Based方法用于多元数据的分类和回归。决策树点是再现了人类做决策的过程，树可以图形化显示，很容易解释。但是树的分类和回归准确度比不…

人工智能 2023年6月16日
0077
Python学习记录(8)——series、dataframe基本操作

重新索引可以按照指定的索引顺序排列数据，如果没有该索引则显示为NaN obj = pd.Series([4.5, 7.2, -5.3, 3.6], index=[‘d’, ‘b’,…

人工智能 2023年7月16日
0051
OpenCV综合练习2——扑克牌(文本)校正

图像处理综合练习2——多角度扑克牌校正这是我刚开始学习图像处理时在B站上所接触的一个文本校正小练习，但是视频中的场景角度单一，只能校正固定视角下的文本，相对简单，但对于初学者来说…

人工智能 2023年7月19日
0068

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

癌症分类预测-良／恶性乳腺癌肿瘤预测

大家都在看