从零开始数据分析Kaggle项目——泰坦尼克号（五）

2023年8月21日下午2:13 • Python • 阅读 70

从零开始数据分析Kaggle项目—泰坦尼克号2—2.1


import pandas as pd
import numpy as np

df = pd.read_csv("train.csv")


df.isna().sum()
df.info()

<class 'pandas.core.frame.dataframe'>
RangeIndex: 891 entries, 0 to 890
Data columns (total 12 columns):
 #   Column       Non-Null Count  Dtype
 0   PassengerId  891 non-null    int64
 1   Survived     891 non-null    int64
 2   Pclass       891 non-null    int64
 3   Name         891 non-null    object
 4   Sex          891 non-null    object
 5   Age          891 non-null    float64
 6   SibSp        891 non-null    int64
 7   Parch        891 non-null    int64
 8   Ticket       891 non-null    object
 9   Fare         891 non-null    float64
 10  Cabin        362 non-null    object
 11  Embarked     889 non-null    object
dtypes: float64(2), int64(5), object(5)
memory usage: 83.7+ KB
</class>

df.isna().sum()

PassengerId      0
Survived         0
Pclass           0
Name             0
Sex              0
Age              0
SibSp            0
Parch            0
Ticket           0
Fare             0
Cabin          529
Embarked         2
dtype: int64


df1 = df.dropna(subset=['Cabin', 'Embarked'])
df1.isna().sum()
df1.info()

`

Int64Index: 360 entries, 1 to 889
Data columns (total 12 columns):
# Column Non-Null Count Dtype

Original: https://blog.csdn.net/weixin_45058606/article/details/122003899
Author: 一个游在的小鱼
Title: 从零开始数据分析Kaggle项目——泰坦尼克号（五）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/755791/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Pycharm加载conda创建pytorch虚拟环境 & import torch报错问题解决

### 回答1：我可以给您一些建议，您可以使用 PyCharm_的工具来添加 _PyTorch_环境，它可以帮助您快速管理安装和配置 _Python_解释器和第三方库。答案： …

Python 2023年8月3日
0052
Python关键字(保留字)

3.2 Python关键字(保留字) 保留字又称 关键&#x5…

Python 2023年5月24日
0077
使用python进行视频图片提取

操作系统： Windows 10 [版本 10.0.19043.1165] Python 版本 : 3.9.2_x64 可以借助python代码使用opencv实现，命令行示例代…

Python 2023年5月25日
0075
IndexError: index 1 is out of bounds for axis 0 with size 1

注：仅仅为了自己记录该错误是索引超出了列表的长度的，比如创建了长度为1的数组a，而我的索引为在a[1]: import numpy as npa = np.empty(1)prin…

Python 2023年8月27日
0059
Python数据可视化 |4、可视化案例练习题目(基于Matplotlib)

目录航班乘客变化分析鸢尾花花型尺寸分析餐厅小费情况分析泰坦尼克号海难幸存状况分析航班乘客变化分析 %matplotlib inline import matplotlib…

Python 2023年9月2日
00261
【机器学习】李宏毅——Transformer

Transformer具体就是属于Sequence-to-Sequence的模型，而且输出的向量的长度并不能够确定，应用场景如语音辨识、机器翻译，甚至是语音翻译等等，在文字上的话…

Python 2023年10月28日
0034
从源码的角度重新认识pytest（中）

3. pytest 目录结构从 github 上 pytest 代码仓库中得到的文件非常多，其中大部分是工程文件，存放 python代码的是下面两个目录 testing 目录存放…

Python 2023年9月15日
0036
机器学习Pandas 库

目录 💥个人简介💖 作者简介：⭐️heart_6662，还在学习（卷）当中，欢迎交流指正~😜📝 个人主页heart的博客🔥📧如果文章知识点有错误的地方，请指正留言📝！和大家一起学习…

Python 2023年8月20日
0066
Python游戏开发–外星人入侵（源代码）

文章目录 1.效果展示 2. 《外星人入侵》源代码 * 2.1 image 2.2 alien_invasion.py 2.3 alien.py 2.4 bullet.py 2.5…

Python 2023年9月17日
0050
Flask框架-Graphql的使用

Flask框架-Graphql的使用 – 潘登同学的flask学习笔记文章目录 * – Flask框架-Graphql的使用 — 潘登同学的flask学习…

Python 2023年8月12日
0058
【羊了个羊】一次、两次、三次….你从羊圈的魔咒里出来了嘛~

Original: https://www.cnblogs.com/Qqun261823976/p/16708808.htmlAuthor: python倩Title: 【羊了个羊…

Python 2023年6月9日
00106
Python中的shape[0]、shape[1]和shape[-1]分别是什么意思（附代码）

shape函数是Numpy中的函数，它的功能是读取矩阵的长度，比如shape[0]就是读取矩阵第一维度的长度。直接用.shape可以快速读取矩阵的形状，使用shape[0]读取矩…

Python 2023年8月30日
0085
python 图像相减的不同方法

对于图像相减采用如下方法进行结果对比，本案例中采用灰度图像 gray_img.jpg 如下： gray_cur.jpg如下：不同算法图像相减之后得结果： 1、采用矩阵直接相减：d…

Python 2023年8月23日
0061
创建scrapy项目

模块名职责是否需要实现Scrapy Engine（引擎）总指挥：负债数据和信号在不同的模块之间传递scrapy 已经实现Scheduler（调度器）一个队列，存放引擎发过来的re…

Python 2023年10月6日
0047
【Django】宝塔面板部署Django+MySQL项目实战

文章目录一、环境准备 * 1.1 部署环境 1.2 相关概念 1.3 工作流程二、部署流程 * 2.1 部署前准备 – 2.1.1 调开发模式为生产模式 2.1.2…

Python 2023年8月4日
0060
Python学习：如何使用pandas分析excel数据

1.问题在python中，读写excel数据方法很多，比如 xlrd、xlwt和openpyxl，实际上限制比较多，不是很方便。比如 …

Python 2023年8月6日
0045

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

从零开始数据分析Kaggle项目——泰坦尼克号（五）

大家都在看