数据分析_python进行数据筛选1_列筛选

以titanic的训练数据为例进行展示,为了简化取前十行为例

首先导入模块,导入数据

import pandas as pd
import numpy as np

df = pd.read_csv(r"C:\Users\admin\Desktop\train.csv")
df = df.head(10)
df.index=['a','b','c','d','e','f','g','h','i','g']

PassengerIdSurvivedPclassNameSexAgeSibSpParchTicketFareCabinEmbarkeda103Braund, Mr. Owen Harrismale22.010A/5 211717.2500NaNSb211Cumings, Mrs. John Bradley (Florence Briggs Th…female38.010PC 1759971.2833C85Cc313Heikkinen, Miss. Lainafemale26.000STON/O2. 31012827.9250NaNSd411Futrelle, Mrs. Jacques Heath (Lily May Peel)female35.01011380353.1000C123Se503Allen, Mr. William Henrymale35.0003734508.0500NaNSf603Moran, Mr. JamesmaleNaN003308778.4583NaNQg701McCarthy, Mr. Timothy Jmale54.0001746351.8625E46Sh803Palsson, Master. Gosta Leonardmale2.03134990921.0750NaNSi913Johnson, Mrs. Oscar W (Elisabeth Vilhelmina Berg)female27.00234774211.1333NaNSg1012Nasser, Mrs. Nicholas (Adele Achem)female14.01023773630.0708NaNC

1.利用df[列名]或df[[列名]]或df.列名均可以筛选出单列,但稍微有点区别,df[列名]和df.列名均为Series类型,而df[[列名]]为DataFrame类型

#例如选取Age列,注意写成df[]形式时,列名需要加单引号或双引号
df.Age
df['Age']
df[['Age']]

2.loc[行索引,列索引],索引为普通索引,传入行索引名称和列索引名称,筛选列时,行索引可以写成”:”

#删选单列时,列索引名称可以加[]也可以不加,不加时返回为Series,加时返回为DataFrame
df.loc[:,'Age']
df.loc[:,['Age']]

3.iloc[行索引,列索引],索引为位置索引,传入行数和列数,筛选列时,行索引可以写成”:”

df.iloc[:,1]
df.iloc[:,[1]]

筛选多列

1.利用df[[列名1,列名2,列名n]]可以筛选出多列,返回结果为DataFrame类型,例如筛选年龄列和姓名列

df[['Name','Age']]

2.loc[行索引,列索引],索引为普通索引,传入行索引名称和列索引名称,筛选列时,行索引可以写成”:”,如果筛选列不连续需要写成列表形式,如果列连续可以写成切片形式

df.loc[:,['Name','Age']]
df.loc[:,'Name':'Age']

3.iloc[行索引,列索引],索引为位置索引,传入行数和列数,筛选列时,行索引可以写成”:”,如果筛选列不连续需要写成列表形式,如果列连续可以写成切片形式

df.iloc[:,[3,4,5,6]]
df.iloc[:,3:6]

Original: https://blog.csdn.net/Monkey_wang_/article/details/116156599
Author: Monkey*王
Title: 数据分析_python进行数据筛选1_列筛选

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/738149/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球