DataFrame(4):DataFrame元素的获取方式

1、学习DataFrame元素获取,需要掌握以下几个需求

  • 访问一列 或 多列
  • 访问一行 或 多行
  • 访问某个值
  • 访问某几行中的某几列
  • 访问某几列中的某几行

2、构造一个DataFrame

df = pd.DataFrame(np.random.randint(70,100,(4,5)),
                  index=["地区1", "地区2", "地区3","地区4"],
                  columns=["武汉","天门", "黄冈","孝感","广水"])
display(df)

结果如下:

DataFrame(4):DataFrame元素的获取方式

注意:不管是单独获取到一行、还是一列,得到的都是一个Series。不管是单独获取到多行、还是多列,得到的都是一个DataFrame。

获取一列
x = df["广水"]
display(x)
display(type(x))

获取一行
y = df.loc["地区1"]
display(y)
display(type(y))

结果如下:

DataFrame(4):DataFrame元素的获取方式

3、访问一列或多列:传入单个标签或标签数组

df = pd.DataFrame(np.random.randint(70,100,(4,5)),
                  index=["地区1", "地区2", "地区3","地区4"],
                  columns=["武汉","天门", "黄冈","孝感","广水"])
display(df)

访问一列
x = df["武汉"]
display(x)

访问多列
y = df[["武汉","天门"]]
display(y)

结果如下:

DataFrame(4):DataFrame元素的获取方式

4、访问一行或者多行:loc中传入标签索引、iloc中传入位置索引、切片方式、布尔数组方式

① loc标签索引

df = pd.DataFrame(np.random.randint(70,100,(4,5)),
                  index=["地区1", "地区2", "地区3","地区4"],
                  columns=["武汉","天门", "黄冈","孝感","广水"])
display(df)

x1 = df.loc["地区1"]
display(x1)

x2 = df.loc[["地区1","地区2"]]
display(x2)

结果如下:

DataFrame(4):DataFrame元素的获取方式

特别说明:”访问行”唯独不能使用类似df[0],df[[0,1]],df[“地区1”],df[[“地区1″,”地区2”]]这样的方式。

② iloc位置索引

df = pd.DataFrame(np.random.randint(70,100,(4,5)),
                  index=["地区1", "地区2", "地区3","地区4"],
                  columns=["武汉","天门", "黄冈","孝感","广水"])
display(df)

x3 = df.iloc[0]
display(x3)

x4 = df.iloc[[0,3]]
display(x4)

结果如下:

DataFrame(4):DataFrame元素的获取方式

③ 切片方式:这种方式容易忽略,也容易弄错

df[0:2]
df[1:]

结果如下:

DataFrame(4):DataFrame元素的获取方式

④ 布尔数组方式

df = pd.DataFrame(np.random.randint(70,100,(4,5)),
                  index=["地区1", "地区2", "地区3","地区4"],
                  columns=["武汉","天门", "黄冈","孝感","广水"])
display(df)

y = df[df["武汉"] >= 80]
display(y)

结果如下:

DataFrame(4):DataFrame元素的获取方式

5、访问某个值

如果说要访问下面数据框DataFrame中的95,应该怎么做呢?

DataFrame(4):DataFrame元素的获取方式

① 先访问”地区3″这一行,再访问95这个数据

df = pd.DataFrame({"武汉":[78,99,81,77],
                   "天门":[74,97,96,97],
                   "黄冈":[77,80,95,84],
                   "孝感":[92,84,75,80],
                   "广水":[85,85,72,74]},
                  index=["地区1", "地区2", "地区3","地区4"]
)
display(df)

df.loc["地区3"]
df.loc["地区3"].loc["黄冈"]
结果如下:

DataFrame(4):DataFrame元素的获取方式

② 先访问”黄冈”这一列,再访问95这个数据

df = pd.DataFrame({"武汉":[78,99,81,77],
                   "天门":[74,97,96,97],
                   "黄冈":[77,80,95,84],
                   "孝感":[92,84,75,80],
                   "广水":[85,85,72,74]},
                  index=["地区1", "地区2", "地区3","地区4"]
)
display(df)

df["黄冈"]
df["黄冈"].loc["地区3"]

结果如下:

DataFrame(4):DataFrame元素的获取方式

③ 向loc中传入数据的标签坐标、向iloc中传入数据的位置坐标(最常用)

df = pd.DataFrame({"武汉":[78,99,81,77],
                   "天门":[74,97,96,97],
                   "黄冈":[77,80,95,84],
                   "孝感":[92,84,75,80],
                   "广水":[85,85,72,74]},
                  index=["地区1", "地区2", "地区3","地区4"]
)
display(df)

df.loc["地区3","黄冈"]
df.iloc[2,2]

结果如下:

DataFrame(4):DataFrame元素的获取方式

④ 向at中传入数据的标签坐标、向iat中传入数据的位置坐标

df = pd.DataFrame({"武汉":[78,99,81,77],
                   "天门":[74,97,96,97],
                   "黄冈":[77,80,95,84],
                   "孝感":[92,84,75,80],
                   "广水":[85,85,72,74]},
                  index=["地区1", "地区2", "地区3","地区4"]
)
display(df)

df.at["地区3","黄冈"]
df.iat[2,2]

结果如下:

DataFrame(4):DataFrame元素的获取方式

6、访问某几行中的某几列

df = pd.DataFrame({"武汉":[78,99,81,77],
                   "天门":[74,97,96,97],
                   "黄冈":[77,80,95,84],
                   "孝感":[92,84,75,80],
                   "广水":[85,85,72,74]},
                  index=["地区1", "地区2", "地区3","地区4"]
)
display(df)

先获取行,再获取列
df.loc[["地区1","地区3"]][["武汉","广水"]]

结果如下:

DataFrame(4):DataFrame元素的获取方式

7、访问某几列中的某几行

df = pd.DataFrame({"武汉":[78,99,81,77],
                   "天门":[74,97,96,97],
                   "黄冈":[77,80,95,84],
                   "孝感":[92,84,75,80],
                   "广水":[85,85,72,74]},
                  index=["地区1", "地区2", "地区3","地区4"]
)
display(df)

先获取列,再获取行
df[["武汉","广水"]].loc[["地区1","地区3"]]

结果如下:

DataFrame(4):DataFrame元素的获取方式

8、获取多行多列常用的一种方式:iloc+切片、loc+标签数组

① 获取多行多列:iloc+切片

df = pd.DataFrame({"武汉":[78,99,81,77],
                   "天门":[74,97,96,97],
                   "黄冈":[77,80,95,84],
                   "孝感":[92,84,75,80],
                   "广水":[85,85,72,74]},
                  index=["地区1", "地区2", "地区3","地区4"]
)
display(df)

x = df.iloc[:3,:]
display(x)

结果如下:

DataFrame(4):DataFrame元素的获取方式

② 获取多行多列:loc+标签数组

df = pd.DataFrame({"武汉":[78,99,81,77],
                   "天门":[74,97,96,97],
                   "黄冈":[77,80,95,84],
                   "孝感":[92,84,75,80],
                   "广水":[85,85,72,74]},
                  index=["地区1", "地区2", "地区3","地区4"]
)
display(df)

x = df.loc[["地区1","地区3"],['武汉','天门','黄冈','孝感','广水']]
display(x)

结果如下:

DataFrame(4):DataFrame元素的获取方式

9、获取多行多列常用的第二种方式:iloc+切片+位置数组、loc+切片+标签数组

① 获取多行多列:iloc+切片+位置数组

df = pd.DataFrame({"武汉":[78,99,81,77],
                   "天门":[74,97,96,97],
                   "黄冈":[77,80,95,84],
                   "孝感":[92,84,75,80],
                   "广水":[85,85,72,74]},
                  index=["地区1", "地区2", "地区3","地区4"]
)
display(df)

x = df.iloc[1:,[1,4]]
display(x)

y = df.iloc[[1,3],1:]
display(y)

结果如下:

DataFrame(4):DataFrame元素的获取方式

② 获取多行多列:loc+切片+标签数组

df = pd.DataFrame({"武汉":[78,99,81,77],
                   "天门":[74,97,96,97],
                   "黄冈":[77,80,95,84],
                   "孝感":[92,84,75,80],
                   "广水":[85,85,72,74]},
                  index=["地区1", "地区2", "地区3","地区4"]
)
display(df)

x = df.loc["地区1":,["武汉","广水"]]
display(x)

y = df.loc[["地区1","地区3"],"天门":]
display(y)

结果如下:

DataFrame(4):DataFrame元素的获取方式

Original: https://www.cnblogs.com/math98/p/13591374.html
Author: math98
Title: DataFrame(4):DataFrame元素的获取方式

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/559827/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球