机器学习1–Pandas 数据结构 – DataFrame

Pandas 数据结构 – DataFrame**

DataFrame 是一个表格型的数据结构。Pandas DataFrame 是一个二维的数组结构,类似二维数组。

DataFrame 构造方法如下:
pandas.DataFrame( data, index, columns, dtype, copy)

  • data:一组数据(ndarray、series, map, lists, dict 等类型)。
  • index:索引值,或者可以称为行标签。
  • columns:列标签,默认为 RangeIndex (0, 1, 2, …, n) 。
  • dtype:数据类型。
  • copy:拷贝数据,默认为 False。

1.用数组创建

import pandas as pd
data = [['Google',10],['Runoob',12],['Wiki',13]]
df = pd.DataFrame(data,columns=['Site','Age'])
print(df)

输出结果:

机器学习1--Pandas 数据结构 - DataFrame
设置行列索引
import pandas as pd

data = [['Google', 10, 'N'], ['Runoob', 12, 'Y'], ['Wiki', 13, 'N']]
df = pd.DataFrame(data, index=['A1', 'A2', 'A3'], columns=['Site', 'Age', 'AA'])
print(df)

机器学习1--Pandas 数据结构 - DataFrame
注意行列索引的数量要和数据的数量保持一致
2.以字典的形式创建
import pandas as pd
data = {'Site':['Google', 'Runoob', 'Wiki'], 'Age':[10, 12, 13]}
df = pd.DataFrame(data)
print (df)
import pandas as pd

data = [{'a': 1, 'b': 2},{'a': 5, 'b': 10, 'c': 20}]
df = pd.DataFrame(data)
print (df)

3.查找
3.1返回特定行

import pandas as pd

data = [['Google', 10, 'N'], ['Runoob', 12, 'Y'], ['Wiki', 13, 'N']]
df = pd.DataFrame(data, index=['A1', 'A2', 'A3'], columns=['Site', 'Age', 'AA'])
print(df.loc['A1'])
print(type(df.loc['A1']))

机器学习1--Pandas 数据结构 - DataFrame
利用loc查找对应的行索引返回对应行,注意如果规定了行索引就不能使用数字索引查找了。如:这里创建时规定了行索引为 index=[‘A1’, ‘A2’, ‘A3’],则只能通过 df.loc[‘A1’] 查找到第一行的信息,如输入df.loc[0]就会报错。
输出的行信息格式为 key-value的Series

3.2 查找表格中的特定值

print(df.loc['A1']['Age'])
print(type(df.loc['A1']['Age']))

机器学习1--Pandas 数据结构 - DataFrame
还是用loc属性
学到这里发现DataFrame跟二维数组有很大的相似性,不同的是Data Frame可以给行列索引命名。

Original: https://blog.csdn.net/weixin_43987546/article/details/122145442
Author: 天下第一菜-
Title: 机器学习1–Pandas 数据结构 – DataFrame

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/700110/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球