目录
DataFrame 是一个表格型的数据结构,它含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔型值)。
DataFrame 既有行索引也有列索引,它可以被看做由 Series 组成的字典(共同用一个索引)。
DataFrame 构造方法如下:
pandas .DataFrame (data ,index ,columns ,dtype ,copy )
参数说明:
data:一组数据(ndarray、series, map, lists, dict 等类型)。
index:索引值,或者可以称为行标签。
columns:列标签,默认为 RangeIndex (0, 1, 2, …, n) 。
dtype:数据类型。
copy:拷贝数据,默认为 False。
用 列表 生成 DataFrame
import pandas as pd
data = [['Google', 10], ['Runoob', 12], ['Wiki', 13]]
df = pd.DataFrame(data, columns=['Site', 'Age'], dtype=float)
print(df)
用 多维数组字典 生成 DataFrame
多维数组的长度必须相同。如果传递了索引参数,index 的长度必须与数组一致。如果没有传递索引参数,生成的结果是range(n),n 为数组长度。
import pandas as pd
data = {'Site': ['Google', 'Runoob', 'Wiki'], 'Age': [10, 12, 13]}
df = pd.DataFrame(data)
print(df)
用 Series字典 生成 DataFrame
import pandas as pd
data = {'one': pd.Series([1., 2., 3.], index=['a', 'b', 'c']),
        'two': pd.Series([1., 2., 3., 4.], index=['a', 'b', 'c', 'd'])}
df = pd.DataFrame(data)
print(df)
用 列表字典 生成 DataFrame
import pandas as pd
data = [{'a': 1, 'b': 2}, {'a': 5, 'b': 10, 'c': 20}]
df = pd.DataFrame(data)
print(df)
用 元组字典 生成 DataFrame
元组字典可以自动创建多层索引 DataFrame。
import pandas as pd
df = pd.DataFrame({('a', 'b'): {('A', 'B'): 1, ('A', 'C'): 2},
                   ('a', 'a'): {('A', 'C'): 3, ('A', 'B'): 4},
                   ('a', 'c'): {('A', 'B'): 5, ('A', 'C'): 6},
                   ('b', 'a'): {('A', 'C'): 7, ('A', 'B'): 8},
                   ('b', 'b'): {('A', 'D'): 9, ('A', 'B'): 10}})
print(df)
缺失数据 :DataFrame 里的缺失值用 np.nan 表示。
Pandas 数据分析 – 学习笔记目录
Pandas 数据分析 – 学习笔记目录_YYDataV的博客-CSDN博客
Original: https://blog.csdn.net/lildkdkdkjf/article/details/122514690
Author: YYDataV数据可视化
Title: 4 Pandas 数据结构之生成DataFrame
原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/739848/
转载文章受原作者版权保护。转载请注明原作者出处!