pandas是使数据分析分析工作变得更快更简单的高级数据结构和操作工具,是数据分析师必须要熟练掌握的,现将pandas学习资料整理如下:
pandas数据与查看
1.1数据抽样
head(n)查看前n行的数据,图例就是演示的展示前2行的数据。
import pandas as pd
import numpy as np
df=pd.DataFrame(np.arange(12).reshape(4,3),index=list("abcd"),columns=['w','y','z'])
print(df,df.head(2))
out:
w y z
a 0 1 2
b 3 4 5
c 6 7 8
d 9 10 11
w y z
a 0 1 2
b 3 4 5
tail(n)查看后n行的数据,图例就是演示的展示后2行的数据。
import pandas as pd
import numpy as np
df=pd.DataFrame(np.arange(12).reshape(4,3),index=list("abcd"),columns=['w','y','z'])
print(df,df.tail(2))
out:
w y z
a 0 1 2
b 3 4 5
c 6 7 8
d 9 10 11
w y z
c 6 7 8
d 9 10 11
sample(n)就是随机取n行,图例就是演示的随机展示2行的数据。
import pandas as pd
import numpy as np
df=pd.DataFrame(np.arange(12).reshape(4,3),index=list("abcd"),columns=['w','y','z'])
print(df,df.sample(2))
out:
w y z
a 0 1 2
b 3 4 5
c 6 7 8
d 9 10 11
w y z
d 9 10 11
a 0 1 2
1.2查看数据属性
- shape 查看数据维度,行列数。图例DataFrame是4行3列,因此输出(4,3)。
import pandas as pd
import numpy as np
df=pd.DataFrame(np.arange(12).reshape(4,3),index=list("abcd"),columns=['w','y','z'])
print(df)
print(df.shape)
out:
w y z
a 0 1 2
b 3 4 5
c 6 7 8
d 9 10 11
(4, 3)
- index查看行索引。
import pandas as pd
import numpy as np
df=pd.DataFrame(np.arange(12).reshape(4,3),index=list("abcd"),columns=['w','y','z'])
print(df)
print(df.index)
out:
w y z
a 0 1 2
b 3 4 5
c 6 7 8
d 9 10 11
Index(['a', 'b', 'c', 'd'], dtype='object')
- columns查看列索引。
import pandas as pd
import numpy as np
df=pd.DataFrame(np.arange(12).reshape(4,3),index=list("abcd"),columns=['w','y','z'])
print(df)
print(df.columns)
out:
w y z
a 0 1 2
b 3 4 5
c 6 7 8
d 9 10 11
Index(['w', 'y', 'z'], dtype='object')
- dtypes查看数据类型。常见的有以下5种类型:
object — 代表了字符串类型
int — 代表了整型
float — 代表了浮点数类型
datetime — 代表了时间类型
bool — 代表了布尔类型
import pandas as pd
import numpy as np
df=pd.DataFrame(np.arange(12).reshape(4,3),index=list("abcd"),columns=['w','y','z'])
print(df)
print(df.dtypes)
out:
w y z
a 0 1 2
b 3 4 5
c 6 7 8
d 9 10 11
w int32
y int32
z int32
dtype: object
- values查看DataFrame中的数值。数据保存在list中。
import pandas as pd
import numpy as np
df=pd.DataFrame(np.arange(12).reshape(4,3),index=list("abcd"),columns=['w','y','z'])
print(df)
print(df.values)
out:
w y z
a 0 1 2
b 3 4 5
c 6 7 8
d 9 10 11
[[ 0 1 2]
[ 3 4 5]
[ 6 7 8]
[ 9 10 11]]
- info整体属性查看。
`ruby
import pandas as pd
import numpy as np
df=pd.DataFrame(np.arange(12).reshape(4,3),index=list(“abcd”),columns=[‘w’,’y’,’z’])
print(df)
print(df.info())
out:
w y z
a 0 1 2
b 3 4 5
c 6 7 8
d 9 10 11
Index: 4 entries, a to d
Data columns (total 3 columns):
# Column Non-Null Count Dtype
Original: https://blog.csdn.net/Liuyan_analysis/article/details/121042257
Author: Liuyan_analysis
Title: pandas基础入门之数据与查看
原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/755151/
转载文章受原作者版权保护。转载请注明原作者出处!