pandas基础入门之数据与查看

pandas是使数据分析分析工作变得更快更简单的高级数据结构和操作工具,是数据分析师必须要熟练掌握的,现将pandas学习资料整理如下:

pandas数据与查看

1.1数据抽样

head(n)查看前n行的数据,图例就是演示的展示前2行的数据。

import pandas as pd
import numpy as np

df=pd.DataFrame(np.arange(12).reshape(4,3),index=list("abcd"),columns=['w','y','z'])
print(df,df.head(2))

out:
   w   y   z
a  0   1   2
b  3   4   5
c  6   7   8
d  9  10  11
  w  y  z
a  0  1  2
b  3  4  5

tail(n)查看后n行的数据,图例就是演示的展示后2行的数据。

import pandas as pd
import numpy as np
df=pd.DataFrame(np.arange(12).reshape(4,3),index=list("abcd"),columns=['w','y','z'])
print(df,df.tail(2))

out:
   w   y   z
a  0   1   2
b  3   4   5
c  6   7   8
d  9  10  11
   w   y   z
c  6   7   8
d  9  10  11

sample(n)就是随机取n行,图例就是演示的随机展示2行的数据。

import pandas as pd
import numpy as np
df=pd.DataFrame(np.arange(12).reshape(4,3),index=list("abcd"),columns=['w','y','z'])
print(df,df.sample(2))

out:
   w   y   z
a  0   1   2
b  3   4   5
c  6   7   8
d  9  10  11
   w   y   z
d  9  10  11
a  0   1   2

1.2查看数据属性

  • shape 查看数据维度,行列数。图例DataFrame是4行3列,因此输出(4,3)。
import pandas as pd
import numpy as np
df=pd.DataFrame(np.arange(12).reshape(4,3),index=list("abcd"),columns=['w','y','z'])
print(df)
print(df.shape)

out:
   w   y   z
a  0   1   2
b  3   4   5
c  6   7   8
d  9  10  11
(4, 3)
  • index查看行索引。
import pandas as pd
import numpy as np
df=pd.DataFrame(np.arange(12).reshape(4,3),index=list("abcd"),columns=['w','y','z'])
print(df)
print(df.index)

out:
   w   y   z
a  0   1   2
b  3   4   5
c  6   7   8
d  9  10  11
Index(['a', 'b', 'c', 'd'], dtype='object')
  • columns查看列索引。
import pandas as pd
import numpy as np
df=pd.DataFrame(np.arange(12).reshape(4,3),index=list("abcd"),columns=['w','y','z'])
print(df)
print(df.columns)

out:
   w   y   z
a  0   1   2
b  3   4   5
c  6   7   8
d  9  10  11
Index(['w', 'y', 'z'], dtype='object')
  • dtypes查看数据类型。常见的有以下5种类型:

object — 代表了字符串类型

int — 代表了整型

float — 代表了浮点数类型

datetime — 代表了时间类型

bool — 代表了布尔类型

import pandas as pd
import numpy as np
df=pd.DataFrame(np.arange(12).reshape(4,3),index=list("abcd"),columns=['w','y','z'])
print(df)
print(df.dtypes)

out:
   w   y   z
a  0   1   2
b  3   4   5
c  6   7   8
d  9  10  11
w    int32
y    int32
z    int32
dtype: object
  • values查看DataFrame中的数值。数据保存在list中。
import pandas as pd
import numpy as np
df=pd.DataFrame(np.arange(12).reshape(4,3),index=list("abcd"),columns=['w','y','z'])
print(df)
print(df.values)

out:
   w   y   z
a  0   1   2
b  3   4   5
c  6   7   8
d  9  10  11
[[ 0  1  2]
 [ 3  4  5]
 [ 6  7  8]
 [ 9 10 11]]
  • info整体属性查看。

`ruby
import pandas as pd
import numpy as np
df=pd.DataFrame(np.arange(12).reshape(4,3),index=list(“abcd”),columns=[‘w’,’y’,’z’])
print(df)

print(df.info())

out:
w y z
a 0 1 2
b 3 4 5
c 6 7 8
d 9 10 11

Index: 4 entries, a to d
Data columns (total 3 columns):
# Column Non-Null Count Dtype

Original: https://blog.csdn.net/Liuyan_analysis/article/details/121042257
Author: Liuyan_analysis
Title: pandas基础入门之数据与查看

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/755151/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球