python数据处理—-Pandas类型转换

转换为字符串类型

tips['sex_str'] = tips['sex'].astype(str)

python数据处理----Pandas类型转换

转换为数值类型

python数据处理----Pandas类型转换

; 转为数值类型还可以使用to_numeric()函数

DataFrame每一列的数据类型必须相同,当有些数据中有缺失,但不是NaN时(如missing,null等),会使整列数据变成字符串类型而不是数值型,这个时候可以使用to_numeric处理


tips_sub_miss = tips.head(10)
tips_sub_miss.loc[[1,3,5,7],'total_bill'] = 'missing'
tips_sub_miss

python数据处理----Pandas类型转换
自动转换为了字符串类型:

python数据处理----Pandas类型转换

使用astype转换报错:

tips_sub_miss['total_bill'].astype(float)

python数据处理----Pandas类型转换

使用to_numeric()函数:

直接使用to_numeric()函数还是会报错,添加errors参数
errors可变参数:

  • ignore 遇到错误跳过 (只是跳过没转类型)
  • coerce 遇到不能转的值强转为NaN
pd.to_numeric(tips_sub_miss['total_bill'],errors='ignore')

python数据处理----Pandas类型转换
pd.to_numeric(tips_sub_miss['total_bill'],errors='coerce')

python数据处理----Pandas类型转换
to_numeric向下转型:

downcast参数

  • integersigned最小的有符号int dtype
  • float 最小的float dtype
  • unsigned 最小的无符号int dtype

downcast参数设置为float之后, total_bill的数据类型由float64变为float32

pd.to_numeric(tips_sub_miss['total_bill'],errors='coerce',downcast='float')

python数据处理----Pandas类型转换

分类数据(Category)

  • 利用 pd.Categorical()创建categorical数据,Categorical()常用三个参数
  • 参1 values,如果values中的值,不在categories参数中,会被NaN代替
  • 参2 categories,指定可能存在的类别数据
  • 参3 ordered, 是否指定顺序
s = pd.Series(pd.Categorical(["a","b","c","d"],categories=['c','b','a']))

python数据处理----Pandas类型转换

分类数据排序会自动根据分类排序:

python数据处理----Pandas类型转换

ordered指定顺序:

python数据处理----Pandas类型转换
from pandas.api.types import CategoricalDtype

cat = CategoricalDtype(categories=['B','D','A','C'],ordered=True)

series_cat1 = series_cat.astype(cat)
print(series_cat.sort_values())
print(series_cat1.sort_values())

python数据处理----Pandas类型转换

数据类型小结

知识点内容Numpy的特点1. Numpy是一个高效科学计算库,Pandas的数据计算功能是对Numpy的封装

  1. ndarray是Numpy的基本数据结构,Pandas的Series和DataFrame好多函数和属性都与ndarray一样

  2. Numpy的计算效率比原生Python效率高很多,并且支持并行计算Pandas数据类型转换1. Pandas除了数值型的int 和 float类型外,还有object ,category,bool,datetime类型

  3. 可以通过as_type 和 to_numeric 函数进行数据类型转换Pandas 分类数据类型1. category类型,可以用来进行排序,并且可以自定义排序顺序

  4. CategoricalDtype可以用来定义顺序

Original: https://blog.csdn.net/bjsyc123456/article/details/124437311
Author: B.Bz
Title: python数据处理—-Pandas类型转换

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/677099/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球