常见数据分析题目_pandas的基本操作

import pandas as pd
import numpy as np
df = pd.DataFrame({ 'order_no':[ 'order_18213', 'order_16061', 'order_10176', 'order_11923', 'order_18791',

'order_12534', 'order_14502', 'order_14488', 'order_15488', 'order_18118'],

'province':[ '山东', '四川', '福建', '广东', '广东', '广东', '广东', '山东', '湖南', '福建'],

'gender':[ '女', '女', '女', '女', '男', '女', '男', '男', '女', '女'],

'age':[ 29.0, 27.0, 25.0, 25.0,np.nan, 27.0, 25.0, 27.0,np.nan, 27.0],

'education':[ '本科', '研究生', '本科', '研究生', '研究生', '本科', '大专', '大专', '本科', '大专'],

'overdue_days':[ 0, 17, 0, 0, 12, 20, 22, 32, 0, 2],

'info_label':[ 0, 1, 0, 0, 1, 1, 1, 1, 0, 1]

})
df

order_noprovincegenderageeducationoverdue_daysinfo_label0order_18213山东女29.0本科001order_16061四川女27.0研究生1712order_10176福建女25.0本科003order_11923广东女25.0研究生004order_18791广东男NaN研究生1215order_12534广东女27.0本科2016order_14502广东男25.0大专2217order_14488山东男27.0大专3218order_15488湖南女NaN本科009order_18118福建女27.0大专21

1:将gender列中的 男 ,女分别替换为数值1、0

df['gender'] = df['gender'].map(lambda x:1 if x == '男' else 0)

2:将age列的缺失值用age列的均值代替

df.info()

`

RangeIndex: 10 entries, 0 to 9
Data columns (total 7 columns):
# Column Non-Null Count Dtype

Original: https://blog.csdn.net/weixin_43384554/article/details/120196255
Author: Lighten_大星
Title: 常见数据分析题目_pandas的基本操作

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/678982/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球