stu = pd.read_excel('./stu_data.xlsx')
stu['新体重'] = pd.cut(stu.体重,bins=[40,50,60,70,80,90],right=False)
stu.head()
⭐时间拆分
stu.日期
stu['年份'] = stu.日期.dt.year
stu['月份'] = stu.日期.dt.month
stu['天数'] = stu.日期.dt.day
stu.head()
Period 日期转换想要的格式
stu["日期"].apply(lambda x:pd.Period(x,freq='H')) # 保留到小时
stu["日期"].apply(lambda x:pd.Period(x,freq='M')) # 保留到月份
⭐表连接
创建新Series对象
stu1 = pd.Series(np.arange(12345678900,12345678952),name='手机号')
stu1
合并表stu3 = pd.concat([stu,stu1],axis=1)
stu3.head()
undefined
join表连接
dict1 = {
'employee_id':['NC001','NC002','NC003','NC004'],
'name':['zs','lian','ls','wu'],
'sex':['m','f','f','m'],
'department':['php','python','c++','java'],
'item_id':['N100','N103','N103','N100'],
}
dict2 = {
'item_id':['N100','N102','N103','N104'],
'item_name':['php','python','c++','java'],
'location':['SZ','SH','BJ','GZ']
}
items = pd.DataFrame(dict2)
signup = pd.DataFrame(dict1)
print(signup)
print(items)
undefined
join合并表,只输出报名人数不为0的项目及其对应的报名人数
df = items.set_index('item_id').join(signup.set_index('item_id'), on='item_id', how='inner')
df.groupby('item_name')['employee_id'].count()
⭐ mode()函数的使用
Pandas dataframe.mode()函数获取沿所选轴的每个元素的模式。
获取身高的众数,并返回对应的身高值
import pandas as pd
Nowcoder = pd.read_excel('./stu_data.xlsx',sheet_name='BSdata')
Nowcoder.head()
Nowcoder.loc[:,['身高']].mode()
⭐修改索引
修改索引
df1 = Nowcoder[Nowcoder['身高'] == 169].sort_values('支出',ascending=False).head(5)
print(f”原索引为:{df1.index}”)
df1.index = ['0','1','2','3']
df1
Original: https://www.cnblogs.com/lxxduang/p/16521740.html
Author: 小小程序员-lian
Title: Pandas简单操作(学习总结)
原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/621206/
转载文章受原作者版权保护。转载请注明原作者出处!