数据来源:数据集-阿里云天池
一、项目背景
本数据报告以淘宝app平台为数据集随机选取了大约 100 万用户在 2014 年 11 月 18 日至 12 月 18 日期间具有曝光、点击、收藏、加车,购买和商品偏好等行为。
二、项目目标
通过行业的指标对淘宝用户行为进行分析,从而探索淘宝用户的行为模式,具体指标包括:
- 日PV和日UV分析
- 付费率分析
- 复购行为分析
- 漏斗流失分析
- 用户价值RFM分析(由于数据源未提供M特征,只从RF角度进行分析)
三、理解数据
数据集共计6列字段,列字段分别是:
user_id:整数类型,序列化后的用户ID
item_id:整数类型,序列化后的商品ID
behavior_type:用户行为类型(包含点击、收藏、加车、支付四种行为,分别用数字1、2、3、4表示)
user_geohash:地理位置
item_category:品类ID(商品所属的品类)
time:用户行为发生的时间
四、数据清洗
`python
import pandas as pd
user_data=pd.read_csv(‘tianchi_mobile_recommend_train_user.csv’)
查看数据规模和相关信息
print(user_data.info())
out:
RangeIndex: 12256906 entries, 0 to 12256905
Data columns (total 6 columns):
# Column Dtype
Original: https://blog.csdn.net/Liuyan_analysis/article/details/121269851
Author: Liuyan_analysis
Title: 淘宝用户行为分析
原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/676972/
转载文章受原作者版权保护。转载请注明原作者出处!