淘宝用户行为分析

数据来源:数据集-阿里云天池

一、项目背景

本数据报告以淘宝app平台为数据集随机选取了大约 100 万用户在 2014 年 11 月 18 日至 12 月 18 日期间具有曝光、点击、收藏、加车,购买和商品偏好等行为。

二、项目目标

通过行业的指标对淘宝用户行为进行分析,从而探索淘宝用户的行为模式,具体指标包括:

  • 日PV和日UV分析
  • 付费率分析
  • 复购行为分析
  • 漏斗流失分析
  • 用户价值RFM分析(由于数据源未提供M特征,只从RF角度进行分析)

三、理解数据

数据集共计6列字段,列字段分别是:

user_id:整数类型,序列化后的用户ID

item_id:整数类型,序列化后的商品ID

behavior_type:用户行为类型(包含点击、收藏、加车、支付四种行为,分别用数字1、2、3、4表示)

user_geohash:地理位置

item_category:品类ID(商品所属的品类)

time:用户行为发生的时间

四、数据清洗

`python
import pandas as pd
user_data=pd.read_csv(‘tianchi_mobile_recommend_train_user.csv’)

查看数据规模和相关信息

print(user_data.info())

out:

RangeIndex: 12256906 entries, 0 to 12256905
Data columns (total 6 columns):
# Column Dtype

Original: https://blog.csdn.net/Liuyan_analysis/article/details/121269851
Author: Liuyan_analysis
Title: 淘宝用户行为分析

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/676972/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球