淘宝用户行为分析

数据来源:数据集-阿里云天池

一、项目背景

本数据报告以淘宝app平台为数据集随机选取了大约 100 万用户在 2014 年 11 月 18 日至 12 月 18 日期间具有曝光、点击、收藏、加车,购买和商品偏好等行为。

二、项目目标

通过行业的指标对淘宝用户行为进行分析,从而探索淘宝用户的行为模式,具体指标包括:

  • 日PV和日UV分析
  • 付费率分析
  • 复购行为分析
  • 漏斗流失分析
  • 用户价值RFM分析(由于数据源未提供M特征,只从RF角度进行分析)

三、理解数据

数据集共计6列字段,列字段分别是:

user_id:整数类型,序列化后的用户ID

item_id:整数类型,序列化后的商品ID

behavior_type:用户行为类型(包含点击、收藏、加车、支付四种行为,分别用数字1、2、3、4表示)

user_geohash:地理位置

item_category:品类ID(商品所属的品类)

time:用户行为发生的时间

四、数据清洗

`python
import pandas as pd
user_data=pd.read_csv(‘tianchi_mobile_recommend_train_user.csv’)

查看数据规模和相关信息

print(user_data.info())

out:

RangeIndex: 12256906 entries, 0 to 12256905
Data columns (total 6 columns):
# Column Dtype

Original: https://blog.csdn.net/Liuyan_analysis/article/details/121269851
Author: Liuyan_analysis
Title: 淘宝用户行为分析

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/765387/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

  • Python基础之lambda表达式

    1、lambda函数介绍 2、lambda函数与def函数的区别 3、lambda案例 4、map方法混搭 有时在使用函数时不需要给函数分配一个名称,该函数就是”匿名函…

    Python 2023年8月1日
    036
  • python命令行安装包

    1、单个包安装 pip指定软件源安装命令格式:pip install -i [ source_url ] [ package_name ] source_url:是软件源地址 pa…

    Python 2023年9月18日
    057
  • 从 Wepy 到 UniApp 变形记

    作者:vivo 互联网前端团队-Wan Anwen、Hu Feng、Feng Wei、Xie Tao 进入互联网”下半场”,靠”人海战术&#82…

    Python 2023年10月16日
    041
  • 相关性分析、相关系数矩阵热力图

    相关性 相关性分析是研究两组变量之间是否具有线性相关关系,所以做相关性分析的前提是假设变量之间存在线性相关性,得到的结果也是描述变量间的线性相关程度。除此之外,相关性分析方法还会有…

    Python 2023年8月2日
    064
  • 重新认识下JVM级别的本地缓存框架Guava Cache(2)——深入解读其容量限制与数据淘汰策略

    大家好,又见面了。 本文是笔者作为掘金技术社区签约作者的身份输出的缓存专栏系列内容,将会通过系列专题,讲清楚缓存的方方面面。如果感兴趣,欢迎关注以获取后续更新。 通过《重新认识下J…

    Python 2023年10月14日
    048
  • python和matlab互相调用之后,乱码问题

    win10:区域设置 – 其他日期、时间和区域设置 – 更改日期、时间或数字格式 – (跳出区域弹窗)管理 – 更改系统区域设置 &…

    Python 2023年6月12日
    098
  • python基于OCR深度学习实现商品配料表识别

    1、概述 当前人民和国家对食品安全十分重视,但商家为了保证食品长时间储存,味道鲜美,在食品中添加超量或对人有严重危害得食品添加剂,严重危害到人民的安全,我们以方便面为例,一包方便面…

    Python 2023年8月15日
    057
  • 测试平台(二)后端开发(3)实现测试用例增删改查

    前言 本章主要讲述【测试用例】增删改查的实现 环境 flask python3.6 mysql5.7 一、具体代码实现 1、controller层/testcase_control…

    Python 2023年8月12日
    051
  • 【数据挖掘】数据预处理

    现实生活中的数据极易收到噪声、缺失值和不一致数据的影响。数据预处理是数据挖掘过程中的第一个步骤,主要有数据清洗、数据集成、数据归约和数据变换等方式。 一、数据预处理的必要性 数据的…

    Python 2023年8月8日
    039
  • 爬虫框架的安装pyspider和Scrapy

    pip3 install pyspider 安装完成之后,可以直接在命令行下启动pyspider: pyspider all 这时pyspider的Web服务就会在本地5000端口…

    Python 2023年10月5日
    033
  • 知识图谱构建全流程

    一、知识图谱简介 知识图谱,是结构化的语义知识库,用于迅速描述物理世界中的概念及其相互关系,通过知识图谱能够将Web上的信息、数据以及链接关系聚集为知识,使信息资源更易于计算、理解…

    Python 2023年9月28日
    051
  • Django–22实现用例和套件的异步执行以及计划任务

    一、实现用例和套件的异步执行思考1:任务的调用者与任务的执行者,是不是同一个进程???不是思考2:在Python Console里调用这个任务,会在多长时间返回???业务处理后才返…

    Python 2023年8月4日
    073
  • WuThreat身份安全云-TVD每日漏洞情报-2022-12-23

    漏洞名称:Foxit PDF阅读器代码执行漏洞级别:高危漏洞编号:CVE-2022-28672,CNNVD-202207-1542相关涉及:Foxit PDF Reader漏洞状态…

    Python 2023年9月15日
    039
  • 【入门书籍】Python 编程-从入门到实践【上】

    Chapter_2_变量和简单数据类型 In[1]# 2.3 字符串name = "ada loveada"print(name.title())print(n…

    Python 2023年10月30日
    044
  • Pygame使用测试(三)

    使用帧数 计算机的速度非常快,可以在一秒钟内完成数百万个循环周期。现在显然,这对我们人类来说有点快。作为参考,电影以每秒 24 帧的速度运行。任何小于这个值的东西都会有明显的卡顿,…

    Python 2023年9月23日
    061
  • 实现基础的Python数据可视化(Matplotlib)

    Python(matplotlib)基本图形绘制 一、matplotlib的三层结构 二、简单图形绘制 三、辅助显示层 1.显示刻度 2.添加网格 3.添加描述信息 4.显示图例 …

    Python 2023年9月1日
    037
亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球