Python数据分析1实战（1）——探索Chipotle快餐数据

2023年6月19日下午10:45 • 人工智能 • 阅读 74

个人复习总结（jupyter）

1 导入必要的库和创建数据

import pandas as pd
路径='D:/数据分析有关数据集/十套练习/exercise_data/chipotle.tsv'
数据=pd.read_csv(路径,sep='\t')
#'\t'是到下一个制表单位，就是向后数第9位，即Tab，也叫横向制表符
数据

2 查看前10行内容

&#x6570;&#x636E;.head(10)

3数据集中有多少行和列(columns)

&#x6570;&#x636E;.shape    #&#x67E5;&#x770B;&#x6570;&#x636E;&#x7684;&#x5F62;&#x72B6;&#xFF0C;&#x8FD4;&#x56DE;&#xFF08;&#x884C;&#x6570;&#x3001;&#x5217;&#x6570;&#xFF09;
&#x6570;&#x636E;.shape[0]    #&#x6570;&#x636E;&#x96C6;&#x4E2D;&#x6709;&#x591A;&#x5C11;&#x4E2A;&#x884C;
&#x6570;&#x636E;.shape[1]   #&#x6570;&#x636E;&#x96C6;&#x4E2D;&#x6709;&#x591A;&#x5C11;&#x4E2A;&#x5217;(columns)

4打印出全部的列名称

&#x6570;&#x636E;.columns   #&#x6253;&#x5370;&#x51FA;&#x5168;&#x90E8;&#x7684;&#x5217;&#x540D;&#x79F0;

5数据集的索引是怎样的

&#x6570;&#x636E;.index

6被下单数最多商品(item)是什么?

&#x6570;&#x636E;3=&#x6570;&#x636E;.groupby('item_name',as_index=False).agg({'quantity':'sum'})

#as_index=True&#x65F6;&#xFF0C;&#x201C;as_index&#x201D;&#x5C31;&#x7C7B;&#x4F3C;&#x8868;&#x793A;&#x5C06;&#x7EC4;&#x6807;&#x7B7E;&#xFF08;&#x7C7B;&#x4F3C;&#x201C;&#x4E3B;&#x952E;&#x201D;&#xFF09;&#x4F5C;&#x4E3A;&#x7D22;&#x5F15;&#xFF1B;
#as_index=False&#x65F6;&#xFF0C;&#x7D22;&#x5F15;&#x4E3A;0&#xFF0C;1&#xFF0C;2&#xFF0C;3&#x2026;
#agg&#x662F;&#x5BF9;&#x4E8E;&#x5217;&#x805A;&#x5408;

&#x6570;&#x636E;3.sort_values(by='quantity',ascending=False,inplace=True)

#&#x5BF9;quantity&#x8FDB;&#x884C;&#x5012;&#x5E8F;&#x6392;&#x5E8F;&#xFF0C;&#x5BF9;&#x6570;&#x636E;3&#x539F;&#x8868;&#x64CD;&#x4F5C;

&#x6570;&#x636E;3.head()

7在item_name这一列中，一共有多少种商品被下单？

&#x6570;&#x636E;['item_name'].nunique()     #nunique&#x4E3A;&#x53BB;&#x91CD;

8一共下单了多少商品

&#x6570;&#x636E;['quantity'].sum()

9将item_price转换为浮点数

#&#x53BB;&#x6389;item_price&#x91CC;&#x7684;&#x8D27;&#x5E01;&#x7B26;&#x53F7;&#xFF0C;&#x5E76;&#x53D8;&#x6210;&#x6D6E;&#x70B9;&#x6570;
#&#x5B57;&#x7B26;&#x4E32;&#x53D6;&#x5207;&#x7247;&#x4ECE;&#x7B2C;&#x4E8C;&#x4F4D;&#x5230;&#x6700;&#x540E;&#x4E00;&#x4F4D;&#xFF0C;&#x4E5F;&#x5C31;&#x662F;&#x7D22;&#x5F15;1&#x5230;-1&#xFF0C;&#x76EE;&#x7684;&#x662F;&#x53BB;&#x6389;$&#x7B26;&#x53F7;&#x3002;&#x7136;&#x540E;&#x518D;&#x8F6C;&#x5316;&#x4E3A;&#x6D6E;&#x70B9;&#x578B;&#xFF0C;&#x4E0D;&#x7136;object&#x6CA1;&#x529E;&#x6CD5;&#x8FDB;&#x884C;&#x7EDF;&#x8BA1;&#x8FD0;&#x7B97;&#x3002;
#apply&#x53EF;&#x4EE5;&#x8FD0;&#x884C;&#x62EC;&#x53F7;&#x91CC;&#x7684;&#x51FD;&#x6570;

dollarizer = lambda x: float(x[1:-1])
&#x6570;&#x636E;['item_price']=&#x6570;&#x636E;['item_price'].apply(dollarizer)
&#x6570;&#x636E;

10在该数据集对应的时期内，收入(revenue)是多少

#&#x5728;&#x8BE5;&#x6570;&#x636E;&#x96C6;&#x5BF9;&#x5E94;&#x7684;&#x65F6;&#x671F;&#x5185;&#xFF0C;&#x6536;&#x5165;(revenue)&#x662F;&#x591A;&#x5C11;?

&#x6570;&#x636E;['revenue']=round(&#x6570;&#x636E;['quantity']*&#x6570;&#x636E;['item_price'],2)

&#x6570;&#x636E;.head()

&#x6570;&#x636E;['revenue'].sum()

Original: https://blog.csdn.net/m0_71361876/article/details/126198547
Author: 啾啾鱼仔粥
Title: Python数据分析1实战（1）——探索Chipotle快餐数据

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/640284/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Golang仿云盘项目-4 账号系统与鉴权(1)-解决：登录 404 not found

4.1 账号系统功能解决：登录 404 not found本文来自博客园，作者：Arway，转载请注明原文链接：https://www.cnblogs.com/cenjw/p/1…

人工智能 2023年6月4日
0084
Mx-yolov3环境配置+本地模型训练+K210

文章目录一、Mx-yolov3环境配置二、模型训练 1.测试 2.数据集制作 3.VOTT标注与模型测试三、部署到k210 1.模型转换 2.脚本运行 3.脱机运行 4.一个…

人工智能 2023年7月6日
0079
OpenHarmony 3.1 Beta版本关键特性解析——HiStreamer轻量级可定制的媒体管线框架

（以下内容来自开发者分享，不代表 OpenHarmony 项目群工作委员会观点）陈国栋数字多媒体技术在过去的数十年里得到了飞速的发展，多媒体终端设备如智能音箱、智能门锁、智能手…

人工智能 2023年5月27日
0080
pytorch的函数 .detach()

前言：当我们再训练网络的时候可能希望保持一部分的网络参数不变，只对其中一部分的参数进行调整；或者值训练部分分支网络，并不让其梯度对主网络的梯度造成影响，这时候我们就需要使用deta…

人工智能 2023年7月23日
0093
GMM广义矩估计

矩估计是什么呢？简单的说，就是用样本矩代替总体矩进行统计推断的方法。一个最基础的例子是正态总体的参数估计问题。如果X i ∼ N ( μ , σ 2 ) X_i \sim N(\…

人工智能 2023年7月1日
0070
生信学习——R语言练习题-初级（附详细答案解读）

题目目录 1. 打开 Rstudio 告诉我它的工作目录。 2. 新建6个向量，基于不同的数据类型。（重点是字符串，数值，逻辑值） 3. 告诉我在你打开的rstudio里面 get…

人工智能 2023年6月11日
0099
基于yoloV5-v6分类多检测头模型修改（多国车牌检测）

加我微信拉你进群交流：wu331376411 一修改背景基于yoloV5系列越来越强大，适用面越来越广泛，主要是由于训练简单，模型适配性好，推理速度快等优点，yoloV5系列适…

人工智能 2023年7月1日
00127
YY0709|听觉报警信号要求及测试方法

在上一篇文章中，我们介绍了视觉报警信号的要求，今天我们主要介绍听觉报警信号的要求。 [En] In the previous article, we introduced the …

人工智能 2023年5月27日
0056
最新CUDA环境配置教程(ubuntu 20.04 + cuda 11.7 + cuDNN 8.4)

ubuntu 20.04 CUDA 11.7 cuDNN 8.4 环境配置教程 ubuntu 20.04 CUDA 11.7 cuDNN 8.4 环境配置教程 1.查看是否有合适的…

人工智能 2023年7月5日
0096
用DESeq2包来对RNA-seq数据进行差异分析

用DESeq2包来对RNA-seq数据进行差异分析差异分析的套路都是差不多的，大部分设计思想都是继承limma这个包，DESeq2也不例外。 DESeq2是DESeq包的更新版本，…

人工智能 2023年7月16日
0080
自编码器网络

目录 1、自编码器的概述 2、自编码器的原理 3、自编码器的拓展网络 3.1稀疏自编码 3.2栈式自编码 3.3降噪自编码 1、自编码器的概述 1986年Rumelhart提出自动…

人工智能 2023年6月16日
0082
89 logistic回归用户画像用户响应度预测2

logistic回归篇章数据集接应上一节数据集合，本次的分析是从用户是否为高响应用户进行划分，使用logistic回归对用户进行响应度预测，得到响应的概率。线性回归，参考上一篇章…

人工智能 2023年7月17日
0068
一文理解DeepLab V1到DeepLab V3+（超系统、超详细）

文章目录 * – 预备知识 – + 空洞卷积 – 1、DeepLab V1 – + 1.1 基于VGG模型 + 1.2 总体架构 +…

人工智能 2023年6月18日
00173
基于ROS机器人的3D物体识别与三维重建(二) Kinect2相机标定与点云获取

Kinect2相机标定与点云数据获取 1、介绍 2 相机成像模型 * 2.1 针孔相机模型与畸变修正 2.2 RGB-D相机测量原理 3 Kinect2相机标定 * 3.1 张正友…

人工智能 2023年6月25日
00103
看懂IPv6+，这篇就够了

5G网络的不断建设和普及，加速了我们迈入万物互联时代的步伐。我们的整个互联网络，正在发生翻天覆地的变化。急剧增加的网络连接数和流量，对网络的承载和传送能力，提出了前所未有的挑战。…

人工智能 2023年6月25日
0074
红外图像和可见光图像异源图像配准问题研究

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、配准的基本原理 * 1.1 常用的配准方法 1.2 配准流程 1.3 图像预处理 &#8211…

人工智能 2023年6月23日
00100

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Python数据分析1实战（1）——探索Chipotle快餐数据

1 导入必要的库和创建数据

2 查看前10行内容

3数据集中有多少行和列(columns)

4打印出全部的列名称

5数据集的索引是怎样的

6被下单数最多商品(item)是什么?

7在item_name这一列中，一共有多少种商品被下单？

8一共下单了多少商品

9将item_price转换为浮点数

10在该数据集对应的时期内，收入(revenue)是多少

大家都在看