天冷就要大口吃肉肉~python采集周边烤肉店数据【附代码】

2023年7月6日上午7:39 • 人工智能 • 阅读 75

嗨害大家好鸭~我是小熊猫❤🥩

天冷还是应该吃烤肉大老远跑过去很值得

降温就要吃烤肉啊滋辣滋辣的声音特别好听～

快乐周六吃烤肉果然是快乐的~ ~~

天冷了，逛街……

天冷了，吃烤肉……

天冷了，喝奶茶……

有温度的冬天，才暖暖的🥩

为了造福”烤肉控”们，今天就用Python爬取一座城市的烤肉店数据，选出最适合的一家

; 准备工作🥩

环境

python 3.6
pycharm
requests >>> 发送请求 pip install requests
csv >>> 保存数据

; 了解爬虫最基本的思路🥩

一. 数据来源分析🍖

确定我们爬取的内容是什么?

爬取店铺数据
2. 去找这些东西是从哪里来的
通过开发者工具进行抓包分析, 分析数据来源

二. 代码实现过程🍖

发送请求, 对于找到数据包发送请求
获取数据, 根据服务器给你返回的response数据来的
解析数据, 提取我们想要的内容数据
保存数据, 保存到csv文件
多页爬取, 根据url地址参数变化

代码实现过程🥩

1. 发送请求🍻

url = 'https://平台原因不能放'
data = {
    'uuid': '6e481fe03995425389b9.1630752137.1.0.0',
    'userid': '266252179',
    'limit': '32',
    'offset': 32,
    'cateId': '-1',
    'q': '烤肉',
,
}

headers = {
    'Referer': 'https://平台原因/',
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/93.0.4577.63 Safari/537.36'
}

response = requests.get(url=url, params=data, headers=headers)

200 表示请求成功状态码 403 你没有访问权限

2. 获取数据🍻

print(response.json())

3. 解析数据🍻

result = response.json()['data']['searchResult']

for index in result:

    index_url = f'https://www.平台原因自己打/meishi/{index["id"]}/'

    dit = {
        '店铺名称': index['title'],
        '店铺评分': index['avgscore'],
        '评论数量': index['comments'],
        '人均消费': index['avgprice'],
        '所在商圈': index['areaname'],
        '店铺类型': index['backCateName'],
        '详情页': index_url,
    }
    csv_writer.writerow(dit)
    print(dit)

4. 保存数据🍻

f = open('烤肉数据.csv', mode='a', encoding='utf-8', newline='')
csv_writer = csv.DictWriter(f, fieldnames=[
    '店铺名称',
    '店铺评分',
    '评论数量',
    '人均消费',
    '所在商圈',
    '店铺类型',
    '详情页',
])
csv_writer.writeheader()

5.翻页🍻

for page in range(0, 1025, 32):
    url = 'https://平台原因不能放.....group/v4/poi/pcsearch/70'
    data = {
        'uuid': '6e481fe03995425389b9.1630752137.1.0.0',
        'userid': '266252179',
        'limit': '32',
        'offset': page,
        'cateId': '-1',
        'q': '烤肉',
    }

运行代码得到数据🥩

; 完整代码🥩

f = open('烤肉数据1.csv', mode='a', encoding='utf-8', newline='')
csv_writer = csv.DictWriter(f, fieldnames=[
    '店铺名称',
    '店铺评分',
    '评论数量',
    '人均消费',
    '所在商圈',
    '店铺类型',
    '详情页',
])
csv_writer.writeheader()

for page in range(0, 1025, 32):
    url = 'https://平台原因不能放'
    data = {
        'uuid': '6e481fe03995425389b9.1630752137.1.0.0',
        'userid': '266252179',
        'limit': '32',
        'offset': page,
        'cateId': '-1',
        'q': '烤肉',
    }
    headers = {
        'Referer': 'https://chs.平台原因不能放.com/',
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/93.0.4577.63 Safari/537.36'
    }

    response = requests.get(url=url, params=data, headers=headers)

    result = response.json()['data']['searchResult']

    for index in result:

        index_url = f'https://平台原因不能放/meishi/{index["id"]}/'

        dit = {
            '店铺名称': index['title'],
            '店铺评分': index['avgscore'],
            '评论数量': index['comments'],
            '人均消费': index['avgprice'],
            '所在商圈': index['areaname'],
            '店铺类型': index['backCateName'],
            '详情页': index_url,
        }
        csv_writer.writerow(dit)
        print(dit)

终于敲完了…

给我馋得…我等下就下去吃肉嘿嘿~ ~ ~

我是小熊猫，咱下篇文章再见啦(✿◡‿◡)

Original: https://blog.csdn.net/m0_67575344/article/details/127319432
Author: 小熊猫爱恰饭
Title: 天冷就要大口吃肉肉~python采集周边烤肉店数据【附代码】

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/673508/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

电商零售交易数据分析

1、项目背景以英国的在线电子零售公司的跨国交易数据集作为分析样本，通过对该公司的运营指标统计分析以及构建RMF模型、K-Means机器学习算法从大量的电子零售交易数据中分析并找出…

人工智能 2023年7月17日
0068
基于pytorch的 wandb使用

一、什么是wandb wandb是一个云数据记录追踪工具https://wandb.ai 二、使用步骤 1、登录网站，创建自己的账户（可使用GitHub账号登陆）2、创建一个项目…

人工智能 2023年7月23日
0084
【深度学习21天学习挑战赛】备忘篇：我们的神经网模型到底长啥样?——model.summary()详解

活动地址：CSDN21天学习挑战赛学完手写识别和服装分类，想稍微停下来消化一下新学的东西，也总结一下，今天就从keras的 model.summary()输出开始吧！ 1、m…

人工智能 2023年6月24日
0081
Go的Gin框架学习

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年5月31日
0045
解决libtorch在进行torchscript推理时程序崩溃或程序异常退出（Clion退出代码为 -1073740791 (0xC0000409)）

在进行YOLOX的libtorch部署的时候，发现官方提供的代码里面解码的那一部分运行时间太长了，需要大概3秒钟，这个是远远不能达到应用需求的，但是作为一个土生土长的算法工程师，除…

人工智能 2023年7月22日
0043
yolov5中的best.pt

在yolov5 的使用过程中几乎都会发现的问题：训练结果有last.pt和best.pt , last.pt好理解，就是最后一个epoch的输出，但是best是啥意思？怎么才算b…

人工智能 2023年6月16日
00182
阿里天池数据分析入门利用Pandas分析数据

pd.read_csv用法 ccl = pd.read_csv("1_usa_candidate/ccl.txt", sep = ‘|’,names=[‘CAN…

人工智能 2023年7月9日
0078
聊一聊时间序列聚类

今天来聊一聊时间序列，嗯……为什么聊这个呢，因为近期处理的都是时间序列数据。由于组里是做事后验证的，所以常用的方法其实还是以描述型为主，较少涉及建模预测。当…

人工智能 2023年7月17日
0067
[机器翻译]—BLEU值的计算

前言最近还卡在复现工作的结果这一环节上。具体来说，我使用那篇工作提供的脚本，使用的是fairseq-generate来完成的结果的评估。然后我发现我得到的结果和论文中的结果完全不…

人工智能 2023年5月30日
0081
python tkinter详解

Abstract Describes the Tkinter widget set for constructing graphical user interfaces (GUIs…

人工智能 2023年7月4日
0084
数据分析之T检验

1、定义： t检验，亦称student t检验（Student’s t test），主要用于样本含量较小（例如n < 30），总体标准差σ未知的正态分布。 t检验…

人工智能 2023年6月11日
0069
全面解析若依框架（springboot-vue前后分离–后端部分）

若依框架 1、框架分解 * – 启动配置 – 使用技术 – 功能分解 2、功能详解 * 分页实现（使用PageHelper） – 分…

人工智能 2023年7月30日
0096
5.OpenCV图像拼接

一、前言图像拼接（Image Stitching）是一种利用实景图像组成全景空间的技术，它将多幅图像拼接成一幅大尺度图像或360°全景图，可视作场景重建的一种特殊情况，其中图像仅…

人工智能 2023年7月26日
0052
python 千万级数据处理_Python实现 ! 千万级别数据处理

今天分享一个数据清洗小技巧，可以让你在遇到百万、千万级别数据的时候游刃有余。先来说说问题的背景现在有一个 csv 格式的数据集，大概 2千万条左右的样子，存储的是用户的网络交互…

人工智能 2023年7月8日
0070
pytorch转onnx的c++调用

搞了两天，记录一下学习过程。 pytorch模型转为onnx： c++使用onnxruntime或者opencv调用onnx模型进行推理：记录一下遇到的坑： 1、opencv安装…

人工智能 2023年7月13日
0069
spss系列——一元线性回归的分析与预测实例

spss系列——一元线性回归的分析与预测实例散点图回归系数线性回归模型 * 区间估计系数显著性检验残差散点图预测感谢小伙伴们的浏览~~下期见喽本文主要利用某商店记录…

人工智能 2023年6月11日
0045

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31