Python采集剧本杀店家数据信息，做可视化演示

2023年6月29日下午1:30 • 人工智能 • 阅读 95

前言

哈喽啊，友友们

有喜欢玩桌游或者剧本杀的吗

其实我自己对这个不太感兴趣哈哈，但是也玩过

正好又有朋友约着出去，就是不知道哪家店更值得去

所以趁着还有几天就用python来采集一些店家的数据信息

并做个可视化演示吧

; 环境使用:

Python 3.8
Pycharm

模块使用:

requests >>> pip install requests
re
csv

如果安装python第三方模块:

win + R 输入 cmd 点击确定, 输入安装命令 pip install 模块名 (pip install requests)回车
在pycharm中点击Terminal(终端) 输入安装命令

基本流程思路:

一. 数据来源分析

抓包分析我们想要数据内容, 请求的那个网站 url地址得到
F12 或者鼠标右键点击检查选择network, 点击第二页
选中xhr 第一个数据包就是我们想要的内容用到开发者工具搜索功能

二. 代码实现步骤过程: 固定四大步骤

发送请求, 对于刚刚分析得到url地址发送请求
获取数据, 获取服务器返回响应数据 —> 开发者工具里面response
解析数据, 提取我们想要数据内容 —> 店铺基本信息
保存数据, 保存数据, 保存表格里面
多页数据采集

多页数据采集 —> 循环 for

分析请求url地址参数变化

; 代码

源码.点击领取即可


import requests

from pprint import pprint

import csv

import time

import re

python学习交流Q群：770699889

html_data = requests.get(url=link, headers=headers).text

"""
5. 解析数据, re正则 会用 1 不会 2
re.findall() 找到所有我们想要数据
告诉程序: 从什么地方 去找什么数据
从 html_data  去找 "address":"(.*?)","phone":"(.*?)","openTime":"(.*?)", 这段内容
其中 (.*?) 就是我们要的数据
"""
shop_info = re.findall('"address":"(.*?)","phone":"(.*?)","openTime":"(.*?)",', html_data)[0]
print(shop_info)

address = shop_info[0]

phone = shop_info[1]

openTime = shop_info[2].replace('\\n', '')
print(address, phone, openTime)

f = open('男人的小秘密多页.csv', mode='a', encoding='utf-8', newline='')

csv_writer = csv.DictWriter(f, fieldnames=[
    '店铺',
    '店铺类型',
    '商圈',
    '人均消费',
    '最低消费',
    '评分',
    '评论',
    '纬度',
    '经度',
    '详情页',
])

csv_writer.writeheader()

发送请求, 模拟浏览器发送请求
代码都是可以复制粘贴

长链接可以分段写入
批量替换 —> 批量添加引号和逗号

1.选中替换内容
2.按 ctrl + R
3.勾选上.* 输入正则命令

(.*?): (.*)
'$1': '$2',

如果当你请求网站, 被反爬的时候

一种最简单反反爬手段, 用headers请求头伪装成浏览器去发送请求

python学习交流Q群：770699889

    response = requests.get(url=url, params=data, headers=headers)

    for index in response.json()['data']['searchResult']:


        csv_writer.writerow(dit)
        print(dit)

可视化代码

源码.点击领取即可

; 最后

给大家推荐一些Python视频教程，希望对大家有所帮助：

Python零基础教学合集

对文章有问题的，或者有其他关于python的问题，可以在评论区留言或者私信我哦
觉得我分享的文章不错的话，可以关注一下我，或者给文章点赞(/≧▽≦)/

Original: https://blog.csdn.net/yxczsz/article/details/127819635
Author: kaKA-小圆
Title: Python采集剧本杀店家数据信息，做可视化演示

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/659244/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

音频（一）时域图、频谱图 Spectrum

时域图 1.1 声音信号是一维的时域信号，无法观察出频率随时间的变化规律。动态信号 x(t): 是描述信号在不同时刻取值的函数, 其中 t是自变量；即横轴代表时间，纵轴是信号…

人工智能 2023年7月26日
0084
看懂IPv6+，这篇就够了

5G网络的不断建设和普及，加速了我们迈入万物互联时代的步伐。我们的整个互联网络，正在发生翻天覆地的变化。急剧增加的网络连接数和流量，对网络的承载和传送能力，提出了前所未有的挑战。…

人工智能 2023年6月25日
0090
代码会说话——pyttsx3简介

目录一、pyttsx3 概述二、pyttsx3的安装三、pyttsx3的运用四、全套代码一、pyttsx3 概述代码会说话：pyttsx3是Python中的文本到语音转…

人工智能 2023年7月26日
0073
免屏实现精准较时设定，WT588F02B-8S（C006_03）电子语音药盒解决方案

电子药盒是一种贴心的家居产品，具有提醒人们定期服药的功能。每天的服药时间都是提前设置的，设定的时间会响起提醒的声音，让服药的人可以按时服药。这非常适合那些需要每天服用药物和保健品的…

人工智能 2023年5月25日
0081
[基于骨架的动作识别] PoseC3D (2021)

背景基于骨架的动作识别 GCN的局限性鲁棒性：GCN的识别能力很受骨骼点坐标点平移的影响互操作性：之前研究表明，不同模态（RGB、光流、骨架）是互补的，不同模态的结合能提升识…

人工智能 2023年5月28日
0083
Selenium自动化测试框架

一.Selenium概述 1.1 什么是框架?     框架（framewor…

人工智能 2023年7月29日
0057
NeRF神经辐射场学习笔记（八）— Block-NeRF论文创新点解读

NeRF神经辐射场学习笔记（八）— Block-NeRF论文创新点解读声明论文概述 Section 4的创新点以及方法解读 * 1. Block块大小和位置的选择（Block …

人工智能 2023年6月24日
0099
无人机通信方式及原理

无人机的信号传输组合：遥控图传信号和定位导航信号（GPS、北斗、格洛纳斯）无人机的遥控信号是2.4GHz/5.8GHz频段，这个是无人机自带的天地（飞机与云台）之间的信号传播频段…

人工智能 2023年7月28日
0074
ROC曲线绘制（Python）

首先以支持向量机模型为例先导入需要使用的包，我们将使用roc_curve这个函数绘制ROC曲线！ from sklearn.svm import SVC from sklearn…

人工智能 2023年7月30日
0064
环形缓冲区—–适合在通信中接收数据（例如uart）

为什么要用环形缓冲区当有大量数据的时候，我们不能存储所有的数据，那么计算机处理数据的时候，只能先处理先来的，处理之后就会把数据释放掉，再处理下一个。那么已经处理的数据的内存就会被浪…

人工智能 2023年6月29日
10113
备战数学建模10-主成分分析模型与因子分析模型

一、主成分分析模型 1-主成分分析基本原理 2-主成分分析基本步骤 3-主成分分析的SPSS实现二、因子分析模型 1-因子分析模型基本原理 2-因子分析法基本步骤 3-因子分析法…

人工智能 2023年7月15日
0095
浅谈IC测试向量（pattern)及其转换

随着集成电路的飞速发展，其规模越来越大，对电路的质量与可靠性要求进一步提高，集成电路的测试方法也变得越来越困难，为了实现芯片的快速测试和筛选，ATE设备为其提供了强有力的支撑。AT…

人工智能 2023年5月28日
00104
用于多关系数据的图神经网络R-GCNs

本文描述如何扩展图神经网络(GNNs)的最简单公式，以编码知识图谱(KGs)等多关系数据的结构。这篇文章包括4个主要部分: 介绍了描述KGs特性的多关系数据的核心思想; GNN体…

人工智能 2023年6月10日
0083
码率/分辨率信息汇总

客户常用码率信息汇总厂商分辨率帧率基本码率上限码率备注HK2MP304M8M1、非行业招投标产品，外销基本型 2、2/4M产品的码率上限是8M 3、8M产品的码率上限是16M4M…

人工智能 2023年6月20日
0094
YOLOv4: Optimal Speed and Accuracy of Object Detection

YOLOv4: Optimal Speed and Accuracy of Object Detection英文注解： YOLOv4:OptimalSpeedandAccuracy…

人工智能 2023年7月9日
0076
Opengl入门基础-基础知识

通过之前的教程，我们已经拥有了开发环境，但是在真正开发程序之前，我们首先了解下Opengl的基本概念。 Opengl是什么？通常网上会说Opengl是一种规范，一种接口，但是这种…

人工智能 2023年6月19日
0085

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31