QQ发生大规模账号泄露事件,二十行Python代码,带你了解前因后果

6月,秋秋发生了一起大规模的账号被盗事件,众说纷纭,有的说是一些西通买卖个人信息造成的,有的说是因为点击了图片中的网站而中毒被盗的,还有的说企鹅数据库被攻击,账号被盗了。不管怎么说,公众都说这个女人是讲道理的。

[En]

In June, a large-scale account theft incident occurred in Qiuqiu, and there were different opinions, some said that it was caused by some Xitong buying and selling personal information, some were said to have been poisoned and stolen because they clicked on the website in the picture, and some said that the penguin database was attacked and the account was stolen. Anyway, the public says that the woman is reasonable.

QQ发生大规模账号泄露事件,二十行Python代码,带你了解前因后果

但是吧,人呐,一般都喜欢凑热闹,于是乎,我直接用Python把围脖爬了一遍,看他们争论的不亦乐乎,我开心极了~

QQ发生大规模账号泄露事件,二十行Python代码,带你了解前因后果
兄弟们学习python,有时候不知道怎么学,从哪里开始学。掌握了基本的一些语法或者做了两个案例后,不知道下一步怎么走,不知道如何去学习更加高深的知识。

那么对于这些大兄弟们,我准备了大量的免费视频教程,PDF电子书籍,以及视频源的源代码!

还会有大佬解答!

都在这个群里了 279199867  欢迎加入,一起讨论 一起学习!

QQ发生大规模账号泄露事件,二十行Python代码,带你了解前因后果

准备工作

使用的是Python3.8 和 pycharm 编辑器,为什么我用的是3.8 而不是最新版呢?

很多刚开始学Python的兄弟喜欢下载新版本,在原有的认知里面就是觉得最新的自然就是最好的,但是,对于软件而言,越新的版本,问题越多,不稳定,还需要不断地修改不断地完善。

打个简单的比方,以LOL为例,每次版本刚更新,总是会爆出一些小bug,然后收集一段时间后,再通过小版本或者直接在线就更新了。

所以说软件并不是版本越新越好,这里我推荐的是Python3.8,目前最稳定的版本。

pycharm的话,pycharm2020以前的版本是没有中文版插件的,只能通过在网上找的插件安装,后面的版本都可以直接在pycharm上安装插件。

代码展示

import pprint
import re
import requests
import csv
import pandas as pd

f = open('微博评论.csv', mode='a', encoding='utf-8', newline='')
csv_writer = csv.DictWriter(f, fieldnames=[
    '用户',
    '地区',
    '评论',
    '日期',
])
csv_writer.writeheader()

url = 'https://m.***.cn/comments/hotflow?id=4784937075214225&mid=4784937075214225&max_id_type=0'
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/101.0.0.0 Safari/537.36'
}
response = requests.get(url=url, headers=headers)

lis = []
for index in response.json()['data']['data']:
    content = ''.join(re.findall('[\u4e00-\u9fa5]+', index['text']))
    dit = {
        '用户': index['user']['screen_name'],
        '地区': index['source'].replace('来自', ''),
        '评论': content,
        '日期': index['created_at']
    }
    lis.append(dit)
    # csv_writer.writerow(dit)
    print(dit)

pd_data = pd.DataFrame(lis)
pd_data.to_excel('微博评论.xlsx')

效果

部分数据

QQ发生大规模账号泄露事件,二十行Python代码,带你了解前因后果

你也可以尝试做字云地图,爬多个页面等等!

[En]

You can also try to do word cloud map, climb multiple pages and so on!

快去试试吧~

Original: https://www.cnblogs.com/hahaa/p/16444168.html
Author: 轻松学Python
Title: QQ发生大规模账号泄露事件,二十行Python代码,带你了解前因后果

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/499147/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球