pandas的Series和DataFrame

2023年8月18日下午7:40 • Python • 阅读 56

文章目录

pandas的核心类
Series(数据系列)带标签的数组
*
一、创建Series对象
二、Series索引和切片
三、Series的基本用法
–
- 1.处理空值（缺失值）
- 2.去重
- 3.替换
DataFrame二维数组
一、创建DataFrame
*
1.通过数组创建
2.用字典创建DataFrame
3. 通过读取CSV文件创建DataFrame
4.通过读Excel文件创建DataFrame
5.读取数据库文件
–
+
- 连接数据库
- 读取mysql中的数据
6.读取文本文件
二、DataFrame的属性
1.基本属性
2.查看前/后几行数据
3.列/行索引（取值）
4.添加行/列
5.删除行/列
6.数据抽样
7.数据筛选
8.排序
三、DataFrame的方法
pandas的方法
一、Pandas统计计算和描述
二、索引和复合索引（层次化索引）
*
1.简单的索引操作
2.Series复合索引
3.DataFrame复合索引
三、pandas的对齐运算
四、pandas的函数应用
五、缺失数据的处理
*
1.判断数据是否为NaN
2.处理方法
六、多表合并与连接
*
1.merge 按指定列将多表进行连接
2.Join——根据行索引合并数据
3. concat沿一条轴将多个表合并
七、数据聚合与分组运算
*
group by分组
聚合
八、文件操作
*
1.分块读取大文件
九、时间序列
*
创建固定频率的时间序列
时间重采样
创建时期对象

pandas的核心类

Series（一位数组）、DataFrame（二维数组）、Index（索引）
导入pandas： import pandas as pd

Series(数据系列)带标签的数组

一、创建Series对象

1 . ser=pd.Series( 列表/数组/字典 )
ser1=pd.Series([1,2,3])
ser2=pd.Series(np.arange(1,6))
ser3=pd.Series('name':'John','age':18,'score':'95')

通过字典创建时索引可以比值多，其他方法索引和值的个数必须相同

ser1=pd.Series(np.random.randint(10,100,5))
ser1

2.可以直接在创建Series数组时创建索引
①：

ser = pd.Series(
            data=[value1,value2,value3,...],
            index=[index1,index2,index3,...]
ser

②：

ser=pd.Series(
        data={
            index1:value1,
            index2:value2,
            ....
            }
)

二、Series索引和切片

ser [ 元素下标 ]：直接返回该下标对应的值，一次只能取单个元素
ser [ 索引]：选取单个索引
ser [ [ 元素下标1,元素下标2,... ] ]：返回对应的索引和值
ser [ [ 索引1,索引2,...] ]：返回对应的索引和值，当数组中有重复索引时会返回该索引对应的全部值
ser[开始下标:结束下标]：切片
ser[开始索引:结束索引]：切片，包含末端数据
ser[ser>n]：布尔索引取值，返回索引和值，默认找到为True的值

三、Series的基本用法

1.处理空值（缺失值）

判断是否为空： ser.isnull()
不是空值的： ser.notnull
None：Python的空值
np.nan：numpy的空值

删除空值
① ser.dropna( )：返回删除了空值的新的Series对象
② ser.dropna(inplace=True)：直接删除原来的Series对象
填充空值
①用指定值 x 填充空值： ser.fillna ( x )，有inplace时改变原来的Series对象
②用空值前面或后面的值填充空值
用前面的值填： ser.ffill( )
用后面的值填： ser.bfill( )

2.去重

获取不重复元素构成的数组： ser.unique( )
去重： ser.drop_duplicates( )
统计重复次数：
①非重复元素的个数： ser.nunique( )
②统计重复次数： ser.value_counts( )

3.替换

①替换不满足条件的值： ser.where( 判断条件,替换值)
②替换满足条件的值： ser.mask(判断条件,替换值)

DataFrame二维数组

表格型的数据结构，Series容器

一、创建DataFrame

DataFrame对象既有行索引,又有列索引
行索引，表明不同行，横向索引，叫index，0轴，axis=0
列索引，表明不同列，纵向索引，叫columns，1轴，axis=1

1.通过数组创建

 df = pd.DataFrame(
     data=[[],[],[],...],
     【
     index=['a','b','c',...]
     columns=['A','B','C',...]
     】
 )

没给索引命名时默认为0,1,2…

①通过二维数组构造创建： df=pd.DataFrame(np.arange(12),reshape(3,4))
②通过字典构造成的列表创建


list1=[{'apple':3.6,'banana':3.6},{'apple':3.2,'banana':3.2},{'apple':3.4}]
df=pd.DataFrame(list1)

③通过Series构造的列表创建

list2=[pd.Series(np.random.rand(4)),pd.Series(np.random.rand(3))]
df=pd.DataFrame(list2)

2.用字典创建DataFrame

用字典创建DataFrame时，字典的键就是列名
①数组、列表、元祖构成的字典构造DataFrame

df=pd.DataFrame(
        data={
        ...
        },
        index=
)


df=pd.DataFrame(
    data={
        'Chinese':[90,92,87,88],
        'English':[85,87,88,80],
        'Math':[91,93,95,97]
    },
    index=range(1001,1005)
)

②Series构成的字典构造DataFrame

df=pd.DataFrame({'a':pd.Series(np.arange(3)),
                  'b':pd.Series(np.arange(3,5))})

③字典构成的字典构造DataFrame（字典嵌套）

dic={
    'a':{'apple':3.6,'banana':3.6},
    'b':{'apple':3.2,'banana':3.3},
    'c':{'apple':3.4}
    }
df=pd.DataFrame(dic)

3. 通过读取CSV文件创建DataFrame

读CSV文件，逗号分隔符文件： pd.read_csv('文件路径'）
关于行的操作
①设置作为行索引的列： index_col=列名， index_col=[列名1,列名2...]
②设置读取的行数（从前往后读）： nrows=n
③跳过指定行（通过索引确定）： skiprows=[m,n]，跳过m行和n行

列操作 设置需要读取的列： usecols=[列1，列2，....]
④设置列名： names=[列1,列2...]
⑤直接将其中几列转换为日期格式：`parse_dates=[‘列1’【,’列2’】]

4.通过读Excel文件创建DataFrame

读Excel文件前装第三方库： !pip install xlrd xlwt openpyxl
： pd.read_excel('.../.../...')
设置工作表表名（针对一个Excel文件中有多张表时）： sheet_name='Sheet'

5.读取数据库文件

下载pymysql： !pip install pymysql
导入第三方库： import pymysql

连接数据库

con=pymysql.connect(
    host='****',
    port=3306,
    user='****',
    password='****',
    database='****',
    charset='utf8mb4'
)

读取mysql中的数据

df=pd.read_sql(
    'select a1,a2 from table_name'
    con,
    index_col=
)

6.读取文本文件

df=pd.read_table('文件名',sep='\s+')：sep用于对行中字段进行拆分的字符序列或正则表达式

二、DataFrame的属性

1.基本属性

df.shape：查看形状
df.values：所有的值，data
df.index：行索引
df.columns：列索引
df.info()：查看数据性质
df.T：进行转置（行与列进行转置）

2.查看前/后几行数据

默认查看5行，可在( )中加参数规定查看行数
前几行： df.head( n )
后几行： df.tail( n )

3.列/行索引（取值）

1）取整行
df [ 开始位置 : 结束位置 ]写数组，表示取行，对行进行操作；
df.loc[ 行索引 , 列索引 ]：标签索引，通过标签获取行数据，取某行某列的一个值；
df.iloc [ 行索引 ]：位置索引，行索引（默认值），通过位置获取行数据

2）取整列
df [ 列名 ]：写字符串，表示取列索引，对列进行操作；

3）取n行n列
①某几行的一列： df [ 行开始位置 : 行结束位置 ] [ 列名 ]
② 同时取多行多列 df [ 行开始位置 : 行结束位置 ] [ 列开始位置 : 列结束位置 ]
③ df.loc[ [行索引1 , 行索引2 , ... ] , [ 列索引1 , 列索引2 , 列索引3 , ....] ]：取不连续的值
④ df.loc[m:n,x:y]：取m行到n行，x列到y列的数据
⑤ df.loc [ m : n , [ x , y] ]：取m到n行的x列和y列，省略m代表从0行取到n行，省略n代表从m行开始取到最后一行
⑥ df.loc[ [ m , n ] , x : y ]：取m行和n行中x列到y列的值，省略x代表从0列取到y列，省略y代表从x列开始取到最后一列
⑦ix标签与位置混合索引：已弃用
冒号在loc里面是闭合的，即会选择到冒号后面的数据

4）赋值更改数据
用索引取值后进行赋值
更改列的值： df[列索引]=新值， df[列名]=新值， df.列=新值，修改为多个不同的值时值用列表表示：[值1,值2,…]
修改行的值： df.loc[ 行名] = 新值
修改某个值： df.loc[行名,列名]=新值

4.添加行/列

1 ) 添加列
①给添加的列赋统一值： df [ 列名 ] ='值'
②给添加的列赋不一样的值： df [ 列名 ]= [ 值1 ,值2 ,... ]
③随机赋值： df [ 列名 ] =[ 随机数组 ]
④在指定位置添加列： df.insert(列下标,'列名',[.值1,值2,..])

2 ) 添加行
df.loc['行名']=[值1,值2,值3...]
df [ 行索引 ]={ 列1 : 值1 , 列2 : 值 , .... }
pd.append(dic,ignore_index=True)

; 5.删除行/列

1 ) 删除行
index可以省略
①删除行时结果创建一个新表： df.drop( index=行索引 )
②从原表直接删除： df.drop( index=行索引 , inplace=Ture )
③删除多行： df.drop(index=[ 行索引1 , 行索引2 , ....]

2 ) 删除列
del df['列名']
df.drop(列名,axis=1)：DataFrame删除列，axis=’columns’也是在列上操作
df.drop( columns=列名 , inplace=True )：在原对象上进行删除

6.数据抽样

指定抽样数量： df.sample( n=4 )
按比例抽样： df.sample( frac=0.3 )

7.数据筛选

用 布尔索引 筛选数据： df [ ( df.条件1 ) & ( df.条件2) | (df.条件3 ) ]，
按Python条件筛选： df.query ( '筛选条件' )

8.排序

df.sort_index()：根据索引排序，默认按行索引升序，axis=1按列索引，添加ascending=False参数改为降序排序
df.sort_values( by='列名')：根据值的大小进行排序，缺失值默认排在最后；添加ascending=False参数改为降序排序

三、DataFrame的方法

pandas的方法

一、Pandas统计计算和描述

默认为axis=0按列统计；axis=1时按行统计 ；skipna用来排除缺失值，默认为True

函数说明ser.describe()获取描述性统计信息ser.index获取全部索引ser.values获取所有数据ser.size获取元素个数ser.isin([n])判断值n是否存在，返回布尔类型ser.head()取出前几行数据，默认为前五行ser.tail()取出后几行数据，默认为后五行ser.sort_values( )按值排序ser.sort_index( )按索引排序ser.nlargest( n )、ser.nsmallest( n )找出topNser.name命名，对象名，ser.index.name:对象索引名ser.is_monotonic判断是否单调，默认为递增ser.is_monotonic_increasing判断是否递增ser.is_monotonic_decreasing判断是否递减ser.map()映射df.sum()求和df.idxmax()返回最大值的索引sample(序列a，n)从序列a中随机抽取n个元素，并将n个元素生以list形式返回


ser.map(lambda item:item*100)

常规数据
最大值：ser.max( )
最小值：ser.min( )
均值：ser.mean( )
中值：ser.median( )

二、索引和复合索引（层次化索引）

1.简单的索引操作

获取index： df.index
指定index ： df.index = ['x','y']
重新设置index（更改index的顺序） : df.reindex(list("abcedf"))，用来创建一个符合新索引的新对象；对Series，调用该 Series 的 reindex 将会根据新索引进行重排。如果某个索引值当前不存在，就引入缺失值。对于 DataFrame， reindex 可以修改行索引、列、或者两个都修改，如果仅传入一个序列，则会重新索引行，使用 columns 关键字即可重新索引列
指定某一列作为index ： df.set_index("Country",drop=False)，drop表示是否将设为索引的列从数据中去除
重新设置索引： df.reset_index(drop=Ture)，将索引设为0-n，drop为True时删除原索引
返回index的唯一值： df.set_index("Country").index.unique()
将层次化索引变为简单索引： df.set_reindex()

2.Series复合索引

有复合索引（层级索引）的Series对象
ser=pd.Series(np.arange(10),index=(['a','b','c','d'],[1,2,3,4])：创建一个有复合索引的Series对象
ser[外层索引]：外层索引
ser[[外层索引1，外层索引2]]， ser.loc[[外层索引1，外层索引2]]：取多个
ser[外层索引1:外层索引2]：切片
ser[:][内层索引]， ser[:,内层索引]：内层索引
ser[外层索引,内层索引]， ser["外层索引"]["内层索引"]
ser.swaplevel()：交换全部内外索引
ser.swaplevel()["原内层索引"]["原外层索引"]：交换层次化索引的顺序

3.DataFrame复合索引

df.loc["外层索引"].loc["内层索引"]

三、pandas的对齐运算

pandas执行算术运算时，会先按照索引进行对齐，对齐后再进行相应的运算，没有对齐的位置会用NAN进行补齐。Series是按行索引进行对齐，DataFrame按行索引、列索引进行对齐；
可以在调用add方法时用fill_value使用对象中存在的数据进行补充： df1.add(df2,fill_value=x)

四、pandas的函数应用

1.通过apply将函数应用到列或行 df.apply(函数)：默认axis=0列
2.通过applymap将函数运用到每个数据 df.applymap(函数)

五、缺失数据的处理

1.判断数据是否为NaN

np.isnull ( df )， np.notnull( df )

2.处理方法

1 ) 删除NaN所在的行或列
df.dropna(axis=0,how='any',inplace=False)
how=’any’：any—默认值，当前行或列有一个就删除整行或整列；all—当前行/列全为NaN时才删除该行/列
axis：默认为0；0或index—删除缺失数据所在的行；1或values—删除包含缺失值的列
2 ) 填充数据
df.fillna( 填充值)，填充某一列时先取出该列再填充： df[ 列名 ] . fillna(填充值)
df.fillna( t.mean())：用平均数填充
df.fillna( t.median())：
df.fillna(0)

六、多表合并与连接

1.merge 按指定列将多表进行连接

df1.merge (df2 , on=用于连接的列名)
pd.merge(表1（左表） , 表2（右表） , ... , on=通过哪一列进行连接 , 【how= 连接方式（默认为内连接）, left_on=None , right_on=None , left_index=False , right_index=False , sort=False ,suffixes=('_x','y')】)

①lef_on/right_on：以左侧或右侧的DateFrame作为连接键
②sort：是否排序，接收布尔值，默认为False
③suffixes：用于追加到重叠列名的末尾，默认为（_x,_y）
④ left_index/right_index：左/右侧的行索引用作连接键

2.Join——根据行索引合并数据

df1 . join (df2 , 【on , how=' ' ,lsuffix=' ' , rsuffix=' ' , sort=False】)
①默认情况下把 行索引相同的 数据合并到一起，合并的表不能有重叠列
②on：用于连接的列名
③how可以从{left，right，outer，inner}中选一个，默认使用left方式。
④lsuffix、rsuffix：接收字符串，用于在左/右侧重叠的列名后添加后缀名
⑤sort：用于接收布尔值，根据连接键对合并的数据进行排序，默认为False

3. concat沿一条轴将多个表合并

pd.concat( [ 表1 , 表2 , ...] , axis=0 , join=' outer' , ignore_index=False , keys= ' ' )
①axis：表示连接的轴向，0或1，默认为0（加在原数组下面，按列名对齐）；axis=1时加在原数组右边按行名对齐
②join：连接方式，默认使用外连接outer
③ignore_index：接收布尔值，默认为False。为True时表示清楚现有索引并重置索引值
④keys：接收序列，表示添加最外层索引

保存数据到Excel文件中： total_df . to_excel( '文件名.xlsx' )

七、数据聚合与分组运算

group by分组

df.group by (by=None , axis=0 , level=None , as_index=True , sort=True )

1.通过列名进行分组
df.groupby ( by=列名 )：得到一个DataFrameGroupBy对象，可通过遍历该对象查看每个分组具体内容（每组结果为一个元祖）
获取分组后的某一部分数据： df.groupby(by=[ 分组条件1 , 条件2 , ...])[ 需要的部分] . count( )
对某几列数据进行分组（返回DataFrame类型）： df[ [需要的部分]] . groupby(by=[df [条件1] , df [条件2] ] ) .count()， df.groupby(by=[条件1 , 条件2])[[需要的部分]].count()

group1=df.groupby(by='colu')
for i in group1:
    print(i)

unstack()函数可以将多条件分组后的数据进行压缩，使同组的结果在同一行进行显示

2.通过Series对象进行分组
可以创建Series对象作为分组依据， df.groupby(by=ser)，（按索引进行分组）当Series对象索引的长度与Pandas索引长度不同时，只会将具有相同索引长度的数据进行分组。

3.通过字典进行分组
传入表示分组规则的字典，将字典作为分组键进行分组， df.groupby(by=dic )，注意指定轴

4.通过函数进行分组
可以通过内置函数进行分组，例如len()函数

聚合

1.使用内置统计方法聚合函数

函数名描述count分组中非NA值的数量sum非NA值的和mean非NA值的平均值median非NA值的中位数std, var标准差和方差min, max非NA的最小值，最大值prod非NA值的乘积first, last非NA值的第一个,最后一个

2.面向列的聚合方式
内置方法不能满足聚合要求时，可以自定义函数，传给agg()方法（aggregate()），实现聚合
d_g.agg(func,axis=0,*args,**kwargs)：func—-用于汇总数据的函数；axis—-函数作用于轴的方向，0或index表示应用与每一列，1或columns表示应用到每一行，默认为0
①对同一列应用同一个函数： d_g.agg(函数)
②对某列应用不同的函数： d_g.agg([('生成的列名',函数1),('生成的列名',函数2)])
③对不同的列应用不同的函数： d_g.agg({'列名1':'函数名1','列名2':'函数名2',....})，传入{‘列名’:’函数名’}的字典

八、文件操作

写入文件 ： df.to_csv('df.csv')

1.分块读取大文件

df=pd.read_csv(file,【chunksize=n】,【iterator=True】)：读取文件的n行数据，产生一个可迭代对象，每次 df.get_chunk(m) 后得到的数据为上一次的后m行，省略m时默认为n行；
iterator=True：产生可迭代对象

九、时间序列

创建固定频率的时间序列

Datetimeindex：时间戳
pd.data_range(start=None,end=None,periods=None,freq='D')
start：开始时间
end：结束时间
periods：个数，表示生成多少个时间戳索引值
freq：指定计时单位，M\D\H\T\S…

① start和end以及freq 配合能够生成start和end范围内以频率freq的一组时间索引
② start和periods以及freq 配合能够生成从start开始的频率为freq的periods个时间索引

将字符串转化为时间序列： df[列名]=pd.datetime(df[列名] , format=" ")，format参数大部分情况下可以不用写，但是对于pandas无法格式化的时间字符串，我们可以使用该参数，比如包含中文。

时间序列的基础频率

别名说明M每月最后一个日历日BM每月最后一个工作日MS每月第一个日历日BMS每月第一个工作日D每日历日B每工作日H每小时T或min每分S每秒L或ms每毫秒U每微秒

时间重采样

重采样： 指的是将时间序列从一个频率转化为另一个频率进行处理的过程，将高频率数据转化为低频率数据为 降采样 （比如从天到月），低频率转化为高频率为 升采样 （从月到天）
t.resample( '新的计时单位')

创建时期对象

PeriodIndex：时间段，（能将分开的时间字段组合起来）转换为pandas的时间类型
pd.PeriodIndex(year=' ' , month=' ' , day=' ' , hour=' ' ,freq=' H ' )

Python time strftime() 函数 接收以时间元组，并返回以可读字符串表示的当地时间，格式由参数 format 决定。
time.strftime(format[ , t ])
format：格式字符串。
t：可选的参数t是一个struct_time对象。
返回以可读字符串表示的当地时间

Original: https://blog.csdn.net/weixin_46704813/article/details/120854001
Author: 不会数据分析
Title: pandas的Series和DataFrame

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/753328/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

普通函数、参数、匿名函数、高阶函数、递归函数、闭包、装饰器

定义函数 def fn(): print("这是函数内部") 调用 fn() fn() 区分 fn: 这是真正意义上的函数本身 fn(): 这是调用函数函数参…

Python 2023年11月1日
0065
python矩阵运算

1) 矩阵的乘法矩阵乘法为 A @ B 或 np.dot(A, B)，若为对应元素相乘则用 A*B或 np.multiply(A,B) A = np.array([[1,2],[…

Python 2023年8月25日
0081
自学Python第六天：实战练习——机选双色球

Python自学第六天：实战练习——机选双色球我是一个编程小白，目前从事运维工作。对于运维相关的技术，基本上都是了解点皮毛。因为最近接触自动化运维工具，看到很多工具都需要用到Py…

Python 2023年6月9日
0077
Pandas-数据结构-DataFrame（二）：设置索引【①创建DataFrame时添加行、列索引；②修改行/列索引值；③重设新下标索引；④以某列值设置为新的索引】

DataFrame索引修改的时候,需要进行全局修改对象.reset_index() 对象.set_index(keys) 创建学生成绩表 score = np.random.r…

Python 2023年8月17日
0067
python两个数相加程序_两个数相加

除非您需要在应用程序的后端使用用户输入的值，否则您只需在前端执行计算： Input first number: Input second number: Calculate $(d…

Python 2023年8月15日
0070
RepVGG网络简介

论文名称： RepVGG: Making VGG-style ConvNets Great Again论文下载地址：https://arxiv.org/abs/2101.03697…

Python 2023年10月8日
0056
Pycharm的下载与安装使用

一、Pycharm软件简介产品简介 PyCharm是一种Python IDE（Integrated Development Environment，集成开发环境），带有一整套可以…

Python 2023年11月2日
0043
Python中matplotlib模块errorbar函数绘制误差棒图

Python的matplotlib模块中的errorbar函数可以绘制误差棒图，本次主要绘制不带折线的误差棒图。传送门 1.基本参数 2.代码实现 3.结果显示 4.更多参数请参…

Python 2023年8月31日
0071
【Pandas】DataFrame只复制其中的某一行为多次

import pandas as pd df = pd.DataFrame(data={ ‘id’: [‘1’, ‘2’, ‘3’], ‘col1’ : [ 5, 6, 7], ‘…

Python 2023年8月18日
0048
Python数据可视化02：单式折线统计图与复式折线统计图

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

Python 2023年9月1日
0049
python构造函数调用成员函数_Python：用父的构造函数初始化对象的成员？

所以我有一些 Python代码的结构是这样的; class GameObject(pygame.spriteDirtySprite): def init(self): pygame…

Python 2023年9月24日
0063
树莓派通过RF443MHz收发控制家庭灯

背景：家中随意贴开关损坏(一种通过443MHz控制的远程开关)，且关灯后到卧室需要摸黑，萌生了搞远程控制灯的想法，因为有吃灰的树莓派，所以考虑了最低成本的方案，只需购买价值几元钱的…

Python 2023年8月14日
0033
linux部署pytest的环境若干问题

linux部署pytest的环境若干问题记录总结： 1、pytest的框架中必须存在有conftest.py文件 2 Python3的安装包必须是有dev环境 3 安装devl…

Python 2023年9月12日
0088
pandas 空字符串与na区别_关于python：Pandas用空白/空字符串替换NaN

我有一个Pandas Dataframe，如下所示： 1 2 3 0 a NaN read 1 b l unread 2 c NaN read 我想用空字符串删除NaN值，以便它看…

Python 2023年8月17日
0048
数据挖掘01-相关性分析及可视化【Pearson, Spearman, Kendall】

数据挖掘01-相关性分析及可视化【Pearson, Spearman, Kendall】 * – 简介 – 一、什么是相关性分析 – 二、常见的…

Python 2023年8月2日
0076
scrapy mysql 豆瓣_Scrapy爬取豆瓣图书保存MySQL实验

一、任务描述本实验任务主要对Scrapy爬取进行一些基本操作，通过完成本实验任务，要求学生熟练掌握数据爬取保存MySQL的操作，并对数据保存至MySQL的基本操作进行整理并填写工…

Python 2023年10月5日
0041

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31