Pandas：
    数据分析，在Numpy基础上增加了高级功能：数据自动对齐，时间序列支持、缺失数据灵活处理等等
    Series、DataFrame核心数据结构，大部分Pandas功能都围绕这两种数据结构进行
    Series是一个值得序列，可以理解成一维数组，有一个列和一个索引，索引可以定制

1.1 Series方法：

import pandas as pd
s1 = pd.Series([1,2,3,4,5])
print(s1)

"""
D:\Anaconda3\python.exe D:/Python_file_forAnconda3_python/数据分析/自定义学习/Pandas01.py
0    1
1    2
2    3
3    4
4    5
dtype: int64

Process finished with exit code 0
"""

import pandas as pd
s2 = pd.Series([1,2,3,4,5],index=['a','b','c','d','e'])
print(s2)

"""
D:\Anaconda3\python.exe D:/Python_file_forAnconda3_python/数据分析/自定义学习/Pandas01.py
a    1
b    2
c    3
d    4
e    5
dtype: int64
"""

1.2 DataFrame类似于二维数组，有行列之分

import pandas as pd
import numpy as np

df = pd.DataFrame(np.random.randn(4,4),index=['a','b','c','d'],columns=['A','B','C','D'])
print(df)

"""
D:\Anaconda3\python.exe D:/Python_file_forAnconda3_python/数据分析/自定义学习/Pandas01.py
          A         B         C         D
a  0.341299 -1.501784  1.069910  0.879989
b  0.416756  1.066293  0.569988  2.745966
c  0.711972 -0.336308 -0.006444  1.322002
d  2.217314 -0.281477 -0.706486  0.117150

Process finished with exit code 0
"""

通过指定索引-index和标签-columns创建DataFrame对象，可以通过df.index和df.columns访问索引和标签:

        df.index
        Out[12]: Index(['a', 'b', 'c', 'd'], dtype='object')
        df.columns
        Out[13]: Index(['A', 'B', 'C', 'D'], dtype='object')

2.1 Series:索引或索引位置

import pandas as pd
import numpy as np
s2 = pd.Series([1,2,3,4,5],index=['a','b','c','d','e'])
print(s2[0])
print('_______')
print(s2[0:3])
print(s2['a'])
print("________")
print(s2['a':'c'])

"""
D:\Anaconda3\python.exe D:/Python_file_forAnconda3_python/数据分析/自定义学习/Pandas01.py
1
_______
a    1
b    2
c    3
dtype: int64
1
________
a    1
b    2
c    3
dtype: int64

Process finished with exit code 0

"""

2.2 Series属性:iloc，loc（按”行”来索引）

import pandas as pd
import numpy as np
s2 = pd.Series([1,2,3,4,5],index=['a','b','c','d','e'])
print(s2.iloc[0:3])  #按照默认索引访问
print("--------------")
print(s2.loc['a':'c'])  #按照自定义的index访问

"""
D:\Anaconda3\python.exe D:/Python_file_forAnconda3_python/数据分析/自定义学习/Pandas01.py
a    1
b    2
c    3
dtype: int64
a   -0.931263
b   -0.648751
c    0.438436
d   -1.481929
Name: A, dtype: float64
"""

3.2 读取多行多列：loc方法

import pandas as pd
import numpy as np

df = pd.DataFrame(np.random.randn(4,4),index=['a','b','c','d'],columns=['A','B','C','D'])
print(df)
print("-----")

print(df.loc[:,['B','C','D']]) # 标签取值-多行多列 (以默认的方式)

"""
D:\Anaconda3\python.exe D:/Python_file_forAnconda3_python/数据分析/自定义学习/Pandas01.py
          A         B         C         D
a -1.205197 -0.375471  0.115681  0.111243
b -0.329662  0.001292 -0.540496 -1.274938
c -0.285998  0.122846 -0.738836  0.213211
d -1.479184  0.251340  0.322654 -0.745249
-0.23413573419505523
      A     B     C     E
a   0.0   1.0   2.0   NaN
b   3.0   5.0   7.0   3.0
c  10.0  12.0  14.0   7.0
d   8.0   9.0  10.0  11.0

'''

运算统计

统计：
    类似Numpy,Series与DataFrame也可以使用各种统计方法：平均值、方差、求和等等，可通过descirbe方法可以获取常见统计信息
                 A    B    C
        count  3.0  3.0  3.0            元素值得数量
        mean   3.0  4.0  5.0            平均数
        std    3.0  3.0  3.0            标准差
        min    0.0  1.0  2.0            最小值
        25%    1.5  2.5  3.5            取值百分比
        50%    3.0  4.0  5.0            取值百分比
        75%    4.5  5.5  6.5            取值百分比
        max    6.0  7.0  8.0            最大值

6.1 合并两个DataFrame两种方法：

import pandas as pd
import numpy as np

df1 = pd.DataFrame(np.random.randn(3,3))
df2 = pd.DataFrame(np.random.randn(3,3),index=[5,6,7])
print(pd.concat([df1,df2]))

"""
D:\Anaconda3\python.exe D:/Python_file_forAnconda3_python/数据分析/自定义学习/Pandas01.py
          0         1         2
0  1.236067  0.751290  0.358762
1 -1.605407 -1.296070 -0.167892
2  1.403888  1.962560  0.766084
5 -1.118603  0.845264 -0.890752
6 -1.209584  0.006337  0.310854
7  2.104464 -0.157647 -1.805883

Process finished with exit code 0

"""

df1 = pd.DataFrame({'user_id':[5248,13],'course':[12,45],'minutes':[9,36]})
df2 = pd.DataFrame({'course':[12,5], 'name':['Numpy','Pandas']})
print(pd.merge([df1,df2]))

6.2 Pandas也支持类似于数据库查询语句GROUP BY,可完成分组按照某列

import pandas as pd

df1 = pd.DataFrame({'user_id':[5248,13,5348],'course':[12,45,23],'minutes':[9,36,45]})
a = df1[['user_id','minutes']].groupby('user_id').sum()  #通过'user_id'和'minutes'来进行分组，并按'user_id'排列
print(a)

"""
D:\Anaconda3\python.exe D:/Python_file_forAnconda3_python/数据分析/自定义学习/Pandas01.py
         minutes
user_id
13            36
5248           9
5348          45

Process finished with exit code 0

"""

7.1 时间差的运算

from datetime import datetime, timedelta
d1 = datetime(2020,3,15)
delta = timedelta(days=10) #时间为10天
print(d1+delta)

"""
D:\Anaconda3\python.exe D:/Python_file_forAnconda3_python/数据分析/自定义学习/Pandas01.py
2020-03-25 00:00:00
"""

7.2 pandas与datetime

import pandas as pd
import numpy as np
from datetime import datetime, timedelta

dates = [datetime(2020,3,15),datetime(2020,3,16),datetime(2020,3,17),datetime(2020,3,18)]
ts = pd.Series(np.random.randn(4),index=dates) # 数组ts的索引index定义为dates的值

print(ts)
print('------')
print(dates)
print('------')
print(ts.index[0])

"""
D:\Anaconda3\python.exe D:/Python_file_forAnconda3_python/数据分析/自定义学习/Pandas01.py
2020-03-15   -0.185834
2020-03-16   -2.075404
2020-03-17   -1.093103
2020-03-18    0.171173
dtype: float64
2020-03-15 00:00:00
"""

pandas取索引对应的值：
    ts[ts.index[0]]  # ts.index[0]  表示的是索引值
    ts['2020/3/15']
    ts['3/15/2020']
    ts[datetime(2020,3,15)]

7.3 pandas可生成日期范围通过方法.date_range函数

pandas可生成日期范围通过方法.date_range函数
    该函数可传参：
    start:      指定日期范围起始时间
    end：       指定日期范围截止时间
    preiods：   指定日期范围间隔时间
    freq：      指定日期频率：D-每天，H-每小时，M-每月
                    5D - 5天
                    MS-  每个月第一天
                    BM-  每个月最后一个工作日
                    1h30min 1小时30分钟
            pd.date_range('2020-1-1','2021',freq='MS')

Original: https://blog.csdn.net/m0_55196097/article/details/125455085
Author: Top Secret
Title: python数据分析03—Pandas

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/676239/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Pytorch读取照片的三种方式（包括但不限于）

1.安装方式 conda install pillow 2.举例 from PIL import Image import numpy as np path=’../dataset…

人工智能 2023年6月24日
0079
Spire.Office for .NET 7.11.0 冬季之约好时光~@~

Spire.Office for .NET is a combination of Enterprise-Level Office .NET API offered by E-ic…

人工智能 2023年6月30日
0063
【工具推荐】个人本地 markdown 知识图谱软件 Obsidian

一、特点 Obsidian 是基于本地文件夹的个人知识图谱软件。和一般的编辑器不一样的是，它的侧重点是知识库（knowledge base）。那么，如何理解知识库呢？下图是官网首…

人工智能 2023年6月1日
0074
语音信号的数学模型

一、数字信号处理基础 T [ a x 1 ( t ) + b x 2 ( t ) ] = a T [ x 1 ( t ) ] + b T [ x 2 ( t ) ] T[ax_1(…

人工智能 2023年5月25日
0084
TensorFlow构建模型二

人工智能 2023年5月26日
0052
图像分类方法总结

图像分类问题描述图像分类问题是计算机视觉领域的基础问题，它的目的是根据图像的语义信息将不同类别图像区分开来，实现最小的分类误差。具体任务要求是从给定的分类集合中给图像分配一个标签…

人工智能 2023年7月25日
0055
KernelGAN论文详解分享

KernelGAN- Blind Super-Resolution Kernel Estimation using an Internal-GAN论文详解论文地址：https:/…

人工智能 2023年6月20日
0074
java计算机毕业设计二手车商城源码+mysql数据库+系统+lw文档+部署

本源码技术栈：项目架构：B/S架构开发语言：Java语言开发软件：idea eclipse 前端技术：Layui、HTML、CSS、JS、JQuery等技术后端技术：JAV…

人工智能 2023年6月26日
0055
数据挖掘实战—商品零售购物篮分析

文章目录 * – 引言 – 一、数据探索性分析 – + 1.数据质量分析 + * 1.1 缺失值分析 * 1.2 异常值分析 * 1.3 重复数…

人工智能 2023年6月19日
0073
深度学习系列37：CLIP模型

1 模型说明含义：CLIP（Contrastive Language-Image Pre-training）git地址：https://github.com/openai/CLI…

人工智能 2023年6月22日
0078
使用pytorch搭建AlexNet并训练花分类数据集

深度学习学习笔记导师博客：https://blog.csdn.net/qq_37541097/article/details/103482003导师github:https://…

人工智能 2023年7月2日
0062
【使用篇】WebView 实现嵌套滑动，丝滑般实现吸顶效果，完美兼容 X5 webview

本文首发我的公众号徐公，收录于 Github·AndroidGuide，这里有 Android 进阶成长知识体系, 希望我们能够一起学习进步，关注公众号徐公，5 年中大厂程序员…

人工智能 2023年5月30日
00131
生成模型(一):GAN

生成对抗网络 (GAN)在许多生成任务中显示出很好的结果，以复制真实世界的丰富内容，例如图像、文字和语音。它受到博弈论的启发：一个生成器和一个判别器，在互相竞争的同时让彼此变得更强…

人工智能 2023年7月31日
0051
win10+英伟达mx150安装cuda,cudnn,GPU版本pytorch

最近打算给笔记本装一个gpu版本的pytorch,装了有半天才搞完，中间也出现了不少问题看了不少博客，现在总结一下出现的问题以及解决办法，希望能给遇到同样问题的提供一些帮助。本人水…

人工智能 2023年7月22日
0098
pandas经典练习题

pandas是Python的一个非常强大的数据分析库，它提供了高性能易用的数据类型，以及大量能使人们快速地处理数据的函数与方法。pandas的核心数据结构有两种，即一维数组的Ser…

人工智能 2023年7月7日
0077
pytorch对网络层的增，删，改, 修改预训练模型结构

#下载模型参数 model.load_state…

人工智能 2023年6月23日
0060

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

python数据分析03—Pandas

1.1 Series方法：

1.2 DataFrame类似于二维数组，有行列之分

2.1 Series:索引或索引位置

2.2 Series属性:iloc，loc（按”行”来索引）

3.2 读取多行多列：loc方法

6.1 合并两个DataFrame两种方法：

6.2 Pandas也支持类似于数据库查询语句GROUP BY,可完成分组按照某列

7.1 时间差的运算

7.2 pandas与datetime

7.3 pandas可生成日期范围通过方法.date_range函数

大家都在看