python –Pandas详解

2023年8月19日上午10:25 • Python • 阅读 34

pip install pandas

检验是否安装成功

import pandas

print(pandas.__version__)
&#x8F93;&#x51FA;: 1.3.4

入门示例:

import pandas as pd

a = {
    '&#x5217;&#x540D;1': ['01', '02', '03'],
    '&#x5217;&#x540D;2': ['08', '09', '10']
}

b = pd.DataFrame(a)
print(b)

&#x8F93;&#x51FA;:
  &#x5217;&#x540D;1 &#x5217;&#x540D;2
0  01  08
1  02  09
2  03  10

Pandas 数据结构 – Series

Pandas Series 类似表格中的一个列（column），类似于一维数组，可以保存任何数据类型。

Series 由索引（index）和列组成，函数如下：

pandas.Series( data, index, dtype, name, copy)

参数说明：

data：一组数据(ndarray 类型)。
index：数据索引标签，如果不指定，默认从 0 开始。
dtype：数据类型，默认会自己判断。
name：设置名称。
copy：拷贝数据，默认为 False。

创建一个简单的 Series 实例：

import pandas as pd

a = [1, 2, 3]
myvar = pd.Series(a)
print(myvar)

&#x8F93;&#x51FA;:
0    1
1    2
2    3
dtype: int64

索引
如果没有指定索引，索引值就从 0 开始，我们可以根据索引值读取数据！

import pandas as pd

a = [1, 2, 3]
myvar = pd.Series(a)
print(myvar[2])

print(myvar.get(10)) &#x53EF;&#x4EE5;&#x901A;&#x8FC7;get&#x65B9;&#x5F0F;&#x62FF;  &#x62FF;&#x4E0D;&#x5230;&#x8FD4;&#x56DE;None&#xFF0C;&#x4E5F;&#x53EF;&#x6307;&#x5B9A;&#x9ED8;&#x8BA4;&#x503C;

&#x8F93;&#x51FA;:
3

可以指定索引值，如下:

import pandas as pd

a = ["Google", "Runoob", "Wiki"]

myvar = pd.Series(a, index=["x", "y", "z"])
print(myvar)
print('-------------------&#x534E;&#x4E3D;&#x7684;&#x5206;&#x5272;&#x7EBF;------------------')
print(myvar['x'])

&#x8F93;&#x51FA;:
x    Google
y    Runoob
z      Wiki
dtype: object
calories    420
duration     50
Name: 0, dtype: int64
   calories  duration
1       380        40
2       390        45

&#x6CE8;&#xFF1A;&#x8FD4;&#x56DE;&#x7ED3;&#x679C;&#x5176;&#x5B9E;&#x5C31;&#x662F;&#x4E00;&#x4E2A; Pandas DataFrame &#x6570;&#x636E;&#x3002;

可以指定索引值，如下实例

import pandas as pd

data = {
    "calories": [420, 380, 390],
    "duration": [50, 40, 45]
}

df = pd.DataFrame(data, index=["day1", "day2", "day3"])

print(df)
print(df.loc["day2"]) # &#x6309;&#x884C;&#x53D6;&#x503C;

&#x8F93;&#x51FA;:
      calories  duration
day1       420        50
day2       380        40
day3       390        45

DataFrame 增删改查

import pandas as pd

data = {
    "calories": [420, 380, 390],
    "duration": [50, 40, 45]
}

df = pd.DataFrame(data, index=('10', '11', '12'))

print(df['calories']) # &#x6309;&#x5217;&#x63D0;&#x53D6;
print(df.iloc[0])  # &#x6309;&#x884C;&#x7D22;&#x5F15;&#x63D0;&#x53D6;
print(df.loc['10']) # &#x6309;&#x884C;&#x81EA;&#x5B9A;&#x4E49;&#x7D22;&#x5F15;&#x63D0;&#x53D6;

 # del df['duration']  # del &#x65B9;&#x6CD5;&#x5220;&#x9664;
df.pop('duration') # pop&#x65B9;&#x6CD5;&#x5220;&#x9664;
print(df)

df['add'] = [88, 89, 90]  #&#x65B0;&#x589E;
print(df)

df.insert(0, 'insert', '98')   # &#x63D2;&#x5165;&#x5217;&#x7D22;&#x5F15;,&#x5217;&#x540D;,&#x503C;
df.insert(0, 'insert', [98, 99, 100])

处理CSV

读csv并输出

import pandas as pd
df = pd.read_csv(r'C:\Users\ht-desktop-001\Desktop\nba.csv')

print(type(df))
print(df.to_string())
&#x6CE8;&#xFF1A; to_string() &#x7528;&#x4E8E;&#x8FD4;&#x56DE; DataFrame &#x7C7B;&#x578B;&#x7684;&#x6570;&#x636E;&#xFF0C;&#x5982;&#x679C;&#x4E0D;&#x4F7F;&#x7528;&#x8BE5;&#x51FD;&#x6570;&#xFF0C;&#x5219;
&#x8F93;&#x51FA;&#x7ED3;&#x679C;&#x4E3A;&#x6570;&#x636E;&#x7684;&#x524D;&#x9762; 5 &#x884C;&#x548C;&#x672B;&#x5C3E; 5 &#x884C;&#xFF0C;&#x4E2D;&#x95F4;&#x90E8;&#x5206;&#x4EE5; ... &#x4EE3;&#x66FF;&#x3002;

&#x8F93;&#x51FA;:
<class 'pandas.core.frame.dataframe'>
                         Name                    Team  Number Position   Age Height  Weight                College      Salary
0               Avery Bradley          Boston Celtics     0.0       PG  25.0    6-2   180.0                  Texas   7730337.0
1                 Jae Crowder          Boston Celtics    99.0       SF  25.0    6-6   235.0              Marquette   6796117.0
2                John Holland          Boston Celtics    30.0       SG  27.0    6-5   205.0      Boston University         NaN
...&#x592A;&#x957F;&#x672A;&#x590D;&#x5236;
</class>

写入csv

import pandas as pd

&#x4E09;&#x4E2A;&#x5B57;&#x6BB5; name, site, age
nme = ["Google", "Runoob", "Taobao", "Wiki"]
st = ["www.google.com", "www.runoob.com", "www.taobao.com", "www.wikipedia.org"]
ag = [90, 40, 80, 98]

&#x5B57;&#x5178;
dict = {'name': nme, 'site': st, 'age': ag}

df = pd.DataFrame(dict)

&#x4FDD;&#x5B58; dataframe
df.to_csv('site.csv')

head()
head( n ) 方法用于读取前面的 n 行，如果不填参数 n ，默认返回 5 行。

import pandas as pd

df = pd.read_csv('nba.csv')

print(df.head())  #  &#x9ED8;&#x8BA4;5&#x884C;
print(df.head(1)) &#x8BFB;1&#x884C;

&#x8F93;&#x51FA;:
            Name            Team  Number  ... Weight            College     Salary
0  Avery Bradley  Boston Celtics     0.0  ...  180.0              Texas  7730337.0
1    Jae Crowder  Boston Celtics    99.0  ...  235.0          Marquette  6796117.0
2   John Holland  Boston Celtics    30.0  ...  205.0  Boston University        NaN
3    R.J. Hunter  Boston Celtics    28.0  ...  185.0      Georgia State  1148640.0
4  Jonas Jerebko  Boston Celtics     8.0  ...  231.0                NaN  5000000.0

[5 rows x 9 columns]

tail()
tail( n ) 方法用于读取尾部的 n 行，如果不填参数 n ，默认返回 5 行，空行各个字段的值返回 NaN。

import pandas as pd

df = pd.read_csv('nba.csv')

print(df.tail())

info()返回表格的一些基本信息

`
import pandas as pd

df = pd.read_csv(r’C:\Users\ht-desktop-001\Desktop\nba.csv’)

print(df.info())

输出:

RangeIndex: 458 entries, 0 to 457 # 行数，458 行，第一行编号为 0
Data columns (total 9 columns): # 列数，9列
# Column Non-Null Count Dtype # 各列的数据类型

Original: https://blog.csdn.net/weixin_44634704/article/details/121338217
Author: 像风一样的男人@
Title: python –Pandas详解

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/753860/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Python pandas使用map, apply和applymap实现对DataFrame进行单列/行，多列/行，以及所有元素的操作

最近在查看网上关于pandas DataFrame使用map, apply和applymap的说明时，发现许多博文未能写清楚关键点。这里整理一下每个函数的使用范围和适用情况。首先…

Python 2023年8月6日
0039
PYTEST中conftest.py和@pytest.fixture()结合使用实现全局的前置应用

一：conftest.py和@pytest.fixture()结合使用实现全局的前置应用主要有以下特点： 1.conftest.py文件是单独存放的一个夹具配置文件，名称是不能更改…

Python 2023年9月12日
0047
python数据抽取框架_python数据分析3：数据抽取

1.使用Pandas获取网页中的表格数据并转化为EXCEL电子表格导入NBA球员的薪资数据import pandas as pd df = pd.DataFrame() url_…

Python 2023年8月8日
0039
Rust权威指南之无畏并发

安全并且高效地处理并发编程是Rust的另一个主要目标。并发编程和并行编程这两种概念随着计算机设备的多核优化而变得越来越重要。并发编程允许程序中的不同部分相互独立地运行；并行编程则允…

Python 2023年10月27日
0029
Flask中的celery使用

1.celery的介绍及安装命令 2.celery的应用场景及工作原理 3.在flask中使用celery异步队列 4.celery的启动命令 1.celery的基本介绍和安装命令…

Python 2023年8月9日
0040
keras环境搭建

操作系统： CentOS7.5.1804_x64 Python 版本 : 3.6.8 keras + tensorflow 环境搭建，使用cpu，安装命令如下： virtuale…

Python 2023年6月12日
0077
【2022-08-30】Django框架(一)

Django框架纯手撸web框架搭建socket服务端 import socket 1.创建一个socket对象 server = socket.socket() 2.绑定一个…

Python 2023年6月11日
0070
python极客项目编程pdf微盘下载_Python极客项目编程

内容简介 · · · · · · Python 是一种强大的编程语言，容易学习而且充满乐趣。但掌握了基本知识后，接下来做什么？本书包含了一组富有想象力的编程项目，它们将引导你用P…

Python 2023年9月21日
00113
Python2输出字段不乱码的解决方案包括list，就是这么厉害

Python2输出字段不乱码的解决方案包括list，就是这么厉害原创 wx5e6caa8b9792d2022-08-01 15:38:48博主文章分类：Python高级编程 ©著…

Python 2023年5月24日
0060
python数据分析及可视化（十一）Matplotlib布局配置（雷达图、Figure容器、子图对象、Axis容器、多图布局、3D绘制）

雷达图雷达图（Radar Chart）又被叫做蜘蛛网图，适用于显示三个或更多的维度的变量的强弱情况。比如某个企业在哪些业务方面的投入等，都可以用雷达图方便的表示。在matplot…

Python 2023年9月2日
0056
数据分析（5）merge()、groupby()、索引相关操作

1、join:默认情况下他是把行索引相同的数据合并到一起。 merge:按照指定的列把数据按照一定的方式合并到一起。通过merge函数合并两个DataFrame。on代表指明拿什…

Python 2023年8月8日
0064
抖音网页版高清视频抓取教程selenium

废话不多说，直接上代码 undefined undefined from selenium import webdriverfrom selenium.webdriver impo…

Python 2023年5月24日
00141
WARNING: The repository located at mirrors.aliyun.com is not a trusted or secure host and is being

更换下载源： https://pypi.tuna.tsinghua.edu.cn/simple/ Original: https://www.cnblogs.com/beichen…

Python 2023年6月10日
0062
scrapy mysql测试连接_scrapy通过连接池连接mysql工具(python3)

“””数据库连接工具类 “”” importpymysqlimporttracebackfrom DBUti…

Python 2023年10月6日
0029
Pytest环境搭建

Pytest环境搭建环境搭建： pip install pytest pip install pytest-html#原生态报告出现警告：python -m pip insta…

Python 2023年9月9日
0049
DNN（全连接神经网络）

一. DNN网络一般分为三层 1.输入层 2.隐藏层 3.输出层简单网络如下：二.前向传播从第二层开始，每一个神经元都会获得它上一层所有神经元的结果。即每一个 y = wx …

Python 2023年10月24日
0034

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

python –Pandas详解

检验是否安装成功

入门示例:

Pandas 数据结构 – Series

处理CSV

大家都在看