Pandas数据分析

2023年7月6日下午11:17 • 人工智能 • 阅读 73

什么是Pandas？
一、读取数据
*
读取csv文件
读取txt文件，自己指定分隔符、列名
读取EXCEl文件
读取MySQL数据库
二、Pandas数据结构
*
仅有数据列表即可产生最简单的Series
创建一个具有标签索引的Series
使用Python字典创建Series
根据标签索引查询数据
DataFrame
根据多个字典序列创建dataframe
查询多列，结果是一个pd.DataFrame
查询一行，结果是一个pd.Series
查询多行，结果是一个pd.DataFrame
三、Pandas数据查询
*
Pandas查询数据的几种方法

什么是Pandas？

一个开源的Python类库：用于数据分析、数据处理、数据可视化

很方便和其他类库一起使用：
numpy：用于数学计算
scikit-learn：用于机器学习

; 一、读取数据

读取csv文件

fpath=".....csv"

ratings=pd.read_csv(fpath)

ratings.head()

ratings.shape

ratings.columns

ratings.index

ratings.dtype

读取txt文件，自己指定分隔符、列名

fpath="....txt"
pvuv=pd.read_csv(
fpath,
sep='\t',
header=None,
names=['pdate','pv','uv']
)
pvuv

读取EXCEl文件

fpath="...xlsx"
pvuv=pd.read_excel(fpath)
pvuv

读取MySQL数据库

import pymysql
conn=pymysql.connect(
host='127.0.0.1',
user='root',
password='12345678',
database='test',
charset='utf8'
)
mysql_page=pd.read_sql("select * from crazyant_pvuv",con=conn)
mysql_page

二、Pandas数据结构

即DataFrame&Series
DataFrame：二维数据，整个表格，多行多列
Series：一维数据，一行或一列

仅有数据列表即可产生最简单的Series

import pandas as pd
import numpy as np
s1=pd.Series([1,'a',5.2,7])
s1
s1.index
s1.value

创建一个具有标签索引的Series

s2=pd.Series([1,'a',5.2,7],index=['d','b','a','c'])
s2
s2.index

使用Python字典创建Series

sdata={'Ohio':3500,.....}
s3=pd.Serires(sdata)
s3

根据标签索引查询数据

s2
s2['a']
type(s2['a'])
s2[['b','a']]
type(s2[['b','a']])

DataFrame

; 根据多个字典序列创建dataframe

查询多列，结果是一个pd.DataFrame

df[['year','pop']]
type(df[['year','pop']])

查询一行，结果是一个pd.Series

df.loc[1]
type(df.loc[1])

查询多行，结果是一个pd.DataFrame

df.loc[1:3]
type(df.loc[1:3])

三、Pandas数据查询

按数值、列表、区间、条件、函数五种方式查询

Pandas查询数据的几种方法

1、df.loc方法，根据行、列的标签值查询
2、df.iloc方法，根据行、列的数字位置查询
3、df.where
4、df.query

.loc既能查询，有能覆盖写入，强烈推荐！


df.loc[:,"bWendu"]=df["bWEndu"].str.replace("℃","").astype('int32')
df.loc[:,"yWendu"]=df["yWEndu"].str.replace("℃","").astype('int32')

Original: https://blog.csdn.net/qq_51408826/article/details/126815223
Author: 摩卡摩卡～
Title: Pandas数据分析

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/674989/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

健康管理师【2】

1.慢性病致病的主要危险因素不包括（）。 A.吸烟、过量饮酒 B.超重、肥胖 C.饮食不洁 D.缺乏体力活动 E.不合理膳食结构 2.中国居民平衡膳食宝塔建议每天应摄入奶制品和豆类…

人工智能 2023年7月17日
0073
软件工程应用与实践（十三）：三种新文本识别算法介绍

2021SC@SDUSC 目录一、前情回顾 1.1 PP-OCR文字识别算法和本文策略介绍二、SEED策略介绍 2.1 SEED是做什么的？ 2.2 SEED是怎么工作的？ 2…

人工智能 2023年7月17日
0061
写完Numpy100道基础练习题后的错误总结和语法总结

前言：由于是看视频学习的缘故，在写这100道题目道中有很多视频中没有出现的语法，然而很多语法直接拿来用都是比较简单的，少了很多的循环语句。至此写下这篇错误总结和语法总结，希望可以给…

人工智能 2023年6月12日
0086
关于Retinex理论的一些理解

目前一直在参与关于Retinex的相关课题，并完成了许多模型的构建，本文以个人的见解介绍Retinex的相关理论1. 基本原理Retinex理论是上世纪八十年代由land等人提出的…

人工智能 2023年6月23日
0071
OpenCV的车道线检测

资源下载地址：https://download.csdn.net/download/sheziqiong/85604275资源下载地址：https://download.csdn….

人工智能 2023年7月19日
0085
AUC 评价指标详解，准确率（ACC），敏感性（sensitivity），特异性（specificity）计算 Python3【TensorFlow2入门手册】

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年5月23日
0081
【微机接口】中断系统：PC系列机中的中断系统

非屏蔽中断：由输入NMI引脚的中断请求信号引发的中断 CPU响应非屏蔽中断的条件： (1)NMI引脚有中断请求，系统没有DMA请求 (2)CPU当前指令执行完毕非屏蔽中断对应的中…

人工智能 2023年6月29日
0088
电商常识图谱构建及搜索推荐场景下的应用

; 公众号系统之神与我同在背景知识知识图谱分类知识图谱是⼀种⽤图模型来描述知识和建模世界万物之间关联关系的⼤规模语义⽹络，分为：通⽤知识图谱 ·Yago 4, 2020·…

人工智能 2023年6月10日
0079
【详细】Ubuntu18.04更新CUDA版本（以安装CUDA11.4为例）

CUDA安装官方教程：官方教程cuDNN安装官方教程：官方教程在配置Pytorch环境的时候，想着尝试一下新版本的pytorch版本Stable(1.10.1)时，发现这个pyt…

人工智能 2023年6月24日
00257
经典分类：线性判别分析模型！

↑↑↑关注后”星标”Datawhale 每日干货 & 每月组队学习，不错过 Datawhale干货作者：小雨姑娘，康涅狄格大学，Datawhale…

人工智能 2023年7月2日
0088
数学建模—聚类(matlab、spss）K均值 Q型聚类 R型聚类

文章目录一、K均值二、Q型聚类三、R型聚类 聚类三种方&…

人工智能 2023年6月16日
0095
CVPR2022论文已全部开放下载！附链接

CVPR 的含金量不用我多说了吧，多少大佬想在上面发一篇然后直接起飞！所以跟踪最新的 CV 成果，对我来说，就是为了能够比较顺利应对产品的骚想法！对于科研一线的小伙伴来说，这些…

人工智能 2023年7月29日
00103
strict=False 但还是size mismatch for []: copying a param with shape [] from checkpoint,the shape in cur

我们知道通过 model.load_state_dict(state_dict, strict=False) 可以暂且忽略掉模型和参数文件中不匹配的参数，先将正常匹配的参数从文件中…

人工智能 2023年7月22日
0069
机器学习入门2–回归之线性回归及梯度下降

本系列博客基于温州大学黄海广博士的机器学习课程的笔记，小伙伴们想更详细学习黄博士课程请移步到黄博士的Github、或者机器学习初学者公众号，现在在中国慕课也是可以学习的，内容包括机…

人工智能 2023年6月17日
0077
设计模式学习（十五）：策略模式

设计模式学习（十五）：策略模式作者：Grey 原文地址：博客园：设计模式学习（十五）：策略模式 CSDN：设计模式学习（十五）：策略模式策略模式策略模式是一种行为型模式，…

人工智能 2023年6月27日
0073
深度学习笔记——现阶段的目标检测器结构解析（Neck[FPN,PANet,Bi-FPN],Head[rpn,yolo…]）

目录 1. 概述 2. 经典Neck的回顾 2.1 FPN(特征金字塔结构) 2.2 PANet 2.2.1 创建了自下而上的路径增强 2.2.2 Adaptive Feature…

人工智能 2023年7月9日
0093

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31