Pandas数据分析

什么是Pandas?

一个开源的Python类库:用于数据分析、数据处理、数据可视化

很方便和其他类库一起使用:
numpy:用于数学计算
scikit-learn:用于机器学习

Pandas数据分析

; 一、读取数据

读取csv文件

fpath=".....csv"

ratings=pd.read_csv(fpath)

ratings.head()

ratings.shape

ratings.columns

ratings.index

ratings.dtype

读取txt文件,自己指定分隔符、列名

fpath="....txt"
pvuv=pd.read_csv(
fpath,
sep='\t',
header=None,
names=['pdate','pv','uv']
)
pvuv

读取EXCEl文件

fpath="...xlsx"
pvuv=pd.read_excel(fpath)
pvuv

读取MySQL数据库

import pymysql
conn=pymysql.connect(
host='127.0.0.1',
user='root',
password='12345678',
database='test',
charset='utf8'
)
mysql_page=pd.read_sql("select * from crazyant_pvuv",con=conn)
mysql_page

二、Pandas数据结构

即DataFrame&Series
DataFrame:二维数据,整个表格,多行多列
Series:一维数据,一行或一列

仅有数据列表即可产生最简单的Series

import pandas as pd
import numpy as np
s1=pd.Series([1,'a',5.2,7])
s1
s1.index
s1.value

创建一个具有标签索引的Series

s2=pd.Series([1,'a',5.2,7],index=['d','b','a','c'])
s2
s2.index

使用Python字典创建Series

sdata={'Ohio':3500,.....}
s3=pd.Serires(sdata)
s3

根据标签索引查询数据

s2
s2['a']
type(s2['a'])
s2[['b','a']]
type(s2[['b','a']])

DataFrame

Pandas数据分析

; 根据多个字典序列创建dataframe

Pandas数据分析

查询多列,结果是一个pd.DataFrame

df[['year','pop']]
type(df[['year','pop']])

查询一行,结果是一个pd.Series

df.loc[1]
type(df.loc[1])

查询多行,结果是一个pd.DataFrame

df.loc[1:3]
type(df.loc[1:3])

三、Pandas数据查询

按数值、列表、区间、条件、函数五种方式查询

Pandas查询数据的几种方法

1、df.loc方法,根据行、列的标签值查询
2、df.iloc方法,根据行、列的数字位置查询
3、df.where
4、df.query

.loc既能查询,有能覆盖写入,强烈推荐!

Pandas数据分析

df.loc[:,"bWendu"]=df["bWEndu"].str.replace("℃","").astype('int32')
df.loc[:,"yWendu"]=df["yWEndu"].str.replace("℃","").astype('int32')

Pandas数据分析
Pandas数据分析
Pandas数据分析
Pandas数据分析
Pandas数据分析
Pandas数据分析
Pandas数据分析
Pandas数据分析
Pandas数据分析

Original: https://blog.csdn.net/qq_51408826/article/details/126815223
Author: 摩卡摩卡~
Title: Pandas数据分析

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/674989/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球