- 什么是Pandas?
- 一、读取数据
* - 读取csv文件
- 读取txt文件,自己指定分隔符、列名
- 读取EXCEl文件
- 读取MySQL数据库
- 二、Pandas数据结构
* - 仅有数据列表即可产生最简单的Series
- 创建一个具有标签索引的Series
- 使用Python字典创建Series
- 根据标签索引查询数据
- DataFrame
- 根据多个字典序列创建dataframe
- 查询多列,结果是一个pd.DataFrame
- 查询一行,结果是一个pd.Series
- 查询多行,结果是一个pd.DataFrame
- 三、Pandas数据查询
* - Pandas查询数据的几种方法
什么是Pandas?
一个开源的Python类库:用于数据分析、数据处理、数据可视化
很方便和其他类库一起使用:
numpy:用于数学计算
scikit-learn:用于机器学习
; 一、读取数据
读取csv文件
fpath=".....csv"
ratings=pd.read_csv(fpath)
ratings.head()
ratings.shape
ratings.columns
ratings.index
ratings.dtype
读取txt文件,自己指定分隔符、列名
fpath="....txt"
pvuv=pd.read_csv(
fpath,
sep='\t',
header=None,
names=['pdate','pv','uv']
)
pvuv
读取EXCEl文件
fpath="...xlsx"
pvuv=pd.read_excel(fpath)
pvuv
读取MySQL数据库
import pymysql
conn=pymysql.connect(
host='127.0.0.1',
user='root',
password='12345678',
database='test',
charset='utf8'
)
mysql_page=pd.read_sql("select * from crazyant_pvuv",con=conn)
mysql_page
二、Pandas数据结构
即DataFrame&Series
DataFrame:二维数据,整个表格,多行多列
Series:一维数据,一行或一列
仅有数据列表即可产生最简单的Series
import pandas as pd
import numpy as np
s1=pd.Series([1,'a',5.2,7])
s1
s1.index
s1.value
创建一个具有标签索引的Series
s2=pd.Series([1,'a',5.2,7],index=['d','b','a','c'])
s2
s2.index
使用Python字典创建Series
sdata={'Ohio':3500,.....}
s3=pd.Serires(sdata)
s3
根据标签索引查询数据
s2
s2['a']
type(s2['a'])
s2[['b','a']]
type(s2[['b','a']])
DataFrame
; 根据多个字典序列创建dataframe
查询多列,结果是一个pd.DataFrame
df[['year','pop']]
type(df[['year','pop']])
查询一行,结果是一个pd.Series
df.loc[1]
type(df.loc[1])
查询多行,结果是一个pd.DataFrame
df.loc[1:3]
type(df.loc[1:3])
三、Pandas数据查询
按数值、列表、区间、条件、函数五种方式查询
Pandas查询数据的几种方法
1、df.loc方法,根据行、列的标签值查询
2、df.iloc方法,根据行、列的数字位置查询
3、df.where
4、df.query
.loc既能查询,有能覆盖写入,强烈推荐!
df.loc[:,"bWendu"]=df["bWEndu"].str.replace("℃","").astype('int32')
df.loc[:,"yWendu"]=df["yWEndu"].str.replace("℃","").astype('int32')
Original: https://blog.csdn.net/qq_51408826/article/details/126815223
Author: 摩卡摩卡~
Title: Pandas数据分析
原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/674989/
转载文章受原作者版权保护。转载请注明原作者出处!