Python Pandas读取文件和DataFrame、Series的基本使用

1.读取文件和数据属性的基本查看方法

数据类型读取方法csv,tsv,txtpd.read_csv(filepath)excelpd.read_excel(filepath)mysqlpd.read_sql(filepath)

注意,读取mysql时,要先进行sql连接

import pymysql
conn = pymysql.connect(
    host="127.0.0.1"
    user="root"
    password="123456"
    database="data_info"
    charset="utf8"
    )
mysql_info=pd.read_sql("select * from information",con=conn)

其他一些查看表属性的基本操作

improt pandas as pd
filepath="./information.txt"
info = pd.read_csv(filepath,sep=",",header=None,names=["column_A","column_B","column_C"],skiprows=2)

info.head()
info.shape
info.columns
info.index

2.DataFrame和Series

Python Pandas读取文件和DataFrame、Series的基本使用
如上图,一整张表就是一个DataFrame,即DataFrame是一个二维数组。PV一整列就称为是一个Series,2019/9/3的一整行数据也称为一个Series,即Series是一个一维数组。

; 一.Series

(1)创建Series


s1 = pd.Series([1, 2, 3, 4])

s2  = pd.Series(np.arange(7))

s3 = pd.Series({'one':1, 'two':2, 'three':3})

(2)Series的常用操作

Python Pandas读取文件和DataFrame、Series的基本使用

例如s3是上面的一组Series数据,其中第一列表示索引,第二列是数据值

"""方式二(推荐)"""
s3.loc["java"]
s3.loc["c","python"]
s3.loc[0]
s3.loc["php":"h5"]

二.DataFrame

(1)创建DataFrame


fruits_dict = { 'Fruits':['Apple','Banana','Cherry','Dates','Eggfruit'],
                'Quantity': [5, 10, 8, 3, 7],
               }

pd.DataFrame(data=[['Apple',5],
                   ['Banana',10],
                   ['Cherry',8],
                   ['Dates',3],
                   ['Eggfruit',7]],
             columns = ['Fruits','Quantity'],
             index=[1,2,3,4,5])

Python Pandas读取文件和DataFrame、Series的基本使用

(2)设置索引

Python Pandas读取文件和DataFrame、Series的基本使用
例如s3是上面的一个文件数据,行默认是按照0-4进行索引,若要设置成按照ymd属性的值进行索引,表示如下:
info.set_index("ymd",inplace=True,drop=True)

(3)替换操作


s3.loc[:,"bWendu"] = s3["bWendu"].str.replace("℃","").astype("int32")
s3.loc[:,"yWendu"] = s3["yWendu"].str.replace("℃","").astype("int32")

Python Pandas读取文件和DataFrame、Series的基本使用

(3)常用操作


s3.loc["2018-01-03","bWendu"]

s3.loc["2018-01-03",["bWendu","yWendu"]]

s3.loc[["2018-01-03","2018-01-04"],"bWendu"]

s3.loc[["2018-01-03","2018-01-05"],["bWendu","yWendu"]

s3.loc[s3["yWendu"]<10,:]

s3.loc[lambda s3:(s3["bWendu"]30) &&(s3["yWendu"]>=10),: ]

Original: https://blog.csdn.net/weixin_48826751/article/details/123762097
Author: weixin_48826751
Title: Python Pandas读取文件和DataFrame、Series的基本使用

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/753841/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球