学习笔记 Day 26 (pandas)

Series:

创建一个一维的数组

通过列表创建:

import pandas as pd

df = pd.Series([3,4,2,6,1,5],index=list('abcdef'))

print(df)

结果:

学习笔记 Day 26 (pandas)

通过字典创建:

import pandas as pd

temp_dict = {'hello':1,'world':2}

df = pd.Series(temp_dict)

print(df)

结果:

学习笔记 Day 26 (pandas)

取不连续的索引:

df[[‘hello’,’world’]]

得到 1,2

Series对象本质上由两个数组构成,一个数组构成的对象的键(index,索引),一个数组构成的对象的值(values),键 -> 值/

Series中的where用法(和numpy中不一样):

import pandas as pd

s= pd.Series(range(5))

print(s.where(s>0))

结果:

学习笔记 Day 26 (pandas)

满足条件的正常显示,不满足的显示nan.

import pandas as pd

s= pd.Series(range(5))

print(s.where(s>1,10))

结果:

学习笔记 Day 26 (pandas)

满足条件,正常返回,否则等于10

DataFrame:

二位数组,series容器

不但有行索引,还有列索引(axis=1,列索引(columns),否则为行索引(index))

import pandas as pd
import  numpy as np

df = pd.DataFrame(np.arange(12).reshape(3,4),index=list('abc'),columns=list('wyzs'))

print(df)

字典创建DataFrame:

import pandas as pd

dict = {'name':[1,2,3],'age':[21,34,14]}

df = pd.DataFrame(dict)

print(df)

结果:

学习笔记 Day 26 (pandas)

通过列表创建:

import pandas as pd

list = [{'name':1,age:23},{name:2,age:32},{name:3,age:43}]
name和age要加""号,我忘记了

df = pd.DataFrame(list)

print(df)

结果:

学习笔记 Day 26 (pandas)

DataFrame基础属性和查询:

学习笔记 Day 26 (pandas)

DataFrame中的排序方法:


df.sort_values(by='列名',ascending=True) # ascending 排序方法(默认升序)

DataFrame的索引:

DataFrame取行和取列的注意点,

1 方括号写数组,表示行索引,取行数据

2 放括号写字符串,表示列索引,去列数据

df.loc () # 通过标签获取数据,df.iloc() # 通过位置获取数据

布尔索引:

学习笔记 Day 26 (pandas)

tolist() 可将Series转化成列表.

缺失数据处理:

pd.isnull(df) # 判断是否有nan,有返回True

pd.notnull(df) # 判断是否有nan,有返回False

df.dropna(axis=0,how=’any’) # 只要有就删除

df.dropna(axis=0,how=’all’) # 一行全为nan就删除

df.dropna(axis=0,how=’all’,inplace=True) # inplace 是否替换

df.fillna(100) # 把df中的nan值填充成100

df.fillna(df[‘某一列’].mean()) # 一般填充平均值

df[df == 0] = np.nan # 处理为0 的数据(必须要确定当前这个零表示的是数据缺失才能这样处理)

Original: https://blog.csdn.net/a_Loki/article/details/122537992
Author: a_Loki
Title: 学习笔记 Day 26 (pandas)

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/754827/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

  • Vue+Django前后端实例1

    后端: python manage.py startapp block 创建APP,并在settings的INSATLLED_APP中添加’block’。 …

    Python 2023年8月5日
    048
  • Pandas条件筛选 | Python技能树征题

    相关知识 筛选是数据处理中非常频繁使用的功能,而Pandas对表格型数据( Pandas.DataFrame)已经封装了非常完善的条件筛选功能,他们支持下面五种比较运算符和两种逻辑…

    Python 2023年8月8日
    045
  • 深入理解Pandas的groupby函数

    目录 序 一、基本用法 二、参数源码探析 * 入参 – by axis level as_index sort group_keys squeeze observed …

    Python 2023年8月21日
    041
  • Python数据分析 第一章 数据分析的概述

    第一章 数据分析的概述 1.数据分析的概述 1.Python在数据分析方面的优势 2.数据分析流程 3.数据分析层次 4.数据分析常见应用场景 2. Python数据分析模块 1….

    Python 2023年8月28日
    043
  • scrapy 两类item_在scrapy中嵌套Item数据的正确方法

    评论更新:看起来 nested loaders是更新的方法.另一条评论表明这种方法会在序列化过程中导致错误. 解决这个问题的最佳方法是创建一个main项和一个元项类/加载器. fr…

    Python 2023年10月3日
    037
  • python乒乓球游戏

    import sysimport cfgimport pygamefrom modules import * ”’定义按钮”’def…

    Python 2023年9月25日
    029
  • 未来十年的Python前景会是什么样的?

    看了一些文章的答案,我觉得的没有一答案是真正的站在10年后角度来讨论这个问题的,讨论的其实都是现在python的现状或问题,我觉得讨论这种问题时,我们一方面要理性分析,另一方面一定…

    Python 2023年7月31日
    043
  • python爬虫 scrapy框架

    scrapy框架 scrapy是一个为了爬取网站数据,提取结构性数据而编写的应用框架。它使用,Twisted这个异步网络库来处理网络通信,架构清晰,并且包含了各种中间件接口,可以灵…

    Python 2023年10月5日
    041
  • Python Flask-RESTPlus 工程化实践

    本指南将逐步介绍构建用于测试、开发和生产环境的 Flask RESTPlus Web 应用程序的方法。 将使用基于 Linux 的操作系统(Ubuntu),但是大多数步骤都可以在 …

    Python 2023年8月13日
    068
  • Matplotlib光速入门-从安装到绘图实战

    文章目录 简介 安装 实战 * 画框 线图 散点图 柱状图 饼状图 等高线图 前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。点击跳转到网站。 ;…

    Python 2023年9月3日
    057
  • 【java】java预备知识–流的有关用法

    1.写在前面 这篇文章最多只能算是一点笔记,持续更新,而且有一些细枝末节的地方可能注意不到,仅限于应用,会长期进行更新,还望大佬能指点一二 这里顺便整理一下会遇到的点: 1.关于r…

    Python 2023年9月29日
    025
  • vivo大数据日志采集Agent设计实践

    作者:vivo 互联网存储技术团队- Qiu Sidi 在企业大数据体系建设过程中,数据采集是其中的首要环节。然而,当前行业内的相关开源数据采集组件,并无法满足企业大规模数据采集的…

    Python 2023年10月14日
    039
  • 精选23个pandas常用函数

    公众号:尤而小屋作者:Peter编辑:Peter 大家好,我是Peter~ 从26个字母中精选出23个Pandas常用的函数,将它们的使用方法介绍给大家。其中o、y、z没有相应的函…

    Python 2023年8月16日
    059
  • 【Datawhale】动手学数据分析

    动手学数据分析 第一章:数据载入及初步观察 载入数据 任务一:导入numpy和pandas import numpy as np import pandas as pd 任务二:载…

    Python 2023年10月30日
    035
  • gunicorn 超时报错:[1] [CRITICAL] WORKER TIMEOUT 解决

    一. 问题描述 在使用 Gunicorn + flask 搭建的一个 web 项目中,由于使用了机器学习模型,在第一次请求接口的时候需要加载模型,在本地运行的时候加载模型很快所以正…

    Python 2023年8月9日
    067
  • 利用Python进行数据分析(四):数据加载、存储与文件格式

    标题利用Python进行数据分析(四):数据加载、存储与文件格式 学习笔记来源于:简书https://www.jianshu.com/p/047d8c1c7e14 输入输出通常可以…

    Python 2023年8月21日
    057
亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球