python怎么做彩票概率_50 个常见的 Python 数据分析小方法(上)

作为数据分析的初学者,我感受最深的就是很多时候我想分析处理下数据,无从下手,有的代码也不记得,查找使用方法又得花费时间,所以我整理了一份数据分析问答形式的专题,这里都是平时实战中常用到的,方便以后直接利用!

嘿嘿,进入正题!上题目~

Q1:查看数据相关信息?

df.info()#查看数据类型

df.shape#查看数据规模

df.describe()#数据统计信息描述

Q2:如何设置才能不隐藏DataFram的列?

pd.set_option(“max_columns”,100)#这里100可以调整:最大显示列数

pd.set_option(‘display.max_columns’,None)#这种是都显示

Q3:统计空值?

df.isnull().sum()

Q4:查看是否有重复值?

df.duplicated().any()

Q5:填充空值?

df.fillna(method=”ffill”)#这是前向方法填充,bfill为后向填充

df.fillna(0)#用0填充空值

Q6:删除列?

df.drop([“”],axis=1,inplace=True)

Q7:删除有空值的行?

df.dropna(axis=0,how=’any’,inplace=True)

Q8:删除重复值?

df.drop_duplicates(inplace=True)

Q9:排除特殊值的数据?

df=df[~df[“列名”].isin([‘这里写特殊值/错误值’])]

Q10:修改数据类型?

df[“”]=df[“”].astype(int)

Q11:重置索引?

df=df.reset_index(drop=True)

Q12:按照某一列降序重新排序?

m=df[”].sort_values(ascending=False).index[:].tolist()

df=df.loc[m]

df=df.reset_index(drop=True)

Q13:从某个指标上考虑分组?

s=df.groupby(“列”)[“指标列”].agg([“count”,”sum”,”mean”])

Q14:筛选出指标统计大于10的,以均值排序输出前十名?

s=s[s[“count”]>20]

s.sort_values(“mean”,ascending=False).head(10)

Q15:分组统计输出为DataFram,并且进行列重命名?

df=df.groupby(”,as_index=False).count[[”,”]]

df.rename(columns={‘原来的列名’:’新的列名’},inplace=True)

Q16:时间标准化?

data[‘时间’]=pd.to_datetime(data[‘时间’])

Q17:根据生日计算年龄?

df[‘age’]=(pd.to_datetime(‘这里是当前日期如:2020-4’)-pd.to_datetime(df[‘birthday’]))/pd.Timedelta(‘365days’)

Q18:分割字符串?(以斜杠为例)

t=df[“”].str.split(“\”,expand=True)

t[0]

Q19:切片分段?(以分数列为例)

cut_bins=np.arrange(90,130,5)#分段设置,这里是分成5段

bins=pd.cut(df[‘score’],cut_bins)#将数据切片

bin_counts=df[‘score’].groupby(bins).count()

Q20:统计列值?

df[”].value_counts()

Q21:列值对比可视化?

df[”].value_counts().plot(kind=”bar”)

Q22:查看相关性?

df.corr()

Q23:画散点图,看两个属性之间的关系?

df.plot.scatter(x=””,y=””,figsize=(,),title=””)

Q24:DataFram直接可视化?

fig=df[[”,”]].plot(kind=”kde”,figsize=(24,8),title=””)

fig.axes.title.set_size(10)

Q25:逻辑回归预测?

fromsklearn.linear_modelimportLogisticRegression

model=LogisticRegression()

X=df.drop([‘y’],axis=1)

y=df[‘y’]

model.fit(X,y)

y_pre=model.predict(test)

Original: https://blog.csdn.net/weixin_31720623/article/details/112838608
Author: 骆启明
Title: python怎么做彩票概率_50 个常见的 Python 数据分析小方法(上)

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/741766/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

  • 我做了第一个ChatGPT .net api聊天库

    最近这个ChatGPT很火啊,看了B站上很多视频,自己非常手痒,高低自己得整一个啊,但是让我很难受的是,翻遍了github前十页,竟然没有一个C#的ChatGPT项目,我好难受啊!…

    Python 2023年10月12日
    056
  • 基于python Pygame的飞机大战游戏开发

    基于python Pygame的飞机大战游戏开发 文章目录 基于python Pygame的飞机大战游戏开发 * 一、项目介绍 – 1.1 简介 1.2 所用到的知识点…

    Python 2023年9月21日
    050
  • 第四节、Numpy基础知识

    一、Numpy读取TXT文本 import numpy as np genfromtxt读取Txt文本,分隔符逗号,读取数据为str类型 world_alcohol = np.ge…

    Python 2023年8月25日
    039
  • 『Python』pytest 单元测试迅速上手 (for Pycharm)

    背景介绍进行项目交付之前,甲方通常需要开发者保证项目代码的测试覆盖率达到某个值,为此我们需要为项目中的代码编写相应的单元测试,然后把代码提交到 C I CI C I 工具,运行 p…

    Python 2023年9月12日
    058
  • Python每日一练——第1天:水仙花数

    前言📢📢 Python每日一练来啦,本文已收录于:《Python每日一练》专栏 此专栏目的在于,帮忙学习Python的小白提高编程能力,训练逻辑思维,每周持续更新中,欢迎免费订阅!…

    Python 2023年8月2日
    053
  • python csv 中文乱码_从零开始学Python(3) —–用Jupyter可视化显示CSV文件内容

    在上一次学习中,我向大家展示了如何安装Jupyter笔记本,以及利用它来编写Python代码并立即执行的方法。今天,就让我们来挑战一下用Jupyter笔记本来读取CSV文件,并且可…

    Python 2023年8月7日
    052
  • Pytest框架–自动化脚本如何切换测试环境

    文章目录 前言 一、pytest-base-url插件 * 1、安装插件 二、pytest-base-url使用 * 1、控制台指定base_url 2、pytest.ini文件指…

    Python 2023年9月11日
    048
  • Python测试框架pytest(18)命令行参数

    目录 1、parser.addoption()添加参数 1.1、conftest配置参数 1.2、带参数启动 2、–tb 2.1、–tb=auto 2.2、…

    Python 2023年9月10日
    052
  • 后台管理系统—-day04

    目录 用户登录 * 1 JWT使用 – 1.1 JWT介绍 1.2 djangorestframework-jwt使用 1.3 增加管理员登录功能 2 短信验证码 3 …

    Python 2023年8月4日
    052
  • Linux–多线程(二)

    基本概念 概述:现在操作系统基本都是多任务的操作系统,同时有大量可以调度的实体在运行。在多任务操作系统当中,同时运行的多个任务可能: 都需要访问/使用同一种资源 多个任务之间有依赖…

    Python 2023年10月17日
    046
  • 统信UOS安装Anaconda使用jupyternotebook

    适用于UOS V20,非互联网环境(下载除外)个人单机使用,满足需求的最最基础操作。 (一)下载安装Anaconda 参考网上的文章,从清华开源镜像站下载了Anaconda3-20…

    Python 2023年9月8日
    097
  • NLP 自然语言处理实战

    前言 自然语言处理 ( Natural Language Processing, NLP) 是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行…

    Python 2023年10月26日
    063
  • 【脚本项目源码】Python制作提升成功率90%的表白神器

    前言 今天子川就给大家带来就是的利用Python制作表白神器,让这个寒冷的冬天变得格外温馨,到了年底依然能热情拥抱,也见证了两人情意如昔;记得发给自己的心仪对象,废话不多说直接开整…

    Python 2023年10月30日
    054
  • Python的条件锁与事件共享

    Python的条件锁与事件共享 原创 信息所话事人2022-08-08 17:06:20博主文章分类:Python ©著作权 文章标签 消息机制 生产者消费者 模版 文章分类 Py…

    Python 2023年5月24日
    057
  • pandas数据分析给力教程【完整版】(七)

    Series和DataFrame都有一个用于生成各类图表的plot方法。默认情况下,它们所生成的是线形图 线形图 简单的Series图表示例,plot() import numpy…

    Python 2023年9月5日
    044
  • python学习:枚举定义和使用

    在某些情况下,一个类的对象是有限且固定的,比如季节类,它只有 4 个对象;再比如行星类,目前只有 8 个对象。这种实例有限且固定的类,在 Python 中被称为枚举类。程序有两种方…

    Python 2023年10月31日
    033
亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球