python怎么做彩票概率_50 个常见的 Python 数据分析小方法(上)

作为数据分析的初学者,我感受最深的就是很多时候我想分析处理下数据,无从下手,有的代码也不记得,查找使用方法又得花费时间,所以我整理了一份数据分析问答形式的专题,这里都是平时实战中常用到的,方便以后直接利用!

嘿嘿,进入正题!上题目~

Q1:查看数据相关信息?

df.info()#查看数据类型

df.shape#查看数据规模

df.describe()#数据统计信息描述

Q2:如何设置才能不隐藏DataFram的列?

pd.set_option(“max_columns”,100)#这里100可以调整:最大显示列数

pd.set_option(‘display.max_columns’,None)#这种是都显示

Q3:统计空值?

df.isnull().sum()

Q4:查看是否有重复值?

df.duplicated().any()

Q5:填充空值?

df.fillna(method=”ffill”)#这是前向方法填充,bfill为后向填充

df.fillna(0)#用0填充空值

Q6:删除列?

df.drop([“”],axis=1,inplace=True)

Q7:删除有空值的行?

df.dropna(axis=0,how=’any’,inplace=True)

Q8:删除重复值?

df.drop_duplicates(inplace=True)

Q9:排除特殊值的数据?

df=df[~df[“列名”].isin([‘这里写特殊值/错误值’])]

Q10:修改数据类型?

df[“”]=df[“”].astype(int)

Q11:重置索引?

df=df.reset_index(drop=True)

Q12:按照某一列降序重新排序?

m=df[”].sort_values(ascending=False).index[:].tolist()

df=df.loc[m]

df=df.reset_index(drop=True)

Q13:从某个指标上考虑分组?

s=df.groupby(“列”)[“指标列”].agg([“count”,”sum”,”mean”])

Q14:筛选出指标统计大于10的,以均值排序输出前十名?

s=s[s[“count”]>20]

s.sort_values(“mean”,ascending=False).head(10)

Q15:分组统计输出为DataFram,并且进行列重命名?

df=df.groupby(”,as_index=False).count[[”,”]]

df.rename(columns={‘原来的列名’:’新的列名’},inplace=True)

Q16:时间标准化?

data[‘时间’]=pd.to_datetime(data[‘时间’])

Q17:根据生日计算年龄?

df[‘age’]=(pd.to_datetime(‘这里是当前日期如:2020-4’)-pd.to_datetime(df[‘birthday’]))/pd.Timedelta(‘365days’)

Q18:分割字符串?(以斜杠为例)

t=df[“”].str.split(“\”,expand=True)

t[0]

Q19:切片分段?(以分数列为例)

cut_bins=np.arrange(90,130,5)#分段设置,这里是分成5段

bins=pd.cut(df[‘score’],cut_bins)#将数据切片

bin_counts=df[‘score’].groupby(bins).count()

Q20:统计列值?

df[”].value_counts()

Q21:列值对比可视化?

df[”].value_counts().plot(kind=”bar”)

Q22:查看相关性?

df.corr()

Q23:画散点图,看两个属性之间的关系?

df.plot.scatter(x=””,y=””,figsize=(,),title=””)

Q24:DataFram直接可视化?

fig=df[[”,”]].plot(kind=”kde”,figsize=(24,8),title=””)

fig.axes.title.set_size(10)

Q25:逻辑回归预测?

fromsklearn.linear_modelimportLogisticRegression

model=LogisticRegression()

X=df.drop([‘y’],axis=1)

y=df[‘y’]

model.fit(X,y)

y_pre=model.predict(test)

Original: https://blog.csdn.net/weixin_31720623/article/details/112838608
Author: 骆启明
Title: python怎么做彩票概率_50 个常见的 Python 数据分析小方法(上)

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/679044/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

  • opencv从入门到精通 哦吼08

    目录 腐蚀与膨胀 腐蚀 膨胀 开运算 形态学运算 梯度运算 顶帽运算 黑帽运算 小结 腐蚀与膨胀 腐蚀和膨胀是图像形态学中的两种核心操作,通过这两种操作可以清除或强化图像中的细节。…

    人工智能 2023年7月19日
    045
  • torch.nn.Parameter()函数的讲解和使用

    在学习SSD网络的时候发现源码里使用 nn.Parameter()这个函数,故对其进行了解。 1.1 语法 torch.nn.parameter.Parameter(data=No…

    人工智能 2023年6月23日
    0100
  • Prompt-Learning

    Prompt-Learning Prompt Learning(提示学习)是指对输入文本信息按照特定模板进行处理,把任务重构成一个更能充分利用预训练语言模型处理的形式。Prompt…

    人工智能 2023年7月1日
    066
  • NVIDIA支持CUDA的显卡选型简述

    ** NVIDIA支持CUDA的显卡选型简述 ** 目录 * – NVIDIA支持CUDA的显卡选型简述 – + 一、概述 + * 1、为什么选这三款 + …

    人工智能 2023年7月14日
    097
  • A股量化股票软件可以支持哪些分析功能?

    对于普通投资者来说,研究股票的时间和精力是有限的,很难像专业投资者那样有专门的时间研究股票投资,导致他们经常成被主力割韭菜的对象。幸运的是,随着技术的进步,越来越多的股票量化分析软…

    人工智能 2023年6月28日
    075
  • Transformer常见问题与回答总结

    Q&A Transformer为何使用多头注意力机制?(为什么不使用一个头) 多头保证了transformer可以注意到不同子空间的信息,捕捉到更加丰富的特征信息。可以类比…

    人工智能 2023年5月27日
    086
  • ChatGPT 是何方神圣?为什么这么猛?

    哈喽,大家好,我是木易巷! 本篇文章给大家介绍一下这个很猛的玩意:ChatGPT !!! 什么是ChatGPT ? 在12月初,人工智能实验室OpenAI发布了一款名为ChatGP…

    人工智能 2023年7月31日
    042
  • 机器学习笔记 – 什么是高斯混合模型(GMM)?

    1、高斯混合模型概述 高斯混合模型 (GMM) 是一种机器学习算法。它们用于根据概率分布将数据分类为不同的类别。高斯混合模型可用于许多不同的领域,包括金融、营销等等!这里要对高斯混…

    人工智能 2023年7月29日
    044
  • Keras模型保存

    这里写自定义目录标题 Keras模型保存的几个方法和它们的区别 * model.save() model.save_weights() model.to_json() model….

    人工智能 2023年6月25日
    061
  • OpenCv中计算图像像素最大值、最小值、均值和方差

    1、寻找图像像素的最大值最小值 寻找图像最大值最小值的函数 minMaxLoc()函数 minMaxLoc()函数原型 void cv::minMaxLoc(InputArray …

    人工智能 2023年5月26日
    089
  • 35道最新【软件测试】面试题,常见面试题及答案汇总

    前言 除了掌握扎实的专业技能之外,你还需要一份《软件测试面试宝典2022版》才能在万千面试者中杀出重围,成功拿下offer。 小编特意整理了35道测试必问必过面试题,送给大家,希望…

    人工智能 2023年6月27日
    063
  • YOLOv6:又快又准的目标检测框架开源啦

    近日,美团视觉智能部研发了一款致力于工业应用的目标检测框架 YOLOv6,能够同时专注于检测的精度和推理效率。在研发过程中,视觉智能部不断进行了探索和优化,同时吸取借鉴了学术界和工…

    人工智能 2023年5月26日
    063
  • YOLOv5的head详解

    YOLOv5的head详解 在前两篇文章中我们对YOLO的backbone和neck进行了详尽的解读,如果有小伙伴没看这里贴一下传送门:YOLOv5的Backbone设计YOLOv…

    人工智能 2023年7月25日
    067
  • 图神经网络入门(理论篇)

    图(Graph) 图结构是一种在我们日常生活中常见的结构,很多问题本质上都是图,比如复杂的分子结构以及社交网络等等。一般来说,图最核心的两个组成部分就是 节点(node) 和 边(…

    人工智能 2023年7月13日
    090
  • 演化博弈及Python实现

    目录 一、写在前面 二、演化博弈 三、模型构建 3.1博弈收益矩阵 3.2综合期望 3.3复制动态方程 3.4可能的均衡点 3.5局部稳定分析法 四、理论分析 4.1演化相位图 4…

    人工智能 2023年7月4日
    080
  • 遥感原理及图像处理–大作业|实践类–附代码!

    遥感原理及图像处理–大作业|实践类–附代码! 大家好,我是【 豆干花生】,这次我带来了 新的文章,与你分享~文章包含 代码实现,具体处理图片,敬请期待~ 文章目录 遥感原理及图像处…

    人工智能 2023年6月2日
    057
亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球