Python 数据处理 | 详解缩尾处理(winsorize)和代码实践

文章目录

; 一、引言

CSDN 叶庭云: https://yetingyun.blog.csdn.net/

Python 数据处理 | 详解缩尾处理(winsorize)和代码实践

缩尾处理是一种处理离群值的方法,在公司金融、财务管理等微观领域应用非常广泛。

缩尾处理也是数据分析中经常会用到的一种处理方式。著名的一些商业化统计分析软件如 Stata、Matlab、SPSS 等都提供了缩尾处理函数,但这些软件都是收费的。本文介绍如何使用开源的、免费的 Python 库 SciPy 提供的缩尾处理函数对数据进行缩尾处理,简单实用。

二、何为缩尾处理?

将一组数据中 超出指定百分位数(像我们熟悉的上四分位数为 75%,下四分位数为 25%)的数据 使用该指定百分位数保留的临近数值替换,称为缩尾处理。下面举个简单的例子说明,帮助你更好理解缩尾处理,如下一组数据:

undefined

Original: https://blog.csdn.net/fyfugoyfa/article/details/125629280
Author: 叶庭云
Title: Python 数据处理 | 详解缩尾处理(winsorize)和代码实践

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/693968/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球