文章目录
; 一、引言
CSDN 叶庭云: https://yetingyun.blog.csdn.net/
缩尾处理是一种处理离群值的方法,在公司金融、财务管理等微观领域应用非常广泛。
缩尾处理也是数据分析中经常会用到的一种处理方式。著名的一些商业化统计分析软件如 Stata、Matlab、SPSS 等都提供了缩尾处理函数,但这些软件都是收费的。本文介绍如何使用开源的、免费的 Python 库 SciPy 提供的缩尾处理函数对数据进行缩尾处理,简单实用。
二、何为缩尾处理?
将一组数据中 超出指定百分位数(像我们熟悉的上四分位数为 75%,下四分位数为 25%)的数据 使用该指定百分位数保留的临近数值替换,称为缩尾处理。下面举个简单的例子说明,帮助你更好理解缩尾处理,如下一组数据:
undefined
Original: https://blog.csdn.net/fyfugoyfa/article/details/125629280
Author: 叶庭云
Title: Python 数据处理 | 详解缩尾处理(winsorize)和代码实践
原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/693968/
转载文章受原作者版权保护。转载请注明原作者出处!