python数据分析开始
1、导入数据可以用pandas
data = pd.read_csv(“C:/Users/Administrator/Desktop/11/lianjia.csv”)
2、describe可以查看数据的信息
data.describe()
data.describe(include=[‘O’])
3、info可以查看全部列的信息
data.info()
4、可以用isnull查看是否有空值
python pandas判断缺失值一般采用 isnull(),然而生成的却是所有数据的true/false矩阵,下面写法会直接计算出现缺失值的个数
(data.isnull()).sum()
5、删除缺失值的方法
pandas有dropna的函数可以删除缺失值。下面文档链接有详细描述
pandas官方文档
data.dropna(how = ‘all’)
6、查看重复值
pandas 的duplicated可以查看,duplicated函数用于标记Series中的值、DataFrame中的记录行是否是重复,重复为True,不重复为False
pandas.DataFrame.duplicated(self, subset=None, keep=’first’)
Original: https://blog.csdn.net/weixin_39822629/article/details/112829402
Author: weixin_39822629
Title: python重复值删除的函数是_数据预处理查看重复值删除–python
原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/675143/
转载文章受原作者版权保护。转载请注明原作者出处!