python数据分析（一）：列联分析与方差分析

2023年7月15日下午7:32 • 人工智能 • 阅读 75

列联分析

收集样本数据产生二维或多维交叉列联表；
对两个分类变量的相关性进行检验（假设检验）

pandas.crosstab(index,columns,margins,normalize)

margins默认为False不带合计数据
normalize=True频率列联表

salary_reform.scv

结果为列联表

补充的内容

列联表的期望分布

根据比例求出的各个变量的期望值

RT为给定单元所在行的合计，CT为给定单元所在列的合计，n为样本量

卡方检验

当样本量较大时，上述统计量服从自由度为(r-1)(c-1)的卡方分布
用于衡量实际值与理论值的差异程度（有差异表示自变量对因变量有影响）
返回值：统计量，p值，自由度
p值：可以理解为落在极端值上的概率
计算方法：已知统计量的值，求对应卡方分布的概率，过大则拒绝原假设（独立）

课堂练习一

作列联表

期望值分析

卡方检验

结果分析：p值较小，说明race对于工资水平的影响不显著

方差分析

比较多个总体的均值是否相等；
研究一个或多个分类型自变量与一个数值型因变量的关系；

假设：
（1）每个总体都应服从正态分布（如何检验样本是否服从正态分布？）；
（2）各个总体的方差必须相同；
（3）观测值是独立的

单因素方差分析

方差齐性检验levene

H0:

, H1:

不全相等（自变量对因变量有显著影响）

构建统计量F检验
SST：总平方和；SSA：组间平方和；SSE：组内平方和

；

若原假设成立，则表明没有系统误差，组间方差MSA与组内方差MSE的比值不会太大，F>Fa，拒绝原假设

方差来源分析及检验过程anova_lm()

运算符

说明

将运算符左右两边的数据都纳入生成的数据集中

–

将运算符左边的纳入，右边的移除

计算运算符两边的交集（交互效应），生成一列数据

a+b+a:b形式的简写

关系强度的测量

组间误差占总误差比例越高，相关度越高

多重比较

通过对总体均值之间的两两比较来检验哪些均值之间存在差异

LSD检验

已知总体方差的联合估计量

组内方差

k = 2时，

构造统计量：

若

，认为差异是显著的，拒绝原假设。

HSD检验

基于学生化极差的成对比较。

计算HSD统计量，如果两组均数的差异大于该极差，认为差异是显著的，拒绝原假设。

HSD检验较LSD检验更保守，更不易发现显著差异，一般用于样本容量相同的组之间的均值比较

多因素方差分析

不存在交互效应的多因素方差分析

tv.csv

结果解释：”品牌”的p值过小，拒绝”品牌”的原假设，可认为品牌对销售量有显著影响。

存在交互效应的多因素方差分析

traffic.csv

结果解释：路段对通行时间有显著影响；时段对通行时间有显著影响；没有证据表明路段和时段的交互作用对通行时间有显著影响。

Original: https://blog.csdn.net/weixin_56631477/article/details/124732817
Author: Kentos(acoustic ver.)
Title: python数据分析（一）：列联分析与方差分析

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/694918/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

经典论文阅读densenet(Densely Connected Convolutional Networks)

最近的工作表明，如果卷积网络在靠近输入的层和靠近输出的层之间包含较短的连接，则它们可以更深入，更准确和有效地进行训练。具有L层的传统卷积网络具有L个连接-每个层及其后续层之间有一…

人工智能 2023年6月29日
0087
半监督学习算法中的标记传播是什么

问题：半监督学习算法中的标记传播是什么？详细介绍在机器学习中，我们通常有两种类型的学习：监督学习和无监督学习。在监督学习中，我们有大量带有标签的数据，用于训练一个模型来预测未标…

人工智能 2024年1月1日
0026
Python安装第三方库常用方法超详细~

Python安装第三方库常用方法前言安装方法 * 1. 通过pychram安装 2. pip安装大法 3. 下载whl文件到本地离线安装 – 3.1 补充 4.其他…

人工智能 2023年7月3日
0057
UserWarning:NVIDIA GeForce RTX 3060 Laptop GPU with CUDA capability sm_86 is not compatible with th

今天打算学习一下简单的深度学习模型，然后在网上找了一段简单的代码找的代码网站如下：Pytorch实战1：LeNet手写数字识别 (MNIST数据集)_sunqiande88的博客…

人工智能 2023年7月21日
0068
FPN网络详解

1 特征金字塔特征金字塔(Feature Pyramid Networks， FPN)的基本思想是通过构造一系列不同尺度的图像或特征图进行模型训练和测试，目的是提升检测算法对…

人工智能 2023年7月25日
0062
回归预测基于ELMAN递归神经网络预测及其matlab代码实现

文章目录 1. ELMAN神经网络的简介和算法描述 * 1.1 Elman网络介绍 1.2 Elman结构组成 1.3 ELMAN训练界面的参数解读 2. 建立ELMAN神经网络的…

人工智能 2023年6月16日
0074
硬核，你见过机器人玩“密室逃脱”吗？(附代码)

目录 0 专栏介绍 1 什么是路径规划？ 2 栅格建模：构造密室 3 发布首末位置 4 执行路径规划 5 演示测试 ; 0 专栏介绍 🔥附C++/Python/Matlab全套代码…

人工智能 2023年7月26日
0096
Wireshark零基础使用教程（超详细）

「作者主页」：士别三日wyx「作者简介」：CSDN top100、阿里云博客专家、华为云享专家、网络安全领域优质创作者「专栏简介」：此文章已录入专栏《网络安全快速入门》 Wires…

人工智能 2023年6月2日
00113
FileChannel 文件流的简单使用

FileChannel 注意: FileChannel 只能工&amp…

人工智能 2023年6月27日
0084
笔记2：yolov5训练自己的目标检测模型_创建并划分数据集，训练及检测

有需要可以在评论区留下联系一起交流。目标检测—数据集格式转化及训练集和验证集划分_didiaopao的博客-CSDN博客 1、我们经常从网上获取一些目标检测的数据集…

人工智能 2023年7月10日
0068
基于LBP的图像特征提取并PCA降维后的分类研究

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年7月1日
0074
Python每日一练—–打家劫舍

⛅ （day13） 🖍题目：题目分析：解题思路： 🌈动态规划解法 🌈代码注释 🌈优化假设你是一个专业的小偷，计划偷窃沿街的房屋。每间房内都藏有一定的现金，影响你偷窃的唯一制约…

人工智能 2023年6月17日
0075
简单总结LEGO-LOAM相对于LOAM的一些改进及不同点

一. 地面点的提取 1.动机：在LEGO-LOAM的实验数据中，有地面都是草坪的情况。对于这种地面，如果直接用LOAM，那么就会有一些边缘特征点落在草地上（因为草地的参差），这是拉…

人工智能 2023年5月31日
0056
报错与解决 | AttributeError: ‘Series‘ object has no attribute ‘set_value‘

文章目录代码简要介绍报错修改方法太不容易了！不断debug，终于调通了！分享一下解决这个问题的办法。代码简要介绍 创建Seri…

人工智能 2023年7月4日
0072
pytorch如何查看显存利用情况

最近搞LSTM优化，但是显存利用率不稳定，想看一下LSTM的显存占用情况，搜罗了一通，发现一个不错的开源工具，记录分享一下。首先上项目地址：https://github.com/…

人工智能 2023年7月21日
0065
基于深度学习的对联自动生成系统

1.项目目标设计一个基于深度学习的对联生成系统。最终结果可以是一个简单的界面，在界面中，我输入一句上联，通过点击相应按钮，系统生成相应下联并显示出来。 2.国内外相关工作对联是…

人工智能 2023年5月30日
0064

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

python数据分析（一）：列联分析与方差分析

pandas.crosstab(index,columns,margins,normalize)

列联表的期望分布

卡方检验

课堂练习一

作列联表

期望值分析

卡方检验

单因素方差分析

方差齐性检验levene

方差来源分析及检验过程anova_lm()

关系强度的测量

多重比较

多因素方差分析

不存在交互效应的多因素方差分析

存在交互效应的多因素方差分析

大家都在看