如何1天内完成问卷调查分析报告（数据模型与决策课程作业）

2023年7月7日上午10:08 • 人工智能 • 阅读 96

背景：

有个朋友需要帮忙，急需在1天内完成4000+字的问卷调查分析报告，需要用到excel和python处理数据。

思路：

一、将电子版问卷调查数据导出成excel，先在excel对数据预处理；

二、搭建起分析报告框架。由于有分析报告范例，所以框架搭建比较简单，主要分为五部分，分别是：

①问卷概况；

②主观性问题分析；

③指标单因素分析；

④指标多因素交叉分析；

⑤差异显著性分析（假设检验、方差分析）；

⑥总结（略）。

PS：

①具体按问卷设计的部分进行细化，比如说指标单因素分析中可以分为受访人群社会属性统计部分（性别、年龄、学历、收入等）和问卷设计的针对性问题部分。

②在分析主观性问题前，需要用Cronbach’s α信度系数进行信度检验。

实操：

具体数据：

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import pylab as pl
file_path = 'raw_data_2.xlsx'
file_path_ = 'raw_data.xls'
data = pd.read_excel(file_path)
data_ = pd.read_excel(file_path_)

excel预处理的数据分为实际选项和选项序号两种，按需要使用。

指标单因素分析

def form_1(op_1,index_name):
    op_1_ = pd.DataFrame()
    op_1_.index.names=[index_name]
    op_1_['&#x8BA1;&#x6570;'] = op_1.iloc[:,0]
    op_1_['&#x767E;&#x5206;&#x6BD4;'] = op_1_['&#x8BA1;&#x6570;']/op_1_['&#x8BA1;&#x6570;'].sum()
    op_1_['&#x7D2F;&#x8BA1;&#x767E;&#x5206;&#x6BD4;'] = op_1_['&#x767E;&#x5206;&#x6BD4;'].cumsum()
    op_1_.loc['&#x5408;&#x8BA1;']= [op_1_.sum().iloc[0],op_1_.sum().iloc[1],' ']
    return op_1_

def pie_pic(data, title_name):
    pl.pie(data.iloc[:,0].tolist(),labels=data.index,autopct='%3.1f%%')
    pl.title(title_name)
    #pl.legend()
    pl.show()

op:output
op_1 = data.groupby([data.keys()[1]])[[data.keys()[1]]].count()

对单个指标进行统计及作图（仅计算频数）

指标多因素交叉分析

op_4 = data.pivot_table('&#x5E8F;&#x53F7;', index='index_1', columns='columns_1',margins=True, aggfunc='count')
op_4[np.isnan(op_4)] = 0
op_4

python的数据透视功能选择三个维度，分别是计算的维度，index维度，columns维度。

这里选择了”序号’、’index_1′, ‘index_2’。

由于计算的是频数，所以选择了计算’序号’，选择其他维度也是可以的，

‘index_1’和’columns_1’ 按选取研究的因素进行代入。

数据是频数。

op_4_ = pd.DataFrame(np.array(op_4).T/np.array(op_4.iloc[:,-1])).T
op_4_.index = op_4.index
op_4_.columns = op_4.columns
op_4_

把频数除以该行ALL（合计）得出百分数。

本来想在python话累积百分比柱状图，但是由于时间关系，就把数据导出csv，再在excel上画出来。

这里看出，不同年龄层对”是否”的选择有差异，但是否显著就要进行方差分析来进一步判断。

差异显著性分析（假设检验、方差分析）

同样地，由于时间关系，这里选择用excel筛选出数据，进行单因素方差分析。

筛选的时候可以单独把”年龄层”和”是否”两组数据取出来，把同一个年龄层的”是否”数据筛出来后再粘贴到另一个sheet。

注意，”是否”选择用”1″和”2″进行代替。

方差分析：单因素方差析

SUMMARY

组

观测数

求和

平均

方差

0-25岁

DIV/0!

25-30岁

1.51851852

0.25925926

31-35岁

1.21875

0.17641129

36-40岁

1.19230769

0.16153846

41-50岁

1.4

0.3

方差分析

差异源

P-value

F crit

组间

2.31028948

0.57757237

2.84682254

0.02870789

2.47773977

组内

17.4479523

0.20288317

总计

19.7582418

由于F>F crit，不同年龄层对”是否”的选择有显著性差异（α=0.05）。

主观性问题分析

data_cov = data_.iloc[:,13:23].cov()
data_cov

图没完全截完。

主观性问题也可以计算均值，因为选项一般为从”极不满意”到”非常满意”这种打分类型的。

以上。

Original: https://blog.csdn.net/weixin_41963050/article/details/122765465
Author: kkkkkkel
Title: 如何1天内完成问卷调查分析报告（数据模型与决策课程作业）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/676015/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

# 一点毕设小感悟（SnowNLP+可视化分析）

尝试采用Snow NLP进行情感分析写在前面之前用ROST CM6软件大致做了一个情感分析，但是还是觉得存在2方面的问题：①是ROST CM6自带的情感分析过于简单，②是ROS…

人工智能 2023年5月28日
0088
jetson nano安装jetson-inference记录

学习jetson nano需要安装jetson-inference推理程序。捣鼓了很久，才安装完成，主要是因为github网络问题导致的。我的操作步骤： mkdir worksp…

人工智能 2023年7月12日
0065
spyder无法打开，“点击无反应”

文章目录问题描述解决1 解决2 解决3 解决4 （终于解决了）写在前面：两年前下载anaconda的时候，用过一段时间的spyder，后来就没再使用了。现在有新的学习需求再次…

人工智能 2023年5月23日
00203
一个四位数，恰好等于去掉它的首位数字之后所剩的三位数的3倍，这个四位数是多少？

### 回答1：设n为abcd，则n的反序数为dcba。根据题意，有： 9n = dcba 将n和dcba分别表示出来： 9(abcd) = (dcba) 展开式子： 9000a…

人工智能 2023年6月28日
0091
python数据分析-concat合并表，报错InvalidIndexError: Reindexing only valid with uniquely valued Index objects

问题：在用concat函数给DataFrame做合并的时候抛出错误：InvalidIndexError: Reindexing only valid with uniquely v…

人工智能 2023年7月7日
0076
python数据分析库pandas官方教程

个人学习笔记方便查询来源：Getting started tutorials10个知识点： pandas库处理什么类型的数据怎么读取和存储数据如何选择DataFrame子集如…

人工智能 2023年7月6日
0072
【RuntimeError: CUDA error: device-side assert triggered】问题与解决

RuntimeError: CUDA error: device-side assert triggered 问题描述 * 解决思路 – 发现问题：总结问题描述当…

人工智能 2023年6月23日
00105
手把手教你用ELMo模型提取文本特征（附代码实现细节）

说明：本文是A Step-by-Step NLP Guide to Learn ELMo for Extracting Features from Text（Prateek Jos…

人工智能 2023年5月23日
00117
yolov5的detect.py代码详解

目标检测系列之yolov5的detect.py代码详解废话不多说，直接上代码啦！ YOLOv5 🚀 by Ultralytics, GPL-3.0 license "&…

人工智能 2023年6月16日
0065
从RRT到RRT*，再到Informed RRT*，路径规划算法怎么写

从RRT到RRT，再到Informed RRT，路径规划算法怎么写 1、RRT算法 * 1.1 假设 1.2 RRT算法步骤与实现 1.3 伪代码 2、RRT*算法 3、Infor…

人工智能 2023年6月10日
0096
mysql实现知识图谱_【NLP笔记】最简单的知识图谱问答

一篇简单的工程化笔记。数据首先，我们跳过知识图谱构建这个过程，直接用开源的中文数据集，知识图谱的构建够写个三天三夜里了，这里推荐一个中文知识图谱数据集，这个数据集非常大，数据也…

人工智能 2023年6月10日
00103
朴素贝叶斯（Naive Bayes）详解

朴素贝叶斯是贝叶斯分类器中的一种模型，用已知类别的数据集训练模型，从而实现对未知类别数据的类别判断。其理论基础是贝叶斯决策论（Bayesian decision theory）。 …

人工智能 2023年7月3日
00116
【CTA系列】复合中短周期双均线策略

所有策略的出场规则都摒弃了原本传统的信号反转出场，调整为盈亏比率达到固定比率的止盈止损出场，止盈：止损固定为 4：1。 2.SMA策略分析双均线策略已在第一部分有所介绍，具体进…

人工智能 2023年6月27日
0076
RDF、RDFS和OWL之间的关系

RDF是一种数据模型，定义了知识图谱的图结构，以主谓宾三元组的形式来进行表示。它是一个自底向上的、以数据驱动而形成的知识图谱。 RDF 有很多序列化的方法，主要有RDFS、OWL、…

人工智能 2023年6月10日
0087
【Java牛客刷题】入门篇（03）

🍎个人主页：亮点的博客🍊个人信条：理想如果不向现实做一点点屈服，那么理想也将归于尘土🍑刷题专栏：【Java】牛客网刷题🥭刷题网站：牛客网学习的一种有效途径就是刷题，丰富的做题经验…

人工智能 2023年5月30日
0068
强人工智能指人可能会被人工智能取代或者会被人工智能威胁

而所谓强人工智能指的是未来有一天我们的生活当中充斥着大量的人工智能人可能会被人工智能取代或者会被人工智能威胁等我觉得这些未来也许会出现但可能不是我们现阶段作为科研工作者去考虑的。 …

人工智能 2023年6月5日
00126

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31