医学健康数据分析与挖掘（一）—— R语言实战

2023年7月16日上午12:03 • 人工智能 • 阅读 57

1 实验简介

R简介及线性回归实验

熟悉 R 语言基本语法
利用 R 语言完成线性回归

2 实验内容

2.1 混合同余法

利用如下递推公式：
x n = ( a x n − 1 + c ) m o d m x_{n} = ( ax_{n-1} + c ) \ mod \ m x n =(a x n −1 +c )m o d m
用混合同余法产生，编写一个函数，并利用该函数计算：

如果 x 0 = 3 x_0 = 3 x 0 =3，x n = ( 5 n − 1 + 7 ) m o d 200 x_n = (5_{n-1} + 7 )\ mod \ 200 x n =(5 n −1 +7 )m o d 2 0 0。求 x 0 , x 1 , . . . , x 10 x_0, x_1, …, x_{10}x 0 ,x 1 ,…,x 1 0

基本思路

利用递推公式编写函数，依次代入 x n − 1 x_{n-1}x n −1 计算 x n x_{n}x n ，即可求得。

代码实现

实验结果

运行以上代码，我们可以得到 x 0 , x 1 , . . . , x 10 x_0, x_1, …, x_{10}x 0 ,x 1 ,…,x 1 0 ，如下图：

; 2.2 π \pi π 的估计

考虑服从 (0,1) 区间上均匀分布的独立的随机变量，因此,二维随机变量 (X,Y) 的联合概率密度为：

f ( x , y ) = { 1 , 0 < x < 1 , 0 < y < 1 0 , o t h e r w i s e f(x,y) = \begin{cases} 1, 0
则
P ( X 2 + Y 2 < = 1 ) = π 4 P(X^2 + Y^2

提示：产生均匀分布随机变量 runif()

基本思路

利用 runif() 函数生成 [0, 1] 上的均匀分布，计算满足公式 (3) 条件的点的频率，以此来估计 π 4 \frac{\pi}{4}4 π 的值

代码实现

distance

实验结果

我们运行以上代码，可得到结果

nf(n)1041003.3210003.08100003.14361000003.1473210000003.143336100000003.142091

我们可以看到，随着生成点数目的逐渐增加，π \pi π 的估计值逐渐向真实值靠近

2.3 线性回归实验

糖尿病数据：有10个标准化的变量，另外一个是因变量 y，建立合适的线性回归方程进行拟合。

基本思路

如题，将包括年龄，性别，bmi 等前 10 列变量视作是自变量，将最后一列 y 视作是因变量，利用 lm() 模块进行线性回归建模

代码实现

data

实验结果

运行以上代码，得到结果：

观察上述结果，我们可以发现：

残差项的中位数比较靠近 0，并且最大值最小值、1Q 与 3Q 的数值大小（绝对值）较为接近，说明残差分布较为对称、均匀，说明模型整体上较为充分的提取了自变量的信息。
拟合优度”和”修正的拟合优度”数值在 0.5 左右，说明回归方程对于数据的拟合程度较为一般
F 统计量为 46.27，p-value < 2.2e-16 << 0.05，说明模型十分显著
在细节方面，sex，bmi，map，ltg 因素对于 y 值的影响较为显著，其他变量的影响不那么显著。每一个变量系数的标注差较大，说明数据分布不太均匀
综合以上几点，我们可以推测，线性模型对于该数据的变量信息提取比较充分，但拟合能力较为有限。不能很好的刻画原始数据的分布，后续可采用变换对数据进行预处理或者采用更为复杂的模型对数据作进一步的拟合

至此，本次实验完成。

Original: https://blog.csdn.net/BrilliantAntonio/article/details/123510765
Author: 丶无尘
Title: 医学健康数据分析与挖掘（一）—— R语言实战

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/695318/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

图像隐写技术简介（理论版）

目录 1.加密与隐写加密技术与隐写术：加密与隐写是信息保护最常用的手段之一。加密中被保留的是加密文件，而隐写术中被保留的是秘密的存在载体，因此有学者认为隐写术比密码学更加安全。 …

人工智能 2023年6月22日
0069
Pandas表格美颜技巧

公众号：尤而小屋作者：Peter编辑：Peter 大家好，我是Peter~ 本文中主要介绍的是如何来美化Pandas的DataFrame的数据。主要是通过Pandas中的两个方法来…

人工智能 2023年7月8日
0073
Python Apex YOLO V5 6.2 目标检测全过程记录

博文目录文章目录效果展示工程源码环境准备第一阶段使用自带模型实现实时目标检测 * 屏幕截图封装详见 toolkit.py 中 Capture 类目标检测封装详见…

人工智能 2023年6月16日
00131
Pytorch中DataLoader和Dataset的基本用法

文章目录 DataLoader支持的两种数据集 Iterator格式的DataLoader * Python的Iterator格式数据简介 Pytorch使用DataLoader …

人工智能 2023年7月23日
00116
Spring Cloud Alibaba —— 服务注册与配置中心

🔎这里是【秒懂·云原生】，关注我学习云原生不迷路👍如果对你有帮助，给博主一个免费的点赞以示鼓励欢迎各位🔎点赞👍评论收藏⭐️ ; 👀专栏介绍【秒懂·云原生】目前主要更新微服务，一…

人工智能 2023年5月30日
0093
Obsidian之利用MaoXian获取网页信息

Using extension file to install MaoXian Web Clipper 起因：正在看一篇文章，认为写的相当不错：定制自己的CentOS，制作ISO…

人工智能 2023年6月28日
0088
Pycharm 搭建 Django 项目（非常详细）

目录 1. 安装需求 2. 准备工作 * 2.1 新建项目 2.2 输入相关配置 2.3 项目创建完成 2.4 查看安装 Django 版本 2.5 启动项目 2.6 解决一点小问…

人工智能 2023年7月3日
00107
k-means聚类算法及其优化

欢迎关注笔者的微信公众号在机器学习中有这样一种场景，需要对已知数据按照一定的关系归到不同的类别中（无监督） k-means是比较流行的聚类方法其基本算法流程如下：随机设置K个…

人工智能 2023年5月31日
0070
【点云处理技术之open3d】第一篇：open3d的快速安装、简介、文件的读写和可视化操作

文章目录 1. open3d简介、安装与测试 2. 读写点云数据并可视化 3. 读写网格(mesh)数据并可视化 4. 读写图像(rgbd)数据并可视化 open3d简介、安装与测…

人工智能 2023年7月5日
0067
【神经网络】一文带你轻松解析神经网络（附实例恶搞女友）

😊😊😊 欢迎来到本博客😊😊😊本次博客内容将讲解关于神经网络的相关知识🎉 作者简介：⭐️⭐️⭐️ 目前计算机研究生在读。主要研究方向是人工智能和群智能算法方向。目前熟悉python网…

人工智能 2023年7月6日
0059
autoware传感器融合相关内容整理

Autoware 感知融合 1. 为什么要融合不同传感器在不同条件下的性能对比图像分辨率高，携带丰富的边缘、语义信息，成本低；但是损失了深度信息，夜间环境会大大降低图像检测…

人工智能 2023年6月2日
0094
Canny边缘检测

; 边缘检测发展 Canny 边缘检测是一种从不同视觉对象中提取有用结构信息并显着减少要处理的数据量的技术。它已广泛应用于各种计算机视觉系统。 Canny 发现，在不同的视觉系统上…

人工智能 2023年7月6日
0072
Android音乐播放器悬浮窗功能，亲测可用

最近公司要开发一项语音播报新闻的功能。要求是： 1.语音播报时有一个悬浮窗，能滑动，退出当前页面后能继续播放； 2.松手后滑向靠近的边；于是我临时学了Window，WindowM…

人工智能 2023年5月27日
00115
Vue3 学习

vue3特性增加了setup语法糖，用来写组合api 这是大佬对于setup的讲解：莫问前程F6的vue3之setup的使用理解支持多个根节点，支持jsx 只引入所需要的Api…

人工智能 2023年6月28日
0088
AI实战：用Transformer建立数值时间序列预测模型开源代码汇总

Transformer是一个利用注意力机制来提高模型训练速度的模型。，trasnformer可以说是完全基于自注意力机制的一个深度学习模型，因为它适用于并行化计算，和它本身模型的复…

人工智能 2023年6月23日
0093
逻辑回归（对数几率回归）Logistic Regression

文章目录前言一、引入知识 * 1.样本特征（feature） 2.决策边界（Decision Boundary） 3.假设函数（hypothesis function） 4.损…

人工智能 2023年6月18日
0057

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

医学健康数据分析与挖掘（一）—— R语言实战

1 实验简介

2 实验内容

2.1 混合同余法

基本思路

代码实现

实验结果

; 2.2 π \pi π 的估计

基本思路

代码实现

实验结果

2.3 线性回归实验

基本思路

代码实现

实验结果

大家都在看