SAS中的PDV机制

2023年6月30日上午9:36 • 人工智能 • 阅读 82

在SAS中，我们使用DATA步来读入数据，DATA步在读入数据时实际上有两个阶段：
编译（compilation）
执行（execution）

过程如下：

在编译阶段中，逐个扫描语句，如果发现语法错误，SAS报错并终止运行；如果编译阶段中没有发现任何语法错误，进入执行阶段。
在执行过程中，DATA部读入第一条数据，在SAS中创建第一条观测；读入第二条数据，在SAS中创建第二条观测；读入第三条数据，在SAS中创建第三条观测……直至读入最后一条数据并在SAS中创建最后一条观测。我们可以把这个过程当做隐式循环（和DO,DO WHILE,DO UNTIL语句区分，它们是显示循环）。

可以用过下面的程序来看PDV的过程


data tes2t;

   put "&#x7B2C;" _n_ "&#x6B21;&#x8FD0;&#x884C;&#x4E4B;&#x524D;:"_all_;

   set sashelp.class;

   htm=height*2.54/100;  /*&#x8EAB;&#x9AD8;&#x8F6C;&#x6362;&#x4E3A;&#x7C73;*/

   wtkg=weight*0.454;    /*&#x4F53;&#x91CD;&#x8F6C;&#x6362;&#x4E3A;&#x516C;&#x65A4;*/

   put "&#x7B2C;" _n_ "&#x6B21;&#x8FD0;&#x884C;&#x4E4B;&#x540E;:" _all_;

run;

运行之后可以查看日志：

日志就是PDV的过程所示：

SAS在编译阶段会创建PDV（program data vector），PDV其实就是内存中的一块区域，日志中的第一行就是编译阶段编译的。在PDV中加入变量（读取数据集中的变量和新创建的变量）并且赋值缺失。
注意：在PDV中有两个自动变量，N_和_ERROR 。N =1表示正在创建第一条观测，N =2表示正在创建第二条观测，依次类推。
_ERROR_只有0和1两个取值，等于0表示在创建当前观测时未发现错误，等于1表示在创建当前观测时发现错误。
除了这两个自动变量外，若数据进行排序分类后还可自动产生first.和last.变量，当然PDV中还有输入数据集的变量和新创建的变量。
PDV中的变量按照先来后的原则决定了在PDV中变量的先后顺序位置
SAS进行执行阶段，每次循环开始时不是输入数据集读入的变量置为缺失，将输入数据集的观测直至循环完毕，继续执行数据步中的其他语句，当然数据步中的其他语句也可能会对PDV的数据进行修改，数据步的最后会将PDV里面的内容写入新生成的数据集中。

retain语句就是利用PDV的机制实现赋值功能的：
不使用RETAIN,INPUT在每次循环执行时会把PDV中的变量值清空，即置为（.）。
使用RETIAN,INPUT在每次循环执行时保留上一次PDV中的变量值。

Original: https://blog.csdn.net/fenghuanxia66/article/details/127826678
Author: 浪丫头
Title: SAS中的PDV机制

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/661067/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Python数据分析案例07——二手车估价（机器学习全流程，数据清洗、特征工程、模型选择、交叉验证、网格搜参、预测储存）

案例背景本次案例来自2021年matchcop大数据竞赛A题数据集。要预测二手车的价格。训练集3万条数据，测试集5千条。官方给了二手车的很多特征，有的是已知的，有的是匿名的。要求…

人工智能 2023年6月15日
0099
如何将CNN应用于视频分析和处理

人工智能 2024年1月1日
0046
训练好的YoloV5模型进行目标检测

接上一篇博客，本篇记录第一次训练的检测效果训练得到的最优模型在…\runs\train\exp6\weights\best.pt位置激活yolov5py38环境，进入…

人工智能 2023年7月9日
0059
COCO2017 数据集分类统计

文章目录 1. 前言 2. COCO 类别编号及名称 3. 类别数量统计代码 4. 统计结果前言最近用到 COCO2017 数据集做目标检测，顺便整理一下数据集。 COCO 数…

人工智能 2023年5月26日
0086
pyqt使用graphicsView显示图片

文章目录 * – 源码 – + untitled.py + main.py – 缩放图形界面使用Qt Designer绘制，如下菜单项添加一…

人工智能 2023年7月28日
0064
小程序分类功能的实现

微信小程序的分类功能思路实现思路 1.把屏幕当成&#x4E00…

人工智能 2023年7月3日
0092
ClickHouse 实现有序漏斗分析与数据可视化

Clickhouse 实现漏斗分析与数据可视化 1、前言 2、环境准备 * 2.1、测试表 2.2、插入伪造的样例数据 – 2.2.1、插入伪造的登录数据 2.2.2、…

人工智能 2023年6月11日
0081
在Ubuntu20.04运行VINS-Fusion

准备工作：虚拟机ubuntu：20.04ROS：Neotic Ubuntu20.04+ROS Noetic的安装与配置可以参考这篇文章，以下步骤在完成上述安装的基础上进行。一、…

人工智能 2023年5月26日
0089
规则引导的知识图谱联合嵌入方法

规则引导的知识图谱联合嵌入方法人工智能技术与咨询本文来自《计算机研究与发展》，作者姚思雨等摘要近年来，大量研究工作致力于知识图谱的嵌入学习，旨在将知识图谱中的实体与关系…

人工智能 2023年6月1日
0062
遗传算法【Python】

遗传算法概念基本思想：遗传算法(GA)是一种全局寻优搜索算法，它依据的是大自然生物进化过程中”适者生存”的规律。它首先对问题的可行解进行编码，组成染色体…

人工智能 2023年6月28日
00111
Win10下 anaconda3 + cuda11.3 + TensorFlow_GPU2.6.0 + Pytorch_GPU1.10.1

Win10 + CUDA11.3 + tf_GPU2.6.0 + pytorch_GPU1.10.1 软件版本 * TensorFlow_GPU Pytorch_GPU 第一步：安…

人工智能 2023年7月21日
0068
【图神经网络】图神经网络(GNN)学习笔记：GNN的应用简介

@TOC GNN的应用简述 GNN的适用范围非常广泛： 显式关联结&a…

人工智能 2023年7月12日
0077
Pytorch环境搭建

Pytorch环境搭建一、 Anaconda 安装 Anaconda 作用包括：构建虚拟环境和资源包管理。其下载安装可以参考链接https://pan.baidu.com/s/1…

人工智能 2023年7月20日
0078
6d位姿估计—制作自己的LINEMOD数据集过程记录(ObjectDatasetTools)

先说结论，ObjectDatasetTools不好用，开发了一个有效的方法，最后效果连接如下：有效的方法 Original: https://blog.csdn.net/weix…

人工智能 2023年5月26日
0084
【影像组学】影像组学特征筛选和降维（T检验+LASSO+PCA）

文章目录 1. T 检验 2. LASSO 特征筛选 3. T 检验结合 LASSO 实现影像组学特征筛选 4. 特征降维：主成分分析法 (PCA) T 检验三种 T 检验单样…

人工智能 2023年6月19日
00169
数据挖掘经典十大算法_条件熵、信息增益介绍

数据挖掘经典算法_条件熵、信息增益介绍一、条件熵首先与信息熵进行类比，从信息熵的计算公式中我们知道它是考虑到该随机变量的所有可能取值，即所有可能发生事件所带来信息量的期望。由此…

人工智能 2023年6月19日
0079

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

SAS中的PDV机制

大家都在看