SAS学习笔记4
数据步是SAS系统用来对外部数据文件或其他数据库中的表数据或已经生成的数据集进行处理的过程,其目的是生成SAS能识别的数据。数据步处理完成后,生成的数据存储到逻辑库对应目录中,SAS其他模块或过程步调用数据步生成的数据,进行数据分析。无论是SAS/EM(数据挖掘模块)还是SAS/EG(报表开发模块)等,都是以数据为基础的。 SAS系统有两大步,称为数据步和过程步。所谓数据步就是一个动态处理数据的过程,处理数据的目的是生成SAS系统能识别的数据集,数据集默认扩展名为“.sas7dbat”。 数据步以“DATA”关键字为开始的标志,以“RUN”语句为结束标志,每个语句的结束符号为“;”。数据步可以一次创建多个数据集,数据集名之间以空格分隔。 下面介绍一个例子: 已知外部文件存储在“d:\test\xy.dat”的目录下,此数据集为人口普查数据集,请将此数据文件中北京和上海两个城市的数据放到一起,生成数据集名为bjsh,其他城市的人口数据信息生成数据集名为qita,数据集保存到“d:\test”目录下。 程序如下: LIBNAME xyy 'd:\test'; /*定义数据集存储物理路径的逻辑库*/ %let lj= 'd:\test\xy.dat'; /*外部数据文件的路径*/ Filename fil "(&lj)"; /*此语句指定定义逻辑文件名*/ DATA xyy.bjsh