📜  串联SAS中的多个数据集(1)

📅  最后修改于: 2023-12-03 15:06:15.596000             🧑  作者: Mango

串联SAS中的多个数据集

在SAS中,我们可以使用DATASET语句来处理数据集。如果我们需要将多个数据集合并成一个数据集,需要用到SET语句的特殊用法。下面我们将介绍如何使用SET语句串联SAS中的多个数据集。

语法

下面是SET语句串联多个数据集的基本语法:

DATA outputdataset;
    SET inputdataset1 inputdataset2 ... inputdatasetn;
RUN;
  • outputdataset:合并后的输出数据集的名称。
  • inputdataset1 inputdataset2 ... inputdatasetn:要合并的所有数据集名称,用空格分隔。

合并后的数据集可以包含所有变量,并且在合并时,SAS会自动匹配相同名称的变量。如果有变量在多个数据集中,SAS会选择最后一个出现的值。

示例

下面是使用SET语句串联两个数据集的示例:

DATA combined;
    SET dataset1 dataset2;
RUN;

这将从dataset1dataset2中读取所有数据行,并将其组合成一个名为combined的新数据集。

效果

下面是通过SET语句组合两个数据集后的效果:

/* 创建第一个数据集 */
DATA dataset1;
    INPUT Name $ Score;
    DATALINES;
    Bob 80
    Alice 90
    John 75
    ;
RUN;

/* 创建第二个数据集 */
DATA dataset2;
    INPUT Name $ Score;
    DATALINES;
    Alice 95
    John 85
    Mike 65
    ;
RUN;

/* 串联两个数据集 */
DATA combined;
    SET dataset1 dataset2;
RUN;

/* 输出结果 */
PROC PRINT data=combined;
RUN;

输出:

Obs    Name    Score

 1     Bob     80
 2     Alice   95
 3     John    85
 4     Mike    65
结论

使用SET语句,我们可以轻松地将多个数据集合并为一个数据集。SAS会自动匹配变量名称,选择最后一个出现的值。