proc·univariate检验数据分布
proc univariate data=数据集名 <options>;
by 变量;
var 变量1,变量2…;
run;
proc univariate产生统计量以描述单个变量的分布,这些统计量包括均值、中位数、众数、标准差、偏度和峰度。
var语句指定一个或多个变量,若无该语句SAS会计算所有数值变量的统计量;
使用by语句是需要将by后面的变量进行proc sort排序不然log会报错;
options选项可写可不写,其可写的选项有plot或normal,normal选项进行正态测试,plot选项是画出数据的三个图(stem-and-leaf-plot、box-plot和normal probability plot),可以使用by语句来对单个组进行分析(前提是要先进性sort排序)。
proc means产生统计量
proc means data=数据集名 options;
by variable-list;
var variable-list;
output out=新数据集名 output-statistic-list;
run;
proc univariate与proc means的区别
由proc univariate产生的统计量,大部分都可以由proc means产生,前提是你要要求它产生。
proc univariate会默认打印所有的统计量,而用proc means你可以要求打印你需要的统计量。
OUTPUT在SAS数据集中用来储存描述性统计量。
/*proc univariate 检验数据分布*/
proc univariate data=sashelp.class;
var weight;
run;
data class;
set sashelp.class;
run;
proc sort data=class;
by sex;
run;
proc univariate data=class;
by sex;
var weight;
run;
proc univariate data=sashelp.class plot normal;
var weight;
run;
proc means data=sashelp.class n mean mode q1 median q3 p95 var std range cv skewness kurtosis;
var age weight;
run;
data class;
set sashelp.class;
run;
proc sort data=class;
by sex;
run;
proc means data=class n mean mode q1 median q3 p95 var std range cv skewness kurtosis;
by sex;
var age weight;
output out=staclass;
run;