信息化应用 营销管理 企业管理 业界消息 站内搜索 标签
首页 » 文档中心 » 信息化软件应用 » BI 商务智能 » 用SAS/GRAPH模块绘制常用统计图的法(zt)

用SAS/GRAPH模块绘制常用统计图的法(zt)

2008-04-15
关于统计图的概念、作用和选用统计图的原则等,请参见第1篇第3章第2节“统计图”。此处仅给出用SAS/GRAPH模块绘制常用统计图的SAS程序和试验数据, 具体的图形请读者用所给的SAS程序在自己的计算机上显示出来。

第1节 条图、圆图、直方图

1. 条图(棒图)
条图是描述各相互独立的统计指标数量大小的统计图,它用各长条的高度表示数量大小。[例1.7.1] 考察参加某次学习班的人员情况,考察的指标有单位(是否本院)、性别
、年龄等,绘制条图。
[SAS程序] [TT.PRG]
DATA class; INPUT gender$ unit$ age @@; CARDS;
M IN 27M OUT 30F IN 24M IN 36F IN 22F OUT 32
F OUT 36F IN 28M IN 26M OUT 40F OUT 38F IN 31
F OUT 21F IN 27M IN 34M IN 29M OUT 33F OUT 35
M IN 24F IN 23M IN 37F IN 27F IN 34M OUT 41
F OUT 30M IN 26F IN 29F IN 30F OUT 23F IN 36
;
RUN;
TITLE H=2 F=swiss C=red 'Gender Distribution in the class';
FOOTNOTE H=1 CM F=script C=green J=c 'AMMS May 1992';
PATTERN1 V=s C=blue; PATTERN2 V=l3 C=yellow;
PROC GCHART DATA=class; 
HBAR gender/GROUP=unit TYPE=sum SUMVAR=age; RUN;

[程序修改指导] 本例对离散变量作条图,与[例1.7.3]的重要区别在于没有规定SPACE=n选择项,系统自动将各条形分开。TITLE语句表示在输出中打印引号内的标题。H=表示字体大小,数字越大字体越大,无单位为系统缺省,可用CM(厘米), IN(英寸), PCT(占屏幕的百分数)等。F=表示字体选择, 可选的有SWISS,GITALIC, SCRIPT, CENTX, CENTB,CENTBI等。C=表示颜色选择,可选的有RED,GREEN,BLUE,YELLOW,GOLD,ORANGE等;J=是JUSTIFY=的简写,表示标题或脚注是左对齐还是中间对齐或右对齐,分别用L,C,R表示, 标题缺省是中间对齐,脚注缺省是左对齐。
在HBAR的选择项中,GROUP变量表示按该变量分组,本例中将在座标平面内画出4个条形, GROUP可用SUBGROUP替换,它与GROUP的区别在于:它不是对此变量的每个值画一组条形, 而是按此变量的取值个数把每个条形分成几段, 每段的长度代表此取值对要考察的统计量的贡献。TYPE=表示所作条图的类型选择,可选的类型有FREQ(频数),CFREQ(累积频数), PERCENT(百分数),CPERCENT(累积百分数),SUM(SUMVAR=后面所跟变量的和),MEAN(SUMVAR=后面所跟变量的平均值),SUMVAR=表示求轰量的选择,在没有SUMVAR=的情况下,TYPE=的缺省值是FREQ,有SUMVAR=的情况下,TYPE=的缺省值是SUM。
另外在PROC GCHART之前还有2个PATTERNn语句,它们表示对SUBGROUP=后面所跟变量的不同取值所代表的条形分段的描述。同样,C=表示颜色,V=后面可选S,E,以及1~5与L,R和X的任意搭配。如果不写PATTERN语句,则用系统缺省。
如果把HBAR换成BLOCK,可以产生3维立体块图,其大部分选择项和HBAR语句相同。

2. 圆图(饼图、扇面图)
圆图一般用于描述相对数,反映各部分占总量的百分比。
[例1.7.2] 沿用前例数据和已建立的SAS数据集,绘制圆图。
[SAS程序][YT.PRG]
PROC GCHART DATA=class; TITLE; PIE unit gender; RUN

[程序修改指导] 沿用上面建立的数据集CLASS,用一个空的TITLE语句,表示取消所有的标题,否则前面用过的标题在本次输出中还将出现。前面定义的脚注没有取消,本次输出将再次出现。PIE语句同样有SUMVAR=和TYPE=等选择项,用法与HBAR语句类似,PIE语句无SUBGROUP=选择项,对GROUP=选择项后面的变量的每个值画一个圆图。

3. 直方图
直方图是描述定量数据频数的一种很有用的统计图, 它用各组段上矩形的面积表示数量的大小。
[例1.7.3] 考察一组数据是否服从正态,作频数直方图。
[SAS程序][ZFT.PRG]
DATA percent;GOPTIONS DEVICE=ega;
INPUT x @@;PROC GCHART DATA=percent;
CARDS; LABEL x='PERCENTAGE';
数据流 BAR x/MIDPOINTS=64.5 TO 94.5 BY 2 REF=10,20 SPACE=0;
;RUN;
RUN;
(程序的第1部分) (程序的第2部分)

[程序修改指导] 程序中的数据流为第1篇第5章中产生频数表的程序中的数据。GOPTIONS语句表示系统选择,当我们用SAS/GRAPH中的过程来作第1图的时侯,需指明图形的输出设备,在SAS6.04以上版本中才支持VGA。LABEL语句用于对变量作标记, 输出时变量名被引号内的标记所代替,图示更为清晰明了。VBAR X表示对变量X作垂直直方图, 如果用HBAR代替VBAR便是作水平直方图,MIDPOINT选择项表示中点变量由64.5递增到94.5, 增量为2, 这样形成区间(63.5,65.5],(65.5,67.5],……(93.5,95.5]。REF=10,20表示对指定频数10和20绘制参考线。因为这批数据是连续性资料,故规定SPACE=0,即条形之间距离为0, 作出的图形为频数直方图。

第2节散布图、普通线图和半对数线图

[例1.7.4] 测得12名不同年龄妇女的收缩压数据,绘制回归直线及置信带等。
[SAS程序] [SPB.PRG]
DATA line; SYMBOL1 V=dot I=rlcli95 H=0.5 CI=red
INPUT x y @@; CV=green CO=blue;
CARDS; PROC GPLOT DATA=line;
56 147 42 125 72 160 36 118 63 149 47 128LABEL x='AGE' y='SYSTDLIC PRESSURE';
55 180 49 145 38 115 42 140 68 152 60 115PLOT y*x=1/HMINOR=1 VMINOR=1;
;RUN;
RUN;
(程序的第1部分) (程序的第2部分)

[说明] SYMBOLn语句是频繁用于PROC GPLOT中的一条重要语句,V=表示散点的类型, 除DOT外还可取POINT,PLUS,STAR,SQUARE,DIAMOND,HASH和CIRCLE等许多类型; I=表示画线的类型,I=NONE表示不画线,I=JOIN表示用直线连接各点, I=NEEDLE表示从图中各点连垂线到横轴,I=SPLINE表示用平滑曲线连接各点,I=SMXX用样条法去平滑噪音数据, 各数据点不必全落在曲线上,XX取01到99,此数越大越平滑。在本例中,I=RLCLI95, RL表示作直线回归, 还可用RQ和RC代替,分别表示作2次和3次回归,CLI表示作单个预报值的置信带,可用CLM代替,表示作均值的置信带,95表示置信度,另有2个可选值为90和99。CI表示回归线的颜色, CV表示散点的颜色,CO表示置信带的颜色,在PLOT语句中,Y*X=1表示作以X值为横座标, Y值为纵座标的图,作图方式为SYMBOL1语句所描述,HMINOR=和VMINOR=分别表示横轴和纵轴的细刻度数。

[例1.7.5] 把2条曲吓到同一座标系内。
[SAS程序] [HZQXT.PRG]
DATA comp;AXIS1 LABEL=(C=orange F=swiss A=90 'SCORE');
INPUT day dhe meth; AXIS2 LABEL=(C=cyan F=swiss 'DAYS AFTER TREATMENT');
CARDS;FOOTNOTE C=yellow F=swiss 'DOT---DHE SQUARE---METH';
1 26.38 27.59 SYMBOL1 C=red V=dot I=spline;
2 12.46 10.10 SYMBOL2 C=blue V=square I=spline;
3 10.23 6.16 PROC GPLOT DATA=comp;
4 7.92 5.78 PLOT (dhe meth)*day/VAXIS=AXIS1
5 5.68 4.14 VAXIS=0 TO 30 BY 5
6 4.83 3.75 VMINOR=1 HMINOR=0
7 4.29 2.98 HAXIS=AXIS2
8 2.57 3.81 OVERLAY;
9 0.47 1.41 RUN;
;
RUN;
(程序的第1部分)(程序的第2部分)

[程序修改指导] AXISn语句是对座标轴的描述语句, LABEL=(DESCRIPTION)说明标识的选取,在本例中,如果无此说明,则纵轴上的标识将是PLOT语句中的第1个变量名,也就是DHE, 有了这个说明,代替DHE的是SCORES,C=和F=的意义与前类似,A=90表示将标识旋转90度放在纵轴左边。在PLOT语句中,有了OVERLAY选择项,表示将2条曲吓在同一个座标平面内,其作图方手别为SYMBOL1和SYMBOL2所描述, 分别用VAXIS=AXIS1和HAXIS=AXIS2表示纵轴和横轴采用AXISn中的描述方式设置,另外还对纵轴的初刻度和细刻度作了描述。为使图示更为清楚, 加了脚注。
画对数座标图,只要在AXISn语句中加上LOGBASE=n(或PI或e),卷示该座标轴是以n(或PI或e)为底的对数座标轴。另有选择项LOGSTYLE=POWER(或EXPAND), 前者表示轴上标出的数值为对数底的幂次,后者表示为展开的形式,即为原变量的值的大小,缺省为EXPAND。
相关链接
中国离”啤酒与尿布”还有多远?2008-04-15 Cognos使用Apache Web Server的配置方法2008-04-20
网友评论:ETL工具2008-04-24 金融行业数据库项目经验分享2008-04-28
开启服务导向架构智能之旅2008-03-30 企业BI项目投资与回报比面临用户质疑2008-05-03
BI应用:数据分析和数据挖掘时代来临[...2008-03-25 t考验分析(ZT)2008-03-17
企业报表终极瓶颈之浅谈——如何寻找...2008-05-16 购买BI软件的最佳做法2008-03-12
信息化软件应用目录
OA 办公自动化系统 CRM 客户关系管理系统 PM 项目管理系统 SCM 供应链管理系统 CC 协同商务系统 BPM 业务流程管理 BI 商务智能 CMS 内容管理系统 KM/KBS 知识管理系统 电子商务系统 HRM 人力资源管理系统 ERP 企业资源计划 EAM 企业资产管理系统
升蓝首页 | 文档首页 | 产品首页 | 服务首页 | English Version | Big5 Version | 联系我们
Copyright © 1999-2008 深圳市升蓝软件开发有限公司  URL: http://www.hi-blue.com