由于sin函数计算比较耗cpu,也比较经典,故分别实现1千万次sin运算做比较
sql2005代码:
declare @i int;
declare @x float;
set @i=1;
while @i<=10000000
begin
set @x=sin(@i);
set @[email protected]+1;
end;
go
耗时:26秒
sas data步代码 :
data _null_;
length i x 8.;
i=1;
do i=1 to 10000000;
x=sin(i);
end;
run;
运行结果:
note: “data 语句”所用时间(总处理时间):
实际时间 1.72 秒
cpu 时间 1.70 秒
耗时不到2秒
再对字符进行比较,我选择替换字符串做比较,也是分别实现1千万次进行字符串替换运算做比较
sql代码
declare @i int;
declare @str varchar(50);
declare @tarstr varchar(50);
set @i=1;
set @str='this is my test!';
while @i<=10000000
begin
set @tarstr=replace(@str,'my','my');
set @[email protected]+1;
end;
print @tarstr;
go
运行结果:耗时2分24秒
sas data步代码
data _null_;
length i 8.;
length str tarstr $50.;
str="this is my test!";
i=1;
do i=1 to 10000000;
tarstr=tranwrd(str,"my","my");
end;
put tarstr;
run;
运行结果:耗时不到9秒
note: data statement used (total process time):
real time 8.09 seconds
cpu time 8.09 seconds
初步总结:
进行一千万次sin运算时,sql2005耗时26秒,sas不到2秒,差不多相差13倍
进行一千万次字符替换运算时,sql2005耗时144秒,sas不到9秒,差不多相差16倍
可以看出,sas的数据处理能力可以说是超强,在这方面可以说任何当前数据库都不能相比
如果不是由于sas本身产品的限制,说不定早就在中国市场上流行了
:) 如果有人想把sas做的etl转为用sql2005做etl时,可要考虑客户的感受了,想想如果一下子由原来的十几天的数据加载变成几个月的数据加载,你就头疼把;当然如果只是小数据量加载之间的转换,还是没问题的
比较有意思的是,sas的merge操作一直以来都是要求输入的数据要先按指定字段进行排序才能merge,现在sql2005提供的merge组件也有了这样的要求,有点像终于找到党组织的感觉了
新闻热点
疑难解答