分拆统计字符串

2024-07-21 02:07:50

字体：大中小

来源：转载

供稿：网友

在数据库表tbl1中有一个字段keywords，它是nvarchar类型，长度为1000，该字段的内容是所要分析的论文的关键字id                        keywords -----------------------------------------------------------1                          kw1;kw2;kw32                          kw2;kw33                          kw3;kw1;kw4

问题1。对于在keywords字段中出现的所有关键字集合(上例中关键字集合为{kw1,kw2,kw3,kw4})中的任意一个关键字，要统计它出现的次数（也就是包含该关键字的纪录的条数），然后写到另一张表中。最后的效果就是keywords       count-------------------------kw1              2kw2              2kw3              3kw4              1

问题2。在此基础上，要进行组合查询。也就是说在整个关键字集合中任意抽出两个关键字，统计它们在数据库表纪录中同时出现的次数。对于上题，最后效果要是：keywords             count----------------------------------kw1;kw2                1kw1;kw3                2kw1;kw4                1kw2;kw3                2kw2;kw4                0kw3;kw4                1

--------------------------------------------------------------------------------------

--统计示例

--为统计处理专门做的序数表select top 1000 id=identity(int,1,1) into 序数表 from syscolumns a,syscolumns balter table 序数表 add constraint pk_id_序数表 primary key(id)go

--示例数据create table tbl1(id int,keywords nvarchar(1000))insert tbl1 select 1,'kw1;kw2;kw3'union all select 2,'kw2;kw3'union all select 3,'kw3;kw1;kw4'go

--第一种统计(计数)select keyword=substring(a.keywords,b.id,charindex(';',a.keywords+';',b.id)-b.id) ,[count]=count(distinct a.id)from tbl1 a,序数表 bwhere b.id<=len(a.keywords) and substring(';'+a.keywords,b.id,1)=';'group by substring(a.keywords,b.id,charindex(';',a.keywords+';',b.id)-b.id)go

--第二种统计(组合统计)select keyword=substring(a.keywords,b.id,charindex(';',a.keywords+';',b.id)-b.id) ,[count]=count(distinct a.id),a.idinto #tfrom tbl1 a,序数表 bwhere b.id<=len(a.keywords) and substring(';'+a.keywords,b.id,1)=';'group by substring(a.keywords,b.id,charindex(';',a.keywords+';',b.id)-b.id),a.id

select keyword=a.keyword+';'+b.keyword,[count]=sum(case a.id when b.id then 1 else 0 end)from #t a,#t bwhere a.keyword<b.keywordgroup by a.keyword,b.keywordorder by keyword

drop table #tgo

--删除测试环境drop table tbl1,序数表

/*--测试结果

--统计1keyword    count   ---------- --------kw1        2kw2        2kw3        3kw4        1

（所影响的行数为 4 行）

--统计2keyword                 count      ----------------------- -----------kw1;kw2                 1kw1;kw3                 2kw1;kw4                 1kw2;kw3                 2kw2;kw4                 0kw3;kw4                 1

（所影响的行数为 6 行）--*/

上一篇：MINFO－印度铁矿资源矿物信息原型数据库

下一篇：随机选择表格里的行