首页 > 数据库 > MySQL > 正文

初步介绍MySQL中的集合操作

2024-07-24 13:06:59
字体:
来源:转载
供稿:网友

这篇文章主要介绍了初步的MySQL中的集合操作,即UNION DISTINCT和UNION ALL两个命令,需要的朋友可以参考下

啥是集合操作?

通常来说,将联接操作看作是表之间的水平操作,因为该操作生成的虚拟表包含两个表中的列。而我这里总结的集合操作,一般将这些操作看作是垂直操作。MySQL数据库支持两种集合操作:UNION DISTINCT和UNION ALL。

与联接操作一样,集合操作也是对两个输入进行操作,并生成一个虚拟表。在联接操作中,一般把输入表称为左输入和右输入。集合操作的两个输入必须拥有相同的列数,若数据类型不同,MySQL数据库自动将进行隐式转换。同时,结果列的名称由左输入决定。

前期准备

准备测试表table1和table2:

 

 
  1. create table table1  
  2. (aid int not null auto_increment,  
  3. title varchar(20),  
  4. tag varchar(10),  
  5. primary key(aid))  
  6. engine=innodb default charset=utf8; 
  7.  
  8. create table table2  
  9. (bid int not null auto_increment,  
  10. title varchar(20),  
  11. tag varchar(10),  
  12. primary key(bid))  
  13. engine=innodb default charset=utf8; 

插入以下测试数据:

  1. insert into table1(aid, title, tag) values(1, 'article1''MySQL'); 
  2. insert into table1(aid, title, tag) values(2, 'article2''PHP'); 
  3. insert into table1(aid, title, tag) values(3, 'article3''CPP'); 
  4.  
  5. insert into table2(bid, title, tag) values(1, 'article1''MySQL'); 
  6. insert into table2(bid, title, tag) values(2, 'article2''CPP'); 
  7. insert into table2(bid, title, tag) values(3, 'article3''C'); 


UNION DISTINCT

UNION DISTINCT组合两个输入,并应用DISTINCT过滤重复项,一般可以直接省略DISTINCT关键字,直接使用UNION。

UNION的语法如下:

  1. SELECT column,... FROM table1  
  2. UNION [ALL
  3. SELECT column,... FROM table2 
  4. ... 


在多个SELECT语句中,对应的列应该具有相同的字段属性,且第一个SELECT语句中被使用的字段名称也被用于结果的字段名称。

现在我运行以下sql语句:

  1. (select * from table1) union (select * from table2); 


将会得到以下结果:

  1. +-----+----------+-------+ 
  2. | aid | title | tag | 
  3. +-----+----------+-------+ 
  4. | 1 | article1 | MySQL | 
  5. | 2 | article2 | PHP | 
  6. | 3 | article3 | CPP | 
  7. | 2 | article2 | CPP | 
  8. | 3 | article3 | C | 
  9. +-----+----------+-------+ 

我们发现,表table1和表table2中的重复数据项:

  1. | 1 | article1 | MySQL | 


只出现了一次,这就是UNION的作用效果。

MySQL数据库目前对UNION DISTINCT的实现方式如下:

创建一张临时表,也就是虚拟表;

对这张临时表的列添加唯一索引;

将输入的数据插入临时表;

返回虚拟表。

因为添加了唯一索引,所以可以过滤掉集合中重复的数据项。这里重复的意思是SELECT所选的字段完全相同时,才会算作是重复的。

UNION ALL

UNION ALL的意思是不会排除掉重复的数据项,比如我运行以下的sql语句:

  1. (select * from table1) union all (select * from table2); 


你将会得到以下结果:

  1. +-----+----------+-------+ 
  2. | aid | title | tag | 
  3. +-----+----------+-------+ 
  4. | 1 | article1 | MySQL | 
  5. | 2 | article2 | PHP | 
  6. | 3 | article3 | CPP | 
  7. | 1 | article1 | MySQL | 
  8. | 2 | article2 | CPP | 
  9. | 3 | article3 | C | 
  10. +-----+----------+-------+ 


发现重复的数据并不会被筛选掉。

在使用UNION DISTINCT的时候,由于向临时表中添加了唯一索引,插入的速度显然会因此而受到影响。如果确认进行UNION操作的两个集合中没有重复的选项,最有效的办法应该是使用UNION ALL。


发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表