在Python中,集合用set表示。集合也是多个数据的“集合”。
可以使用大括号或者set()构造函数定义集合对象。
使用大括号定义集合对象的代码如下所示:
- >>> s1 = {1,2,3}
-
- >>> type(s1)
-
- <class 'set'>
-
- >>> s1 = {1,2,3}
-
- >>> type(s1)
-
- <class 'set'>
其中,变量s1是集合对象。
使用set()构造函数定义集合对象的代码如下所示:
- >>> t1 = (1,2,3)
-
- >>> s2 = set(t1)
-
- >>> type(t1)
-
- <class 'tuple'>
-
- >>> type(s2)
-
- <class 'set'>
-
- >>> print(s1==s2)
-
- True
其中,变量t1是元组类型,使用set()构造函数将元组类型的t1转换为集合类型的s2,此时s2与s1相同。
需要注意是的,set()构造函数不但可以将元组类型转换为集合类型,还可以将列表、字符串和字典等类型转换为集合类型。
相比较列表和元组,集合具有无序性和不重复性两个特点。
集合中的元素是无序的,因此,不能通过索引的方式访问集合中的元素。
- >>> s1[0]
-
- Traceback (most recent call last):
-
- File "
" , line 1, in -
- s1[0]
-
- TypeError: 'set' object is not subscriptable
此时,报错信息为“类型错误:集合对象不能使用下标”。
集合中的元素是不能重复的,如果在定义集合对象的时候加入重复元素,定义之后会自动删除重复的元素,相关代码如下所示。
- >>> s3 = {1,2,3,3,2}
-
- >>> print(s3)
-
- {1, 2, 3}
其中,在定义集合s3时,有重复的元素2和3,但是定义完成后,s3中只包含一个2和一个3。
集合的“交并补差”操作包括交集、并集、补集和差集等。
交集指的是两个集合中相同的元素组成的集合,用符号“&”表示。
- >>> s1 = {1, 2, 3, 4, 5}
-
- >>> s2 = {4, 5, 6, 7, 8}
-
- >>> s1 & s2
-
- {4, 5}
以上代码中,s1和s2是两个集合,则这两个集合的交集是{4,5}。
并集指的是两个集合中所有元素组成的集合,用符号“|”表示。
- >>> s1 | s2
-
- {1, 2, 3, 4, 5, 6, 7, 8}
以上代码中,s1和s2的并集是{1, 2, 3, 4, 5, 6, 7, 8},因为集合中不能包含相同的元素,因此去掉了相同的4和5。
补集指的是两个集合中不同元素组成的集合,用符号“^”表示。
- >>> s1 ^ s2
-
- {1, 2, 3, 6, 7, 8}
以上代码中,s1和s2两个集合中,相同的元素是4和5,因此这两个集合的补集就不包含这两个元素。
差集指的是第一个集合中有的元素,但是在第二个集合中没有的元素,这些元素组成的集合,用符号“-”表示。
- >>> s1 - s2
-
- {1, 2, 3}
以上代码中,元素1,2,3是s1特有的元素,而s2中没有这些元素。