Python 容器的时间复杂度

列表 List

列表是 Python 中常用的容器之一,它的时间复杂度如下:

操作平均时间复杂度最坏时间复杂度
CopyO(n)O(n)
AppendO(1)O(1)
Pop lastO(1)O(1)
Pop intermediateO(n)O(n)
InsertO(n)O(n)
Get itemO(1)O(1)
Set itemO(1)O(1)
Delete itemO(n)O(n)
IterateO(n)O(n)
Get sliceO(k)O(k)
Del sliceO(n)O(n)
Set sliceO(n+k)O(n+k)
ExtendO(k)O(k)
SortO(n log n)O(n log n)
MultiplyO(nk)O(nk)
x in sO(n)
min(s),max(s)O(n)
Get lengthO(1)O(1)

Python 中的列表是动态数组,它的底层是一个数组,当列表的长度超过数组的长度时,会重新分配一个更大的数组,然后将原数组中的元素复制到新数组中,这个过程的时间复杂度是O(n)O(n)。除此之外,在列表的开头插入和删除元素的时间复杂度都是O(n)O(n),如果需要频繁地在列表的开头插入和删除元素,可以使用双端队列 collections.deque。


双端队列 collections.deque

双端队列是 Python 中的标准库 collections 中的一个容器,它的时间复杂度如下:

操作平均时间复杂度最坏时间复杂度
CopyO(n)O(n)
appendO(1)O(1)
appendleftO(1)O(1)
popO(1)O(1)
popleftO(1)O(1)
extendO(k)O(k)
extendleftO(k)O(k)
rotateO(k)O(k)
removeO(n)O(n)
Get LengthO(1)O(1)

双端队列的底层是一个双向链表,它在头尾两端的操作都比较块,但对中间的操作仍然较慢,在需要频繁地在列表的开头插入和删除元素时,可以使用双端队列 collections.deque。


集合 set

集合是 Python 中常用的容器之一,使用 hash 实现,元素查找效率极高,它的时间复杂度如下:

操作平均时间复杂度最坏时间复杂度说明
x in sO(1)O(1)
Union s|tO(len(s) + len(t))
Intersection s&tO(min(len(s), len(t)))O(len(s) * len(t))replace “min” with “max” if t is not a set
Multiple intersection s1&s2&…&sn(n-1)*O(l) where l is max(len(s1),…,len(sn))
Difference s-tO(len(s))
s.difference_update(t)O(len(t))
Symmetric Difference s^tO(len(s))O(len(s) * len(t))
s.symmetric_difference_update(t)O(len(t))O(len(t) * len(s))

从表中我们可以看出 difference s-ts.difference(t) 与就地差分 s.difference_update(t) 的时间复杂度是不同的,前者的时间复杂度是O(len(s))O(len(s)),对于 s 中的每个元素,如果它不在 t 中,则将其添加到新集合中;后者的时间复杂度是O(len(t))O(len(t)),对于 t 中的每个元素,请将其从 s 中删除。

所以我们在选择方法时,应考虑集合 s 和 t 哪个更长,以及我们是否需要新集合。


字典 dict

字典是 Python 中常用的容器之一,也是使用 hash 实现,可以通过 key 来快速查找 value,它的时间复杂度如下:

操作平均时间复杂度最坏时间复杂度
k in dO(1)O(1)
CopyO(n)O(n)
Get itemO(1)O(n)
Set itemO(1)O(n)
Delete itemO(1)O(n)
IterateO(n)O(n)

总结

在实际应用中,我们应该根据具体的场景来进行选择,而不是盲目地使用单一容器。

在需要高速度的情况下,我们可以选择常用操作时间复杂度低的容器,但是需要注意的是,效率优化后的容器可能会占用更多的内存,所以也并不是无脑使用效率更高的容器就行了,必须结合场景进行考量,选择最合适的容器。