STL中常用容器的数据结构与底层实现-蒲公英云

STL中常用容器的数据结构与底层实现

关于几种数据结构：

vector（向量）：

STL中标准而安全的数组。只可以在vector的“前面”增加数据。

deque（双端队列double-ended queue）：

在功能上与vector相类似，但是可以在前后端向其中添加数据。

list（列表）：

游标以此只可以移动一步。如果对链表链表已经很熟悉，那么STL中的list其实就是一个双向链表（每个节点有指向前驱和指向后继的两个指针）。

set（集合）：

包含了进过排序了的数据，这些数据的值（value）必须是唯一的。

map（映射）：

经过排序了的二元组的集合，map中的每个元素都是由两个值组成，其中的key（键值，一个map中的键值必须是唯一的）是在排序或者搜索时使用的，它的值可以在容器中获取；而另一个值是该元素关联的数值。比如，除了可以ar[43] = “overripe”这样找到一个数据，map还可以通过ar[“banana”] = “overripe”这样的方法找到一个数据。如果你想获得其中的元素信息，通过输入元素的全名就可以轻松实现。

multiset（多重集）：

和集合（set）相似，然而其中的值不要求必须是唯一的（即可以有重复）。

multimap（多重映射）：

和映射（map）相似，然而其中的键值不要求必须是唯一的（即可以有重复）。
STL之所以出名，不仅是因为提供了像vector、string、list等方便的容器，更重要的，STL封装了许多复杂的数据结构算法和大量常用数据结构操作：

vector封装了数组
list封装了链表
map和set封装了二叉树
在封装这些数据结构的时候，STL按照程序员的使用习惯，以成员函数方式提供的常用操作，如：插入、排序、删除、查找等。让用户在 STL使用过程中，并不会感到陌生。

红黑树
C++ STL中标准关联容器set, multiset, map, multimap内部采用的就是一种非常高效的平衡检索二叉树：红黑树，也成为RB树(Red-Black Tree)。RB树的统计性能要好于一般的平衡二叉树，所以被STL选择作为了关联容器的内部结构。

为何map和set的插入删除效率要比其他序列容器高？

简单来说，因为对于关联容器而言，不需要做内存拷贝和内存移动。map和set容器内的所有元素都是以节点方式来存储的，其节点结构和链表类似，指向父节点和子节点。

因此，在插入的时候只需要稍作变换，把节点的指针指向新的节点就可以了。删除的时候类似，稍作变换后吧指向删除节点的节点的指针指向其他的节点就可以了。
这其中，只涉及到指针的转换，而没有涉及到内存的移动。

基本总结

1.vector 底层数据结构为数组，支持快速随机访问

2.list 底层数据结构为双向链表，支持快速增删

3.deque 底层数据结构为一个中央控制器和多个缓冲区，详细见STL源码剖析P146，支持首尾（中间不能）快速增删，也支持随机访问

deque是一个双端队列(double-ended queue)，也是在堆中保存内容的.它的保存形式如下:
[堆1] —> [堆2] —>[堆3] —> …
每个堆保存好几个元素,然后堆和堆之间有指针指向,看起来像是list和vector的结合品.
4.stack 底层一般用list或deque实现，封闭头部即可，不用vector的原因应该是容量大小有限制，扩容耗时

5.queue 底层一般用list或deque实现，封闭头部即可，不用vector的原因应该是容量大小有限制，扩容耗时

（stack和queue其实是适配器,而不叫容器，因为是对容器的再封装）

6.priority_queue 的底层数据结构一般为vector为底层容器，堆heap为处理规则来管理底层容器实现

7.set 底层数据结构为红黑树，有序，不重复

8.multiset 底层数据结构为红黑树，有序，可重复

9.map 底层数据结构为红黑树，有序，不重复

10.multimap 底层数据结构为红黑树，有序，可重复

11.hash_set 底层数据结构为hash表，无序，不重复

12.hash_multiset 底层数据结构为hash表，无序，可重复

13.hash_map 底层数据结构为hash表，无序，不重复

14.hash_multimap 底层数据结构为hash表，无序，可重复

参考文章：
STL中map、set的数据结构及底层实现