STL中常用容器的数据结构与底层实现
关于几种数据结构:
vector(向量):
STL中标准而安全的数组。只可以在vector的“前面”增加数据。
deque(双端队列double-ended queue):
在功能上与vector相类似,但是可以在前后端向其中添加数据。
list(列表):
游标以此只可以移动一步。如果对链表链表已经很熟悉,那么STL中的list其实就是一个双向链表(每个节点有指向前驱和指向后继的两个指针)。
set(集合):
包含了进过排序了的数据,这些数据的值(value)必须是唯一的。
map(映射):
经过排序了的二元组的集合,map中的每个元素都是由两个值组成,其中的key(键值,一个map中的键值必须是唯一的)是在排序或者搜索时使用的,它的值可以在容器中获取;而另一个值是该元素关联的数值。比如,除了可以ar[43] = “overripe”这样找到一个数据,map还可以通过ar[“banana”] = “overripe”这样的方法找到一个数据。如果你想获得其中的元素信息,通过输入元素的全名就可以轻松实现。
multiset(多重集):
和集合(set)相似,然而其中的值不要求必须是唯一的(即可以有重复)。
multimap(多重映射):
和映射(map)相似,然而其中的键值不要求必须是唯一的(即可以有重复)。
STL之所以出名,不仅是因为提供了像vector、string、list等方便的容器,更重要的,STL封装了许多复杂的数据结构算法和大量常用数据结构操作:
vector封装了数组
list封装了链表
map和set封装了二叉树
在封装这些数据结构的时候,STL按照程序员的使用习惯,以成员函数方式提供的常用操作,如:插入、排序、删除、查找等。让用户在 STL使用过程中,并不会感到陌生。
红黑树
C++ STL中标准关联容器set, multiset, map, multimap内部采用的就是一种非常高效的平衡检索二叉树:红黑树,也成为RB树(Red-Black Tree)。RB树的统计性能要好于一般的平衡二叉树,所以被STL选择作为了关联容器的内部结构。
为何map和set的插入删除效率要比其他序列容器高?
简单来说,因为对于关联容器而言,不需要做内存拷贝和内存移动。map和set容器内的所有元素都是以节点方式来存储的,其节点结构和链表类似,指向父节点和子节点。
因此,在插入的时候只需要稍作变换,把节点的指针指向新的节点就可以了。删除的时候类似,稍作变换后吧指向删除节点的节点的指针指向其他的节点就可以了。
这其中,只涉及到指针的转换,而没有涉及到内存的移动。
基本总结
1.vector 底层数据结构为数组 ,支持快速随机访问
2.list 底层数据结构为双向链表,支持快速增删
3.deque 底层数据结构为一个中央控制器和多个缓冲区,详细见STL源码剖析P146,支持首尾(中间不能)快速增删,也支持随机访问
deque是一个双端队列(double-ended queue),也是在堆中保存内容的.它的保存形式如下:
[堆1] —> [堆2] —>[堆3] —> …
每个堆保存好几个元素,然后堆和堆之间有指针指向,看起来像是list和vector的结合品.
4.stack 底层一般用list或deque实现,封闭头部即可,不用vector的原因应该是容量大小有限制,扩容耗时
5.queue 底层一般用list或deque实现,封闭头部即可,不用vector的原因应该是容量大小有限制,扩容耗时
(stack和queue其实是适配器,而不叫容器,因为是对容器的再封装)
6.priority_queue 的底层数据结构一般为vector为底层容器,堆heap为处理规则来管理底层容器实现
7.set 底层数据结构为红黑树,有序,不重复
8.multiset 底层数据结构为红黑树,有序,可重复
9.map 底层数据结构为红黑树,有序,不重复
10.multimap 底层数据结构为红黑树,有序,可重复
11.hash_set 底层数据结构为hash表,无序,不重复
12.hash_multiset 底层数据结构为hash表,无序,可重复
13.hash_map 底层数据结构为hash表,无序,不重复
14.hash_multimap 底层数据结构为hash表,无序,可重复
参考文章:
STL中map、set的数据结构及底层实现
原文链接:https://blog.csdn.net/lym940928/article/details/88377649
https://blog.csdn.net/gx262091291/article/details/76737171
还没有评论,来说两句吧...