vector 容器的数据结构
vector 容器采用的是线性连续空间的数据结构:
- 使用迭代器
_M_start
和_M_finish
来管理这片连续内存空间,两个迭代器的范围[_M_start ,_M_finish )
表示容器的大小 size()。 - 为了提高容器的访问效率,为用户分配内存空间时,会分配多余的备用空间,即容器的容量,以迭代器
_M_end_of_storage
作为可用空间的尾,则容器的容量 capacity() 为[_M_start,_M_end_of_storage)
范围的线性连续空间。
//@ Alloc是SGI STL的空间配置器,默认是第二级配置器
template <class _Tp, class _Alloc = __STL_DEFAULT_ALLOCATOR(_Tp) >
class vector : protected _Vector_base<_Tp, _Alloc>
{
...
protected:
_Tp* _M_start; //@ 表示目前使用空间的头
_Tp* _M_finish; //@ 表示目前使用空间的尾
_Tp* _M_end_of_storage; //@ 表示目前可用空间的尾
...
};
vector 迭代器
- vector 容器维护的空间是线性连续的,所以普通指针也可以作为迭代器,满足vector的访问操作;如:operator*,operator->,operator++,operator--,operator+,operator-,operator+=,operator-=等操作.
- 同时 vector 容器支持随机访问,所以,vector 提供的是随机访问迭代器。
- 对于 vector 的任何操作,一旦引起空间的重新配置,指向原 vector 的所有迭代器都将失效。
//@ Alloc是SGI STL的空间配置器,默认是第二级配置器
template <class _Tp, class _Alloc = __STL_DEFAULT_ALLOCATOR(_Tp) >
class vector : protected _Vector_base<_Tp, _Alloc>
{
//@vector的内嵌型别定义,是iterator_traits<I>服务的类型
public:
typedef _Tp value_type;
typedef value_type* pointer;
typedef const value_type* const_pointer;
typedef value_type* iterator; //@ vector容器的迭代器是普通指针
typedef const value_type* const_iterator;
...
};
vector 的构造函数和析构函数
//@ 默认构造函数
explicit vector(const allocator_type& __a = allocator_type())
: _Base(__a) {}
//@ 构造拥有 n 个有值 value 的元素的容器
vector(size_type __n, const _Tp& __value,
const allocator_type& __a = allocator_type())
: _Base(__n, __a)
//@ 全局函数,填充值函数,即从地址 _M_start 开始连续填充 n 个初值为 value 的值
{ _M_finish = uninitialized_fill_n(_M_start, __n, __value); }
//@ 不接受元素初值,只接受表示元素个数的 n
explicit vector(size_type __n)
: _Base(__n, allocator_type())
{ _M_finish = uninitialized_fill_n(_M_start, __n, _Tp()); }
//@ 拷贝构造,构造拥有 __x 内容的容器
vector(const vector<_Tp, _Alloc>& __x)
: _Base(__x.size(), __x.get_allocator())
{ _M_finish = uninitialized_copy(__x.begin(), __x.end(), _M_start); }
#ifdef __STL_MEMBER_TEMPLATES
// Check whether it's an integral type. If so, it's not an iterator.
//@ 构造拥有范围 [first, last) 内容的容器。
template <class _InputIterator>
vector(_InputIterator __first, _InputIterator __last,
const allocator_type& __a = allocator_type()) : _Base(__a) {
typedef typename _Is_integer<_InputIterator>::_Integral _Integral;
//@ 判断是否为整数 _Integral()
_M_initialize_aux(__first, __last, _Integral());
}
//@ 若输入为整数,则调用该函数
template <class _Integer>
void _M_initialize_aux(_Integer __n, _Integer __value, __true_type) {
_M_start = _M_allocate(__n);
_M_end_of_storage = _M_start + __n;
_M_finish = uninitialized_fill_n(_M_start, __n, __value);
}
//@ 若输入不是整数,则调用该函数判断迭代器类型
template <class _InputIterator>
void _M_initialize_aux(_InputIterator __first, _InputIterator __last,
__false_type) {
_M_range_initialize(__first, __last, __ITERATOR_CATEGORY(__first));
}
#else
vector(const _Tp* __first, const _Tp* __last,
const allocator_type& __a = allocator_type())
: _Base(__last - __first, __a)
{ _M_finish = uninitialized_copy(__first, __last, _M_start); }
#endif /* __STL_MEMBER_TEMPLATES */
//@ 析构函数
~vector() { destroy(_M_start, _M_finish); }
vector 容器的成员函数
迭代器
iterator begin() { return _M_start; } //@ 指向已使用空间头的迭代器
const_iterator begin() const { return _M_start; }
iterator end() { return _M_finish; } //@ 指向已使用空间尾的迭代器
const_iterator end() const { return _M_finish; }
reverse_iterator rbegin()
{ return reverse_iterator(end()); }
const_reverse_iterator rbegin() const
{ return const_reverse_iterator(end()); }
reverse_iterator rend()
{ return reverse_iterator(begin()); }
const_reverse_iterator rend() const
{ return const_reverse_iterator(begin()); }
容量
size_type size() const //@ vector容器大小(已使用空间大小),即容器内存储元素的个数
{ return size_type(end() - begin()); }
size_type max_size() const //@ 返回可容纳最大元素数
{ return size_type(-1) / sizeof(_Tp); }
size_type capacity() const //@ vector容器可用空间的大小
{ return size_type(_M_end_of_storage - begin()); }
bool empty() const //@ 判断容器是否为空
{ return begin() == end(); }
void reserve(size_type __n) { //@ 改变可用空间内存大小
if (capacity() < __n) {
const size_type __old_size = size();
//@ 重新分配大小为n的内存空间,并把原来数据复制到新分配空间
iterator __tmp = _M_allocate_and_copy(__n, _M_start, _M_finish);
destroy(_M_start, _M_finish);//释放容器元素对象
_M_deallocate(_M_start, _M_end_of_storage - _M_start);//回收原来的内存空间
//@ 调整迭代器所指的地址,因为原来迭代器所指的地址已经失效
_M_start = __tmp;
_M_finish = __tmp + __old_size;
_M_end_of_storage = _M_start + __n;
}
}
元素访问
- [] 访问元素时不会检查是否越界,因此用户需要自承风险;at 访问时会检查是否越界,但是效率上会有损失。
reference operator[](size_type __n) { return *(begin() + __n); } //@ 返回指定位置的元素
const_reference operator[](size_type __n) const { return *(begin() + __n); }
#ifdef __STL_THROW_RANGE_ERRORS
//@ 若用户要求的空间大于可用空间,抛出错去信息,即越界检查
void _M_range_check(size_type __n) const {
if (__n >= this->size())
__stl_throw_range_error("vector");
}
reference at(size_type __n) //@ 访问指定元素,并且进行越界检查
{ _M_range_check(__n); return (*this)[__n]; } //@ 访问前,先进行越界检查
const_reference at(size_type __n) const
{ _M_range_check(__n); return (*this)[__n]; }
#endif /* __STL_THROW_RANGE_ERRORS */
reference front() { return *begin(); } //@ 返回第一个元素
const_reference front() const { return *begin(); }
reference back() { return *(end() - 1); } //@ 返回容器最后一个元素
const_reference back() const { return *(end() - 1); }
修改
void push_back(const _Tp& __x) { //@ 在最尾端插入元素
if (_M_finish != _M_end_of_storage) { //@ 若有可用的内存空间
construct(_M_finish, __x); //@ 构造对象
++_M_finish;
}
else //@ 若没有可用的内存空间,调用以下函数,把x插入到指定位置
_M_insert_aux(end(), __x);
}
void push_back() {
if (_M_finish != _M_end_of_storage) {
construct(_M_finish);
++_M_finish;
}
else
_M_insert_aux(end());
}
void swap(vector<_Tp, _Alloc>& __x) {
//@ 交换容器的内容
//@ 这里使用的方法是交换迭代器所指的地址
__STD::swap(_M_start, __x._M_start);
__STD::swap(_M_finish, __x._M_finish);
__STD::swap(_M_end_of_storage, __x._M_end_of_storage);
}
//@ 把x值插入到指定的位置
iterator insert(iterator __position, const _Tp& __x) {
size_type __n = __position - begin();
if (_M_finish != _M_end_of_storage && __position == end()) {
construct(_M_finish, __x);
++_M_finish;
}
else
_M_insert_aux(__position, __x);
return begin() + __n;
}
iterator insert(iterator __position) {
size_type __n = __position - begin();
if (_M_finish != _M_end_of_storage && __position == end()) {
construct(_M_finish);
++_M_finish;
}
else
_M_insert_aux(__position);
return begin() + __n;
}
void insert (iterator __pos, size_type __n, const _Tp& __x)
{ //@ 在pos位置连续插入n个初始值为x的元素
_M_fill_insert(__pos, __n, __x); }
void _M_fill_insert (iterator __pos, size_type __n, const _Tp& __x);
void pop_back() { //@ 取出最尾端元素
--_M_finish;
destroy(_M_finish); //@ 析构对象
}
iterator erase(iterator __position) { //@ 擦除指定位置元素
if (__position + 1 != end())
copy(__position + 1, _M_finish, __position); //@ 后续元素前移一位
--_M_finish;
destroy(_M_finish);//析构对象
return __position;
}
iterator erase(iterator __first, iterator __last) { //@ 擦除两个迭代器区间的元素
iterator __i = copy(__last, _M_finish, __first); //@ 把不擦除的元素前移
destroy(__i, _M_finish); //@ 析构对象
_M_finish = _M_finish - (__last - __first);//调整finish的所指的位置
return __first;
}
//@ 改变容器中可存储的元素个数,并不会分配新的空间
void resize(size_type __new_size, const _Tp& __x) {
if (__new_size < size()) //@ 若调整后的内存空间比原来的小
erase(begin() + __new_size, end());//擦除多余的元素
else
insert(end(), __new_size - size(), __x); //@ 比原来多余的空间都赋予初值x
}
void resize(size_type __new_size) { resize(__new_size, _Tp()); }
void clear() { erase(begin(), end()); }//清空容器
// assign(), a generalized assignment member function. Two
// versions: one that takes a count, and one that takes a range.
// The range version is a member template, so we dispatch on whether
// or not the type is an integer.
/*该函数有两种类型:
void assign( size_type count, const T& value );
template< class InputIt >
void assign( InputIt first, InputIt last );
*/
//@ 把容器内容替换为n个初始值为value
void assign(size_type __n, const _Tp& __val) { _M_fill_assign(__n, __val); }
void _M_fill_assign(size_type __n, const _Tp& __val);
#ifdef __STL_MEMBER_TEMPLATES
template <class _InputIterator>
void assign(_InputIterator __first, _InputIterator __last) {
typedef typename _Is_integer<_InputIterator>::_Integral _Integral;
_M_assign_dispatch(__first, __last, _Integral());
}
template <class _Integer>
void _M_assign_dispatch(_Integer __n, _Integer __val, __true_type)
{ _M_fill_assign((size_type) __n, (_Tp) __val); }
template <class _InputIter>
void _M_assign_dispatch(_InputIter __first, _InputIter __last, __false_type)
{ _M_assign_aux(__first, __last, __ITERATOR_CATEGORY(__first)); }
template <class _InputIterator>
void _M_assign_aux(_InputIterator __first, _InputIterator __last,
input_iterator_tag);
template <class _ForwardIterator>
void _M_assign_aux(_ForwardIterator __first, _ForwardIterator __last,
forward_iterator_tag);
erase
iterator erase(iterator __first, iterator __last) { //@ 擦除两个迭代器区间的元素
iterator __i = copy(__last, _M_finish, __first); //@ 把不擦除的元素前移
destroy(__i, _M_finish); //@ 析构对象
_M_finish = _M_finish - (__last - __first); //@ 调整finish的所指的位置
return __first;
}
根据上面函数的定义,我们可以知道,迭代器 start 和 end_of_storage 并没有改变,只是调整迭代器 finish,并析构待擦除元素对象;下面通过图解进行分析:
insert
void insert (iterator __pos, size_type __n, const _Tp& __x)
{ //@ 在pos位置连续插入n个初始值为x的元素
_M_fill_insert(__pos, __n, __x); }
template <class _Tp, class _Alloc>
void vector<_Tp, _Alloc>::_M_fill_insert(iterator __position, size_type __n,
const _Tp& __x)
{
//@ 当n不为0,插入才有效
if (__n != 0) {
//@ 若有足够的可用空间,即备用空间不小于新插入元素个数
if (size_type(_M_end_of_storage - _M_finish) >= __n) {
_Tp __x_copy = __x;
const size_type __elems_after = _M_finish - __position;//计算插入点之后的现有元素个数
iterator __old_finish = _M_finish;
//@ case1-a:插入点之后的现有元素个数大于新插入元素个数
if (__elems_after > __n) {
//@ 把[finish-n,finish)之间的数据复制[finish,finish+n)
uninitialized_copy(_M_finish - __n, _M_finish, _M_finish);
_M_finish += __n; //@ 调整迭代器finish所指的位置
//@ 把[position,old_finish-n)之间的数据复制[old_finish-n,old_finish)
copy_backward(__position, __old_finish - __n, __old_finish);
fill(__position, __position + __n, __x_copy);//在指定位置(插入点)填充初始值
}
//@ case1-b:插入点之后的现有元素个数不大于新插入元素个数
else {
//@ 先在可用空间填入n-elems_after个初始值x
uninitialized_fill_n(_M_finish, __n - __elems_after, __x_copy);
_M_finish += __n - __elems_after;//调整迭代器finish
//@ 把[position,old_finish)之间的数据复制到[old_finish,finish)
uninitialized_copy(__position, __old_finish, _M_finish);
_M_finish += __elems_after;
fill(__position, __old_finish, __x_copy);
}
}
//@ case2:若备用空间小于新插入元素个数,则分配新的空间,并把原始数据复制到新的空间
else {
const size_type __old_size = size(); //@ 获取原始空间的大小
//@ 新的空间为旧空间的两倍,或为旧空间+新增长元素个数
const size_type __len = __old_size + max(__old_size, __n);
//@ 配置新的空间
iterator __new_start = _M_allocate(__len);
iterator __new_finish = __new_start;
__STL_TRY {//@ 把插入点之前的原始数据复制到新的空间
__new_finish = uninitialized_copy(_M_start, __position, __new_start);
//@ 将新加入数据添加在[new_finish,new_finish+n)
__new_finish = uninitialized_fill_n(__new_finish, __n, __x);
//@ 将插入点之后的原始数据复制到新空间
__new_finish
= uninitialized_copy(__position, _M_finish, __new_finish);
}
//@ 释放原来空间的对象和内存
__STL_UNWIND((destroy(__new_start,__new_finish),
_M_deallocate(__new_start,__len)));
destroy(_M_start, _M_finish);
_M_deallocate(_M_start, _M_end_of_storage - _M_start);
//@ 调整迭代器所指的位置
_M_start = __new_start;
_M_finish = __new_finish;
_M_end_of_storage = __new_start + __len;
}
}
}
-
case1-a,对应的源代码解析中的 case1-a 情况:
-
case1-b,对应的源代码解析中的 case1-b 情况:
-
case2,对应的源代码解析中的 case2 情况:
vector的操作符重载
template <class _Tp, class _Alloc>
inline bool //操作符重载,判断两个容器是否相等,即容器大小和容器内容是否都相等
operator==(const vector<_Tp, _Alloc>& __x, const vector<_Tp, _Alloc>& __y)
{
return __x.size() == __y.size() &&
equal(__x.begin(), __x.end(), __y.begin());
/*STL中equal函数的实现如下:
* template<class InputIt1, class InputIt2>
* bool equal(InputIt1 first1, InputIt1 last1, InputIt2 first2)
* {
* for (; first1 != last1; ++first1, ++first2)
* {
* if (!(*first1 == *first2))
* {
* return false;
* }
* }
* return true;
* }
*/
}
template <class _Tp, class _Alloc>
inline bool
operator<(const vector<_Tp, _Alloc>& __x, const vector<_Tp, _Alloc>& __y)
{
/*函数原型:
template<class InputIt1, class InputIt2>
bool lexicographical_compare(InputIt1 first1, InputIt1 last1,
InputIt2 first2, InputIt2 last2)
{
for ( ; (first1 != last1) && (first2 != last2); first1++, first2++ ) {
if (*first1 < *first2) return true;
if (*first2 < *first1) return false;
}
return (first1 == last1) && (first2 != last2);
}
*/
return lexicographical_compare(__x.begin(), __x.end(),
__y.begin(), __y.end());
}
#ifdef __STL_FUNCTION_TMPL_PARTIAL_ORDER
template <class _Tp, class _Alloc>
inline void swap(vector<_Tp, _Alloc>& __x, vector<_Tp, _Alloc>& __y)
{
__x.swap(__y);
}
template <class _Tp, class _Alloc>
inline bool
operator!=(const vector<_Tp, _Alloc>& __x, const vector<_Tp, _Alloc>& __y) {
return !(__x == __y);
}
template <class _Tp, class _Alloc>
inline bool
operator>(const vector<_Tp, _Alloc>& __x, const vector<_Tp, _Alloc>& __y) {
return __y < __x;
}
template <class _Tp, class _Alloc>
inline bool
operator<=(const vector<_Tp, _Alloc>& __x, const vector<_Tp, _Alloc>& __y) {
return !(__y < __x);
}
template <class _Tp, class _Alloc>
inline bool
operator>=(const vector<_Tp, _Alloc>& __x, const vector<_Tp, _Alloc>& __y) {
return !(__x < __y);
}
#endif /* __STL_FUNCTION_TMPL_PARTIAL_ORDER */
template <class _Tp, class _Alloc>
vector<_Tp,_Alloc>&
vector<_Tp,_Alloc>::operator=(const vector<_Tp, _Alloc>& __x)
{
if (&__x != this) {
const size_type __xlen = __x.size();
if (__xlen > capacity()) {
iterator __tmp = _M_allocate_and_copy(__xlen, __x.begin(), __x.end());
destroy(_M_start, _M_finish);
_M_deallocate(_M_start, _M_end_of_storage - _M_start);
_M_start = __tmp;
_M_end_of_storage = _M_start + __xlen;
}
else if (size() >= __xlen) {
iterator __i = copy(__x.begin(), __x.end(), begin());
destroy(__i, _M_finish);
}
else {
copy(__x.begin(), __x.begin() + size(), _M_start);
uninitialized_copy(__x.begin() + size(), __x.end(), _M_finish);
}
_M_finish = _M_start + __xlen;
}
return *this;
}
总结
- vector 其存储空间为连续的线性空间,支持单向动态扩容,有预分配的技术。所谓动态增加大小,并不是在原空间之后接续新空间(因为无法保证原空间之后尚有可供配置的空间),而是以原大小的两倍另外配置一块较大空间,然后将原内容拷贝过来,然后才开始在原内容之后构造新元素,并释放原空间。
- vector 迭代器是普通指针,是随机访问迭代器。
- 对于 vector 的任何操作,一旦引起空间的重新配置,指向原 vector 的所有迭代器都将失效。
- vector 支持随机访问,访问任意元素的时间复杂度都是O(1),在尾部添加/删除元素的时间复杂度为 O(1),在其它添加/删除元素的时间复杂度为 O(n)。