C++中的智能指针-电子发烧友网

大家好，今天借助本文，从实践、避坑和实现原理三个角度分析下C++中的智能指针。

本文主要内容如下图所示：

智能指针的由来

auto_ptr为什么被废弃

unique_ptr的使用、特点以及实现

shared_ptr的使用、特点以及实现

weak_ptr的使用、特点以及实现

介绍笔者在工作中遇到的一些职能指针相关的坑，并给出一些建议

背景

内存的分配与回收都是由开发人员在编写代码时主动完成的，好处是内存管理的开销较小，程序拥有更高的执行效率；弊端是依赖于开发者的水平，随着代码规模的扩大，极容易遗漏释放内存的步骤，或者一些不规范的编程可能会使程序具有安全隐患。如果对内存管理不当，可能导致程序中存在内存缺陷，甚至会在运行时产生内存故障错误。换句话说，开发者自己管理内存，最容易发生下面两种情况：

申请了内存却没有释放，造成内存泄漏

使用已经释放的内存，造成segment fault

所以，为了在保证性能的前提下，又能使得开发者不需要关心内存的释放，进而使得开发者能够将更多的精力投入到业务上，自C++11开始，STL正式引入了智能指针。

所有权

智能指针一个很关键的一个点就是是否拥有一个对象的所有权，当我们通过std::make_xxx或者new一个对象，那么就拥有了这个对象的所有权。

所有权分为独占所有权、共享所有权以及弱共享所有权三种。

独占所有权

顾名思义，独占该对象。独占的意思就是不共享，所有权可以转移，但是转移之后，所有权也是独占。auto_ptr和unique_ptr就是一种独占所有权方式的智能指针。

假设有个Object对象，如果A拥有该对象的话，就需要保证其在不使用该对象的时候，将该对象释放；而此时如果B也想拥有Object对象，那么就必须先让A放弃该对象所有权，然后B独享该对象，那么该对象的使用和释放就只归B所有，跟A没有关系了。

独占所有权具有以下几个特点：

如果创建或者复制了某个对象，就拥有了该对象

如果没有创建对象，而是将对象保留使用，同样拥有该对象的所有权

如果你拥有了某个对象的所有权，在不需要某一个对象时，需要释放它们

共享所有权

共享所有权，与独占所有权正好相反，对某个对象的所有权可以共享。shared_ptr就是一种共享所有权方式的智能指针。

假设此时A拥有对象Object，在没有其它拥有该对对象的情况下，对象的释放由A来负责；如果此时B也想拥有该对象，那么对象的释放由最后一个拥有它的来负责。

举一个我们经常遇到的例子，socket连接，多个发送端(sender)可以使用其发送和接收数据。

弱共享所有权

弱共享所有权，指的是可以使用该对象，但是没有所有权，由真正拥有其所有权的来负责释放。weak_ptr就是一种弱共享所有权方式的智能指针。

分类

在C++11中，有unique_ptr、shared_ptr以及weak_ptr三种，auto_ptr因为自身转移所有权的原因，在C++11中被废弃(本节最后，将简单说下被废弃的原因)。

unique_ptr

使用上限制最多的一种智能指针，被用来取代之前的auto_ptr，一个对象只能被一个unique_ptr所拥有，而不能被共享，如果需要将其所拥有的对象转移给其他unique_ptr，则需要使用move语义

shared_ptr

与unique_ptr不同的是，unique_ptr是独占管理权，而shared_ptr则是共享管理权，即多个shared_ptr可以共用同一块关联对象，其内部采用的是引用计数，在拷贝的时候，引用计数+1，而在某个对象退出作用域或者释放的时候，引用计数-1，当引用计数为0的时候，会自动释放其管理的对象。

weak_ptr

weak_ptr的出现，主要是为了解决shared_ptr的循环引用，其主要是与shared_ptr一起来使用。和shared_ptr不同的地方在于，其并不会拥有资源，也就是说不能访问对象所提供的成员函数，不过，可以通过weak_ptr.lock()来产生一个拥有访问权限的shared_ptr。

auto_ptr

auto_ptr自C++98被引入，因为其存在较多问题，所以在c++11中被废弃，自C++17开始正式从STL中移除。

首先我们看下auto_ptr的简单实现(为了方便阅读，进行了修改，基本功能类似于std::auto_ptr)：

template
classauto_ptr
{
T*p;
public:
auto_ptr(T*s):p(s){}
~auto_ptr(){deletep;}

auto_ptr(auto_ptr&a){
p=a.p;
a.p=NULL;
}
auto_ptr&operator=(auto_ptr&a){
deletep;
p=a.p;
a.p=NULL;
return*this;
}

T&operator*()const{return*p;}
T*operator->()const{returnp;}
};

从上面代码可以看出，auto_ptr采用copy语义来转移所有权，转移之后，其关联的资源指针设置为NULL，而这跟我们理解上copy行为不一致。

在<< Effective STL >>第8条，作者提出永不建立auto_ptr的容器，并以一个例子来说明原因，感兴趣的可以去看看这本书，还是不错的。

实际上，auto_ptr被废弃的直接原因是拷贝造成所有权转移，如下代码：

auto_ptra(newClassA);
auto_ptrb=a;
a->Method();

在上述代码中，因为b = a导致所有权被转移，即a关联的对象为NULL，如果再调用a的成员函数，显然会造成coredump。

正是因为拷贝导致所有权被转移，所以auto_ptr使用上有很多限制：

不能在STL容器中使用，因为复制将导致数据无效

一些STL算法也可能导致auto_ptr失效，比如std::sort算法

不能作为函数参数，因为这会导致复制，并且在调用后，导致原数据无效

如果作为类的成员变量，需要注意在类拷贝时候导致的数据无效

正是因为auto_ptr的诸多限制，所以自C++11起，废弃了auto_ptr，引入unique_ptr。

unique_ptr

unique_ptr是C++11提供的用于防止内存泄漏的智能指针中的一种实现(用来替代auto_ptr)，独享被管理对象指针所有权的智能指针。

unique_ptr对象包装一个原始指针，并负责其生命周期。当该对象被销毁时，会在其析构函数中删除关联的原始指针。具有->和*运算符重载符，因此它可以像普通指针一样使用。

分类

unique_ptr分为以下两种：

指向单个对象

std::unique_ptrp1;//p1关联Type对象

指向一个数组

unique_ptrp2;//p2关联Type对象数组

特点

在前面的内容中，我们已经提到了unique_ptr的特点，主要具有以下：

独享所有权，在作用域结束时候，自动释放所关联的对象

voidfun(){
unique_ptra(newint(1));
}

无法进行拷贝与赋值操作

unique_ptrptr(newint(1));
unique_ptrptr1(ptr);//error
unique_ptrptr2=ptr;//error

显示的所有权转移(通过move语义)

unique_ptrptr(newint(1));
unique_ptrptr1=std::move(ptr);//ok

作为容器元素存储在容器中

unique_ptrptr(newint(1));
std::vector>v;

v.push_back(ptr);//error
v.push_back(std::move(ptr));//ok

std::cout<

	

	需要注意的是，自c++14起，可以使用下面的方式对unique_ptr进行初始化：

	
autop1=std::make_unique(3.14);
autop2=std::make_unique(n);


	

	如果在c++11中使用上述方法进行初始化，会得到下面的错误提示:

	
error:‘make_unique’isnotamemberof‘std’


	

	因此，如果为了使得c++11也可以使用std::make_unique，我们可以自己进行封装，如下：

	
namespacedetails{

#if__cplusplus>=201402L//C++14及以后使用STL实现的
usingstd::make_unique;
#else
template
std::unique_ptrmake_unique(Args&&...args)
{
returnstd::unique_ptr(newT(std::forward(args)...));
}
#endif
}//namespacedetails



	

	使用

	为了尽可能了解unique_ptr的使用姿势，我们使用以下代码为例：

	
#include
#include//std::move

voidfun1(double*);
voidfun2(std::unique*);
voidfun3(std::unique&);
voidfun4(std::unique);

intmain(){
std::unique_ptrp(newdouble(3.14));

fun1(p.get());
fun2(&p);
fun3(p);

if(p){
std::cout<

	

	上述代码，基本覆盖了常见的unique_ptr用法：

	第10行，通过new创建一个unique_ptr对象

	第11行，通过get()函数获取其关联的原生指针

	第12行，通过unique_ptr对象的指针进行访问

	第13行，通过unique_ptr对象的引用进行访问

	第16行，通过if(p)来判断其是否有效

	第18行，通过release函数释放所有权，并将所有权进行转移

	第19行，通过reset释放之前的原生指针，并重新关联一个新的指针

	第20行，通过std::move转移所有权

	简单实现

	本部分只是基于源码的一些思路，便于理解，实现的一个简单方案，如果想要阅读源码，请点击unique_ptr查看。

	基本代码如下：

	
template
classunique_ptr
{
T*p;
public:
unique_ptr():p(){}
unique_ptr(T*s):p(s){}
~unique_ptr(){deletep;}

unique_ptr(constunique_ptr&)=delete;
unique_ptr&operator=(constunique_ptr&)=delete;

unique_ptr(unique_ptr&&s):p(s.p){s.p=nullptr}

unique_ptr&operator=(unique_ptrs)
{deletep;p=s.p;s.p=nullptr;return*this;}

T*operator->()const{returnp;}
T&operator*()const{return*p;}
};



	

	从上面代码基本可以看出，unique_ptr的控制权转移是通过move语义来实现的，相比于auto_ptr的拷贝语义转移所有权，更为合理。

	shared_ptr

	unique_ptr因为其局限性(独享所有权)，一般很少用于多线程操作。在多线程操作的时候，既可以共享资源，又可以自动释放资源，这就引入了shared_ptr。

	shared_ptr为了支持跨线程访问，其内部有一个引用计数(线程安全)，用来记录当前使用该资源的shared_ptr个数，在结束使用的时候，引用计数为-1，当引用计数为0时，会自动释放其关联的资源。

	特点

	相对于unique_ptr的独享所有权，shared_ptr可以共享所有权。其内部有一个引用计数，用来记录共享该资源的shared_ptr个数，当共享数为0的时候，会自动释放其关联的资源。

	shared_ptr不支持数组，所以，如果用shared_ptr指向一个数组的话，需要自己手动实现deleter，如下所示：

	
std::shared_ptrp(newint[8],[](int*ptr){delete[]ptr;});


	

	使用

	仍然以一段代码来说明，毕竟代码更有说服力。

	
#include
#include

intmain(){
//创建shared_ptr对象
std::shared_ptrp1=std::make_shared();
*p1=78;
std::cout<p2(p1);
//打印引用计数
std::cout<

	

	输出如下：

	
p1=78
p1Referencecount=1
p2Referencecount=2
p1Referencecount=2
p1andp2arepointingtosamepointer
Resetp1
p1ReferenceCount=0
p1ReferenceCount=1
p1ReferenceCount=0
p1isNULL


	

	上面代码基本罗列了shared_ptr的常用方法，对于其他方法，可以参考源码或者官网。

	线程安全

	可能很多人都对shared_ptr是否线程安全存在疑惑，借助本节，对线程安全方面的问题进行分析和解释。

	shared_ptr的线程安全问题主要有以下两种：

	引用计数的加减操作是否线程安全

	shared_ptr修改指向时是否线程安全

	引用计数

	shared_ptr中有两个指针，一个指向所管理数据的地址，另一个一个指向执行控制块的地址。

	执行控制块包括对关联资源的引用计数以及弱引用计数等。在前面我们提到shared_ptr支持跨线程操作，引用计数变量是存储在堆上的，那么在多线程的情况下，指向同一数据的多个shared_ptr在进行计数的++或--时是否线程安全呢？

	引用计数在STL中的定义如下：

	
_Atomic_word_M_use_count;//#shared
_Atomic_word_M_weak_count;//#weak+(#shared!=0)


	

	当对shared_ptr进行拷贝时，引入计数增加，实现如下：

	
template<>
inlinevoid
_Sp_counted_base<_S_atomic>::
_M_add_ref_lock(){
//Performlock-freeadd-if-not-zerooperation.
_Atomic_word__count;
do
{
__count=_M_use_count;
if(__count==0)
__throw_bad_weak_ptr();
}
while(!__sync_bool_compare_and_swap(&_M_use_count,__count,
__count+1));
}


	

	最终，计数的增加，是调用__sync_bool_compare_and_swap实现的，而该函数是线程安全的，因此我们可以得出结论：在多线程环境下，管理同一个数据的shared_ptr在进行计数的增加或减少的时候是线程安全的，这是一波原子操作。

	修改指向

	修改指向分为操作同一个对象和操作不同对象两种。

	同一对象

	以下面代码为例：

	
voidfun(shared_ptr&p){
if(...){
p=p1;
}else{
p=p2;
}
}


	

	当在多线程场景下调用该函数时候，p之前的引用计数要进行-1操作，而p1对象的引用计数要进行+1操作，虽然这俩的引用计数操作都是线程安全的，但是对这俩对象的引用计数的操作在一起时候却不是线程安全的。这是因为当对p1的引用计数进行+1时候，恰恰前一时刻，p1的对象被释放，后面再进行+1操作，会导致segment fault。

	不同对象

	代码如下：

	
voidfun1(std::shared_ptr&p){
p=p1;
}

voidfun2(std::shared_ptr&p){
p=p2;
}

intmain(){
std::shared_ptrp=std::make_shared();
autop1=p;
autop2=p;
std::threadt1(fun1,p1);
std::threadt2(fun2,p2);

t1.join();
t2.join();

return0;
}


	

	在上述代码中，p、p1、p2指向同一个资源，分别有两个线程操作不同的shared_ptr对象(虽然关联的底层资源是同一个)，这样在多线程下，只对p1和p2的引用计数进行操作，不会引起segment fault，所以是线程安全的。

	?

	同一个shared_ptr被多个线程同时读是安全的

	同一个shared_ptr被多个线程同时读写是不安全的

	?

	简单实现

	本部分只是基于源码的一些思路，便于理解，实现的一个简单方案，如果想要阅读源码，请点击shared_ptr查看。

	记得之前看过一个问题为什么引用计数要new，这个问题我在面试的时候也问过，很少有人能够回答出来，其实，很简单，因为要支持多线程访问，所以只能要new呀。

	代码如下：

	
template
classweak_ptr;

classCounter{
public:
Counter()=default;
ints_=0;//shared_ptr的计数
intw_=0;//weak_ptr的计数
};

template
classshared_ptr{
public:
shared_ptr(T*p=0):ptr_(p){
cnt_=newCounter();
if(p){
cnt_->s_=1;
}
}

~shared_ptr(){
release();
}

shared_ptr(shared_ptrconst&s){
ptr_=s.ptr_;
(s.cnt)->s_++;
cnt_=s.cnt_;
}

shared_ptr(weakptr_const&w){
ptr_=w.ptr_;
(w.cnt_)->s_++;
cnt_=w.cnt_;
}

shared_ptr&operator=(shared_ptr&s){
if(this!=&s){
release();
(s.cnt_)->s_++;
cnt_=s.cnt_;
ptr_=s.ptr_;
}
return*this;
}

T&operator*(){
return*ptr_;
}

T*operator->(){
returnptr_;
}

friendclassweak_ptr;

protected:
voidrelease(){
cnt_->s_--;
if(cnt_->s_w_

	

	weak_ptr

	在三个智能指针中，weak_ptr是存在感最低的一个，也是最容易被大家忽略的一个智能指针。它的引入是为了解决shared_ptr存在的一个问题循环引用。

	特点

	不具有普通指针的行为，没有重载operator*和operator->

	没有共享资源，它的构造不会引起引用计数增加

	用于协助shared_ptr来解决循环引用问题

	可以从一个shared_ptr或者另外一个weak_ptr对象构造，进而可以间接获取资源的弱共享权。

	使用

	
intmain(){
std::shared_ptrp1=std::make_shared(14);
{
std::weak_ptrweak=p1;
std::shared_ptrnew_shared=weak.lock();

shared_e1=nullptr;

new_shared=nullptr;
if(weak.expired()){
std::cout<

	

	上述代码输出如下：

	
weakpointerisexpired
0


	

	使用成员函数use_count()和expired()来获取资源的引用计数，如果返回为0或者false，则表示关联的资源不存在

	使用lock()成员函数获得一个可用的shared_ptr对象，进而操作资源

	当expired()为true的时候，lock()函数将返回一个空的shared_ptr

	简单实现

	
template
classweak_ptr
{
public:
weak_ptr()=default;

weak_ptr(shared_ptr&s):ptr_(s.ptr_),cnt(s.cnt_){
cnt_->w_++;
}

weak_ptr(weak_ptr&w):ptr_(w.ptr_),cnt_(w.cnt_){
cnt_->w_++;
}
~weak_ptr(){
release();
}
weak_ptr&operator=(weak_ptr&w){
if(this!=&w){
release();
cnt_=w.cnt_;
cnt_->w_++;
ptr_=w.ptr_;
}
return*this;
}
weak_ptr&operator=(shared_ptr&s)
{
release();
cnt_=s.cnt_;
cnt_->w_++;
ptr_=s.ptr_;
return*this;
}

shared_ptrlock(){
returnshared_ptr(*this);
}

boolexpired(){
if(cnt){
if(cnt->s_>0){
returnfalse;
}
}
returntrue;
}

friendclassshared_ptr;

protected:
voidrelease(){
if(cnt_){
cnt_->w_--;
if(cnt_->w_s_

	

	循环引用

	在之前的文章内存泄漏-原因、避免以及定位中，我们讲到使用weak_ptr来配合shared_ptr使用来解决循环引用的问题，借助本文，我们深入说明下如何来解决循环引用的问题。

	代码如下：

	
classController{
public:
Controller()=default;

~Controller(){
std::cout<controller_;
};

std::shared_ptrsub_controller_;
};


	

	在上述代码中，因为controller和sub_controller之间都有一个指向对方的shared_ptr，这样就导致任意一个都因为对方有一个指向自己的对象，进而引用计数不能为0。

	

	为了解决std::shared_ptr循环引用导致的内存泄漏，我们可以使用std::weak_ptr来单面去除上图中的循环。

	
classController{
public:
Controller()=default;

~Controller(){
std::cout<controller_;
};

std::shared_ptrsub_controller_;
};


	

	在上述代码中，我们将SubController类中controller_的类型从std::shared_ptr变成std::weak_ptr。

	

	那么，为什么将SubController中的shared_ptr换成weak_ptr就能解决这个问题呢？我们看下源码：

	
template
__weak_ptr&
operator=(const__shared_ptr<_Tp1,?_Lp>&__r)//neverthrows
{
_M_ptr=__r._M_ptr;
_M_refcount=__r._M_refcount;
return*this;
}


	

	在上面代码中，我们可以看到，将一个shared_ptr赋值给weak_ptr的时候，其引用计数并没有+1，所以也就解决了循环引用的问题。

	那么，如果我们想要使用shared_ptr关联的对象进行操作时候，该怎么做呢？使用weak_ptr::lock()函数来实现，源码如下：

	
__shared_ptr<_Tp,?_Lp>
lock()const{
returnexpired()?__shared_ptr():__shared_ptr(*this);
}


	

	从上面代码可看出，使用lock()函数生成一个shared_ptr供使用，如果之前的shared_ptr已经被释放，那么就返回一个空shared_ptr对象，否则生成shared_ptr对象的拷贝(这样即使之前的释放也不会存在问题)。

	经验之谈

	不要混用

	指针之间的混用，有时候会造成不可预知的错误，所以建议尽量不要混用。包括裸指针和智能指针以及智能指针之间的混用

	裸指针和智能指针混用

	代码如下：

	
voidfun(){
autoptr=newType;
std::shared_ptrt(ptr);

deleteptr;
}


	

	在上述代码中，将ptr所有权归shared_ptr所拥有，所以在出fun()函数作用域的时候，会自动释放ptr指针，而在函数末尾又主动调用delete来释放，这就会造成double delete，会造成segment fault。

	智能指针混用

	代码如下：

	
voidfun(){
std::unique_ptrt(newType);
std::shared_ptrt1(t.get());
}


	

	在上述代码中，将t关联的对象又给了t1，也就是说同一个对象被两个智能指针所拥有，所以在出fun()函数作用域的时候，二者都会释放其关联的对象，这就会造成double delete，会造成segment fault。

	需要注意的是，下面代码在STL中是支持的：

	
voidfun(){
std::unique_ptrt(newType);
std::shared_ptrt1(std::move(t));
}


	

	不要管理同一个裸指针

	代码如下：

	
voidfun(){
autoptr=newType;
std::unique_ptrt(ptr);
std::shared_ptrt1(ptr);
}


	

	在上述代码中，ptr所有权同时给了t和t1，也就是说同一个对象被两个智能指针所拥有，所以在出fun()函数作用域的时候，二者都会释放其关联的对象，这就会造成double delete，会造成segment fault。

	避免使用get()获取原生指针

	
voidfun(){
autoptr=std::make_shared();

autoa=ptr.get();

std::shared_ptrt(a);
deletea;
}


	

	一般情况下，生成的指针都要显式调用delete来进行释放，而上述这种，很容易稍不注意就调用delete；非必要不要使用get()获取原生指针。

	不要管理this指针

	
classType{
private:
voidfun(){
std::shared_ptrt(this);
}
};


	

	在上述代码中，如果Type在栈上，则会导致segment fault，堆上视实际情况(如果在对象在堆上生成，那么使用合理的话，是允许的)。

	只管理堆上的对象

	
voidfun(){
Typet;
std::shared_ptrptr(&t);
};


	

	在上述代码中，t在栈上进行分配，在出作用域的时候，会自动释放。而ptr在出作用域的时候，也会调用delete释放t，而t本身在栈上，delete一个栈上的地址，会造成segment fault。

	优先使用unique_ptr

	根据业务场景，如果需要资源独占，那么建议使用unique_ptr而不是shared_ptr，原因如下：

	性能优于shared_ptr

	因为shared_ptr在拷贝或者释放时候，都需要操作引用计数

	内存占用上小于shared_ptr

	shared_ptr需要维护它指向的对象的线程安全引用计数和一个控制块，这使得它比unique_ptr更重量级

	使用make_shared初始化

	我们看下常用的初始化shared_ptr两种方式，代码如下：

	
std::shared_ptrp1=newType;
std::shared_ptrp2=std::make_shared();


	

	那么，上述两种方法孰优孰劣呢？我们且从源码的角度进行分析。

	第一种初始化方法，有两次内存分配：

	new Type分配对象

	为p1分配控制块(control block)，控制块用于存放引用计数等信息

	我们再看下make_shared源码：

	
templateinline
shared_ptr<_Ty>make_shared(_Types&&..._Args)
{//makeashared_ptr
_Ref_count_obj<_Ty>*_Rx=
new_Ref_count_obj<_Ty>(_STDforward<_Types>(_Args)...);

shared_ptr<_Ty>_Ret;
_Ret._Resetp0(_Rx->_Getptr(),_Rx);
return(_Ret);
}


	

	这里的_Ref_count_obj类包含成员变量:

	控制块

	一个内存块，用于存放智能指针管理的资源对象

	再看看_Ref_count_obj的构造函数:

	
template
_Ref_count_obj(_Types&&..._Args)
:_Ref_count_base()
{//constructfromargumentlist
::new((void*)&_Storage)_Ty(_STDforward<_Types>(_Args)...);
}


	

	此处虽然也有一个new操作，但是此处是placement new，所以不存在内存申请。

	从上面分析我们可以看出，第一种初始化方式(new方式)共有两次内存分配操作，而第二种初始化方式(make_shared)只有一次内存申请，所以建议使用make_shared方式进行初始化。

	结语

	智能指针的出现，能够使得开发者不需要关心内存的释放，进而使得开发者能够将更多的精力投入到业务上。但是，因为智能指针本身也有其局限性，如果使用不当，会造成意想不到的后果，所以，在使用之前，需要做一些必要的检查，为了更好地用好智能指针，建议看下源码实现，还是比较简单的。

	   审核编辑：彭静