正确使用多线程同步锁@synchronized()

FernandoHer 7年前
   <p>在上篇多线程安全的文章中,我曾推荐过大家使用@synchronized来使得代码获得原子性,从而保证多线程安全。这篇文章向大家介绍一些@synchronized的知识点和应该避免的坑。</p>    <h3><strong>@synchronized原理</strong></h3>    <p>@synchronized是几种iOS多线程同步机制中最慢的一个,同时也是最方便的一个。</p>    <p>苹果建立@synchronized的初衷就是方便开发者快速的实现代码同步,语法如下:</p>    <pre>  <code class="language-objectivec">@synchronized(obj) {    //code  }</code></pre>    <p>为了加深理解,我们刨一刨代码看看@synchronized到底做了什么事。我在一个测试工程的main.m中写了一段代码:</p>    <pre>  <code class="language-objectivec">void testSync()  {      NSObject* obj = [NSObject new];      @synchronized (obj) {        }  }</code></pre>    <p>然后在Xcode中选择菜单Product->Perform Action->Assemble "main.m",就得到了如下的汇编代码:</p>    <p><img src="https://simg.open-open.com/show/40f6a39a9fd0ec9b2e66ad27c0a69b27.png"></p>    <p>上图中我将关键代码用红线标出了,很容易就定位到了我们的目标代码。</p>    <p>ARC帮我们插入的retain,release也在其中:),我们感兴趣的部分是下面两个函数:</p>    <pre>  <code class="language-objectivec">bl    _objc_sync_enter  bl    _objc_sync_exit</code></pre>    <p>这两个函数应该就是synchronized进入和退出的调用,下面去Objective C的源码里找找 :)</p>    <p>在源码中一搜,很快就发现了这两个函数:</p>    <pre>  <code class="language-objectivec">// Begin synchronizing on 'obj'.   // Allocates recursive mutex associated with 'obj' if needed.  // Returns OBJC_SYNC_SUCCESS once lock is acquired.    int objc_sync_enter(id obj)  {      int result = OBJC_SYNC_SUCCESS;        if (obj) {          SyncData* data = id2data(obj, ACQUIRE);          assert(data);          data->mutex.lock();      } else {          // @synchronized(nil) does nothing          if (DebugNilSync) {              _objc_inform("NIL SYNC DEBUG: @synchronized(nil); set a breakpoint on objc_sync_nil to debug");          }          objc_sync_nil();      }        return result;  }      // End synchronizing on 'obj'.   // Returns OBJC_SYNC_SUCCESS or OBJC_SYNC_NOT_OWNING_THREAD_ERROR  int objc_sync_exit(id obj)  {      int result = OBJC_SYNC_SUCCESS;        if (obj) {          SyncData* data = id2data(obj, RELEASE);           if (!data) {              result = OBJC_SYNC_NOT_OWNING_THREAD_ERROR;          } else {              bool okay = data->mutex.tryUnlock();              if (!okay) {                  result = OBJC_SYNC_NOT_OWNING_THREAD_ERROR;              }          }      } else {          // @synchronized(nil) does nothing      }        return result;  }</code></pre>    <p>从上述源码中,我们至少可以确立两个信息:</p>    <ul>     <li><strong>synchronized是使用的递归mutex来做同步。</strong></li>     <li><strong>@synchronized(nil)不起任何作用</strong></li>    </ul>    <p>递归mutex的意思是,我们可以写如下代码:</p>    <pre>  <code class="language-objectivec">@synchronized (obj) {      NSLog(@"1st sync");      @synchronized (obj) {          NSLog(@"2nd sync");      }  }</code></pre>    <p>而不会导致死锁。我顺道扒了下java当中的synchronized关键字,发现也是使用的递归锁,看来这是个common trick。recursive mutex其实里面还是使用了pthread_mutex_t,只不过多了一层ownership的判断,性能上比非递归锁要稍微慢一些。</p>    <p>@synchronized(nil)不起任何作用,表明我们需要适当关注传入的object的声明周期,一旦置为nil之后就无法做代码同步了。</p>    <p>我们再看看传入的obj参数有什么作用。</p>    <p>继续看代码发现传入的obj被用作参数来获取SyncData对象,里面有一大段关于SyncData的cache逻辑,有兴趣的同学可以自己看下代码,这是一个两层的cache设计,第一层是tls cache,第二层是自己维护的一个hash map。这里将流程简化,来看下obj是如何在hash map中缓存的。</p>    <p>先看下SyncData获取的方式:</p>    <pre>  <code class="language-objectivec">SyncData **listp = &LIST_FOR_OBJ(object);</code></pre>    <p>而LIST_FOR_OBJ又指向:</p>    <pre>  <code class="language-objectivec">#define LIST_FOR_OBJ(obj) sDataLists[obj].data  static StripedMap<SyncList> sDataLists;</code></pre>    <p>再看下StripedMap的实现就很清楚了:</p>    <pre>  <code class="language-objectivec">static unsigned int indexForPointer(const void *p) {      uintptr_t addr = reinterpret_cast<uintptr_t>(p);      return ((addr >> 4) ^ (addr >> 9)) % StripeCount;  }    public:  T& operator[] (const void *p) {       return array[indexForPointer(p)].value;   }</code></pre>    <p>indexForPointer中使用了obj的内存地址,做了个简单的map,映射到另一个内存空间来存放SyncList。</p>    <p>通过上述分析,我们可以得出结论了:</p>    <p>synchronized中传入的object的内存地址,被用作key,通过hash map对应的一个系统维护的递归锁。</p>    <p>以上就是object的用处,所以不管是传入什么类型的object,只要是有内存地址,就能启动同步代码块的效果。</p>    <p>消化完synchronized的内部实现,我们再来看看平常使用中常见的一些坑。</p>    <h3><strong>慎用@synchronized(self)</strong></h3>    <p>我其实更想说:不要使用@synchronized(self)。</p>    <p>我看过不少代码都是直接将self传入@synchronized当中,这是种很粗糙的使用方式,容易导致死锁的出现。比如:</p>    <pre>  <code class="language-objectivec">//class A  @synchronized (self) {      [_sharedLock lock];      NSLog(@"code in class A");      [_sharedLock unlock];  }    //class B  [_sharedLock lock];  @synchronized (objectA) {      NSLog(@"code in class B");  }  [_sharedLock unlock];</code></pre>    <p>原因是因为self很可能会被外部对象访问,被用作key来生成一锁,类似上述代码中的 @synchronized (objectA) 。两个公共锁交替使用的场景就容易出现死锁。</p>    <p>所以正确的做法是传入一个类内部维护的NSObject对象,而且这个对象是对外不可见的。</p>    <h3><strong>精准的粒度控制</strong></h3>    <p>有些人说@synchronized慢,但@synchronized和其他同步锁的性能相比并没有很夸张,对于使用者来说几乎忽略不计。</p>    <p>之所以慢是更多的因为没有做好粒度控制。锁本质上是为了让我们的一段代码获得原子性,不同的critical section要使用不同的锁。我见过很多类似的写法:</p>    <pre>  <code class="language-objectivec">@synchronized (sharedToken) {      [arrA addObject:obj];  }    @synchronized (sharedToken) {      [arrB addObject:obj];  }</code></pre>    <p>使用同一个token来同步arrA和arrB的访问,虽然arrA和arrB之间没有任何联系。传入self的就更不对了。</p>    <p>应该是不同的数据使用不同的锁,尽量将粒度控制在最细的程度。上述代码应该是:</p>    <pre>  <code class="language-objectivec">@synchronized (tokenA) {      [arrA addObject:obj];  }    @synchronized (tokenB) {      [arrB addObject:obj];  }</code></pre>    <h3><strong>注意内部的函数调用</strong></h3>    <p>@synchronized还有个很容易变慢的场景,就是{}内部有其他隐蔽的函数调用。比如:</p>    <pre>  <code class="language-objectivec">@synchronized (tokenA) {      [arrA addObject:obj];      [self doSomethingWithA:arrA];  }</code></pre>    <p>doSomethingWithA内部可能又调用了其他函数,维护doSomethingWithA的工程师可能并没有意识到自己是被锁同步的,由此层层叠叠可能引入更多的函数调用,代码就莫名其妙的越来越慢了,感觉锁的性能差,其实是我们没用好。</p>    <p>所以在书写@synchronized内部代码的时候,要十分小心内部隐蔽的函数调用。</p>    <h3><strong>总结</strong></h3>    <p>看似简单的API调用,背后其实包含了不少知识,知其所以然才能运用得当。关于@synchronized(xxx)就介绍到这里,希望有将synchronized解释清楚:)</p>    <p> </p>    <p>来自:http://www.jianshu.com/p/2dc347464188</p>    <p> </p>