Linux上下文切换监控

zhangferry 8年前
   <p>我们在监测Linux的应用的时候,当CPU的利用率非常高,但是系统的性能却上不去的时候,不妨监控一下线程/进程的切换,看看是不是context switching导致的overhead过高。</p>    <p>一般我使用 dstat 工具用来监控,比如 dstat -y :</p>    <pre>  ---system--  intcsw  367561  274439  279363  </pre>    <p>或者 vmstat 3 :</p>    <pre>  [root@colobusmallnest]#vmstat3  procs-----------memory-------------swap-------io------system-------cpu-----  rbswpdfreebuffcachesisobiboincsussyidwast  000312619231692152161200176325166258119630  </pre>    <p>但是如何知道那些进程/线程做切换能,淘宝褚霸有篇文章: <a href="/misc/goto?guid=4959670385697925549" rel="nofollow,noindex">latencytop深度了解你的Linux系统的延迟</a> 介绍了一种方法。事实上,有一个工具 pidstat ,可以用来监控上下文切换。 它是 <a href="/misc/goto?guid=4959670385786181793" rel="nofollow,noindex">sysstat</a> 包其中的一个工具,sysstat包含好几个很棒的工具,比如sar、iostat等。</p>    <p>执行 pidstat -w</p>    <pre>  root@abcsmallnest]# pidstat -w  Linux2.6.32-358.el6.x86_64 (abc)04/11/2016_x86_64_(2CPU)    11:25:00PMPIDcswch/s nvcswch/sCommand  11:25:00PM10.600.03init  11:25:00PM20.040.00kthreadd  11:25:00PM30.360.00migration/0  11:25:00PM40.580.00ksoftirqd/0  11:25:00PM50.010.00migration/0  11:25:00PM60.080.00watchdog/0  11:25:00PM70.390.00migration/1  11:25:00PM80.010.00migration/1  11:25:00PM90.520.00ksoftirqd/1  ……  </pre>    <p>cswch/s 是主动地上下文切换, nvcswch/s 是被动执行上下文切换的次数。</p>    <p>如要要显示线程的上下文切换统计,可以执行``:</p>    <pre>  [root@abc allnest]# pidstat -wt  Linux 2.6.32-358.el6.x86_64 (abc)04/11/2016_x86_64_ (2CPU)    11:27:57PM TGID TID cswch/s nvcswch/s Command  11:27:57PM1-0.560.03init  11:27:57PM -10.560.03|__init  11:27:57PM2-0.030.00kthreadd  11:27:57PM -20.030.00|__kthreadd  11:27:57PM3-0.340.00migration/0  11:27:57PM -30.340.00|__migration/0  11:27:57PM4-0.570.00ksoftirqd/0  11:27:57PM -40.570.00|__ksoftirqd/0  11:27:57PM5-0.010.00migration/0  ……  </pre>    <p>更多的参数可以 man pidstat 获得。</p>    <p> </p>    <p>来自: <a href="/misc/goto?guid=4959670385872112484" rel="nofollow">http://colobu.com/2016/04/12/context-switching-monitor/</a></p>