服务器端资源监控指标


服务器端 资源监控指标 组件 1:Unix 平台服务器操作系统(CPU) 序号 指标名称(中英文) 指标理解 建议值 访问方式 瓶颈判断 l 显示了用户方式下所花费 CPU 时间的 百分比。 l 用户使用 CPU 的进程包括: CPU 运行常规用户进程 CPU 运行 niced process CPU 运行实时进程 监控工具: Loadrunner Quest 等 下述指标使用监控 工具同此 1 l %usr l us l user mode cpu utilization 注解: 一个 UNIX 进程可以在用户方式下执行,也可 以在系统(内核)方式下执行。当在用户方式 下执行时,进程在它自己的应用程序代码中执 行,不需要内核资源来进行计算、管理内存或 设置变量。 2 l %sys l sy l system mode cpu utilization l 显示了系统方式下所花费 CPU 时间的 百分比。这包括内核进程( kprocs)和其 它需要访问内核资源的进程所消耗的 CPU 资源。 l 系统使用 CPU 的进程包括: 用于系统调用 用于I/O 管理:中断和驱动 用于内存管理:paging and swapping 合理值:60-85% 监控命令: sar –u vmstat l 如果在一个多用户系统中 us + sy 时间超过 85%,则 进程可能要花时间在运行队 列中等待,响应时间和业务 吞吐量会受损害; l us 过大,说明有用户进程占 用很多 CPU 时间,需要进一 步的分析其它软硬件因素; l sy 过大,说明系统管理方面 花了很多时间。需要进一步 的分析其它软硬件因素。 PDF 文件使用 "pdfFactory Pro" 试用版本创建 www.fineprint.com.cn 用 于 进程管理:context switch and process start 注解: 如果一个进程需要内核资源,它 必须执行一个 系统调用,并由此切换到系统方式从而使该资 源可用。 l 显示了暂挂本地磁盘 I/O 和 NFS 加载 的磁盘的 CPU 空闲百分比, 是由于进 程等待 I/O 而使 CPU 处于空闲状态的比 率。 l I/O 主 要包括 block I/O,raw I/O,VM paging/swapins 3 l wa l iowait 注解: 如果在 wait 运行时至少有一个未完成的磁 盘 I/O,该时间就归为 I/O 等待时间。对磁 盘的 I/O 请求会导致调用的进程阻塞(或睡 眠), 直到请求完成为止。一旦进程的 I/O 请 求完成,该进程就放入运行队列中。如果 I/O 很快完成,该进程可以使用更多的 CPU 时 间。 小于 25% 监控命令: sar –u vmstat iostat l 超过 25% 的 wa 的值可以 表示磁盘子系统可能没有被 正确平衡; l 也可能是磁盘密集工作负载 的结果; l 系统的磁盘或其他 I/O 可能 有问题; l 可调用 iostat/SAR -C 命令对 系统调用进行进一步分解。 PDF 文件使用 "pdfFactory Pro" 试用版本创建 www.fineprint.com.cn 是除了上面的 WIO 以外的空闲情况,显示了 没有本地磁盘 I/O 时 CPU 空闲或等待的时 间百分比。 4 l idle l id 注解: 如果没有线程可以执行(运行队列为空),系 统分派一个叫做 wait 的线程,也称为 idle kproc。如果 ps 报告显示这个线程的总计时 间较高,这表明存在时间段,其中没有其它线 程准备在 CPU 上运行或等待执行。系统因此 大部分时间空闲和等待新任务。 大于 40 监控命令: Vmstat iostat 如果 r经常大于 4 ,且 id 经常少 于 40,表示 cpu 的负荷很重 运行进程队列的长度。 5 l runq-sz l r 注解: 即处于可运行状态的进程个数的大小,这 些 进 程在内存中准备就绪 小于 4 监控命令: sar –q vmstat l 队列大于 4 时,表明系统的 CPU 或内存可能有问题,如 果 r经常大于 4 ,且 id 经常 少于 40,表示 cpu 的负荷很 重; l 当队列变长时,队列中进程 在等待 CPU 调度执行时所花 的时间变长。 VMM 队列中的进程长度,这些进程被交换出 去但已准备就绪 6 l Swpq-sz l w 注解: VMM 指 Virtual Machine Monitor,实 际的 硬件 平台通过 VMM 与各虚拟机打交道。虚拟技术 是指在一个 CPU 上运行多个操作系统,同时 小于 5 监控命令: sar –q vmstat 当队列变长时,队列中进程在等待 CPU 调度执行时所花的时间变长 PDF 文件使用 "pdfFactory Pro" 试用版本创建 www.fineprint.com.cn 又能在多个操作系统上运行多个程序 名词解释: l 用户级:系统用户可以与操作系统进行交互操作,如运行应用和系统命令。用户级通过系统调用接口访问内核级。 l 内核级:操作系统自动运行一些功能,它们主要对硬件进行操作。 使用命令: sar –q:查看系统的运行进程队列和交换队列长度 runq-sz: Average length of the run queue(s) of processes (in memory and runnable) %runocc: The percentage of time the run queue(s) were occupied by processes (in memory and runnable); swpq-sz: Average length of the swap queue of runnable processes (processes swapped out but ready to run); %swpocc: The percentage of time the swap queue of runnable processes (processes swapped out but ready to run) was occupied. fork/s: Number of fork() and/or vfork() system calls per second; exec/s: Number of exec() system calls per second; rchar/s: Number of characters transferred by read system calls block devices only) per second; wchar/s: Number of characters transferred by write system calls (block devices only) per second. SAR -c: Report system calls: scall/s: Number of system calls of all types per second; sread/s: Number of read() and/or readv() system calls per second; swrit/s: Number of write() and/or writev() system calls per second; 命令使用经验: l 如果 scall/s 列的值很大,那么这么多的系统调用的原因就必须仔细分析了。 l 可以查看 fork/s 和 exec/s 列的值,看看系统是否在创建大量新的进程。 l 用time 命令测试某个命令和程序的执行效率 l 可以利用 time 命令来测试一个命令的执行效率,语法为:time command l 可以利用 top 命令来查看最耗 CPU 资源的进程。top 命令还会根据进程占用 CPU 资源的多少而动态改变。 l 它的语法为:top [-s time] [-d count] [-q] [-u] [-h] [-n number] PDF 文件使用 "pdfFactory Pro" 试用版本创建 www.fineprint.com.cn 判断瓶颈的方法以及调优方案: l CPU 资源成为系统性能的瓶颈的征兆 : 很慢的响应时间(slow response time) CPU 空闲时间为零(zero percent idle CPU) 过高的用户占用 CPU 时间(high percent user CPU) 过高的系统占用 CPU 时间(high percent system CPU) 长时间的有很长的运行进程队列(large run queue size sustained over time) processes blocked on prority 必须注意的是,如果系统出现上面的这些症状并不能说一定是由于 CPU 资源不够,事实,有些症状 的出现很可能是由于其他资源的不足而引起,如内存不够时,CPU 会忙 内存管理的事,这时从表面上, CPU 的利用是 100%,甚至显得不够,如果据此就简单地认为增加 CPU 就可以解决问题是大错特错了。对 CPU 需求密集型系统的性能调试 l 调优方法: 1) 基于硬件的方法: 升级到更快的CPU; 升级到更大的高速缓存; 增加 CPU 个数; 把应用分布到多个系统中; 使用无盘结点; 增加浮点处理器; 2) 基于软件的方法: 在不是高峰时间运行批处理; Nice umimportant application; 使用 rtpio 命令来帮助重要的应用; 使用 plock 命令来帮助重要的应用; Turn off system accounting; Consider using Taskbroker or DCE; 优化应用; PDF 文件使用 "pdfFactory Pro" 试用版本创建 www.fineprint.com.cn 组件 1:Unix 平台服务器操作系统(Memory) 序号 指标名称(中英文) 指标理解 建议值 访问方式 瓶颈判断 1 buffer cache size 在 windows 操作系统中有,需要查明 page in的平均值大于80表示物理 内存不足。 2 l page out/in rates l po/pi l paging-out/in rate page out 是每秒钟写入页面文件(在 硬盘)中和从物理内存删除的页数, page in 是读入物理内存的页数 0 监控命令: Sar Vmstat loadrunner HP-UX 是一个按需调页的操作系 统,通常情况下,它只执行调入页 面进入内存的操作,以 让 进程能够 运行。只有操作系统觉得系统需要 释放一些内存空间时,才会执行从 内存调出页面的操作,而过高的调 出页面操作说明内存缺乏 PDF 文件使用 "pdfFactory Pro" 试用版本创建 www.fineprint.com.cn fre 显示出空闲内存页面的平均数量。 一个页面是实内存中的 4 KB 的区 域。 3 fre 注解: l VMM 在空闲列表上保存的最 少页面数由 vmtune 命令的 minfree 参数决定; l 当一个应用程序终止时,它所有 的工作页面会立即返回给空闲 列表。然而,它的持久页面(或 文件)仍然在 RAM 中,不 会 添 加 回 空闲列表中,直到由 VMM 窃取用于其它程序为止。如果删 除相应的文件,也 会 释 放 其 持久 页面; l fre 的值可能不表示进程可以使 用的所有实内存。如果需要页 帧,那与已终止应用程序相关的 持久页面将会最先移交给另一 个程序。 fre 的 值大于 maxfree 的值 监控命令: Vmstat 如果 fre 的值远大于 maxfree 的 值,那不太可能出现系统颠簸。系 统 颠簸意味着系统一直在进行页 面调进调出。然而,如果系统正在 经历抖动,可以肯定 fre 值很小。 PDF 文件使用 "pdfFactory Pro" 试用版本创建 www.fineprint.com.cn 活动虚拟内存 avm 列显示在收集 vmstat 样本时存在的活动虚拟内存 页面数。 4 avm 注解: 缺省策略为延迟页面空间策略。在该 策略下,avm 的值可能比使用的调页 空间页面数要高。avm 统计信息并不 包含文件页面。 ? 监控命令: vmstat 名词解释: 按用途来分,内存可以分成两部分:预留内存和动态内存。 l 预留内存主要用于存放: system table data structures buffer cache 其中系统表和数据结构占用的数量一般很小,但缓存则可能占到很大一部分。 l 动态内存主要用于存放: PDF 文件使用 "pdfFactory Pro" 试用版本创建 www.fineprint.com.cn process text data stack share memory segments 其中各进程锁定的内存会影响动态内存的大小。 使用命令: l 利用 vmstat 命令分析内存的利用率 vmstat-report virtual memory statistics ;The vmstat command reports certain statistics kept about process, virtual memory, trap, and CPU activity. It also can clear the accumulators in the kernel sum structure. 它的语法: vmstat [-dnS] [interval [count]] vmstat -f | -s | -z 它的选项的说明: -d: Report disk transfer information as a separate section, in the form of transfers per second. -n: Provide an output format that is more easily viewed on an 80-column display device. This format separates the default output into two groups: virtual memory information and CPU data. Each group is displayed as a separate line of output. On multiprocessor systems, this display format also provides CPU utilization on a per CPU basis. -S: Report the number of processes swapped in and out (si and so) instead of page reclaims and address translation faults (re and at) interval: Display successive lines which are summaries over the last interval seconds. If interval is zero, the output is displayed once only. If the -d option is specified, the column headers are repeated. If -d is omitted, the column headers are not repeated. count: Repeat the summary statistics count times. If count is omitted or zero, the output is repeated until an interrupt or quit signal is received. -f: Report on the number of forks and the number of pages of virtual memory involved since boot-up. -s: Print the total number of several kinds of paging- related events from the kernel sum structure that have occurred since boot-up or since vmstat was last executed with the -z option. -z: Clear all accumulators in the kernel sum structure. This option is restricted to the super user. 命令使用经验: 在不带参数的 vmstat 的命令时,我们首先要关注的是 avm(active virtual memory)列和 free(free list zise)列的值。如果 avm 的值很大,而 free 的值却很小,这时,系统可能 有内存瓶颈,我们 必须用带-S 选项的 vmstat 命令查看系统是否有 deactivation/reactivation 活动正在发生。 判断瓶颈的方法以及调优方案: 当内存资源成为系统性能的瓶颈时,它有一些典型的症状: PDF 文件使用 "pdfFactory Pro" 试用版本创建 www.fineprint.com.cn l 很高的换页率(high pageout rate):HP-UX 是一个按需调页的操作系统,通常情况下,它只执行调入页面进入内存的操作,以让进程能够运行。只有操作系统觉得系统需 要释放一些内存空间时,才会执行从内存调出页面的操作,而过高的调出页面操作说明内存缺乏; l 进程进入不活动状态(process deactivation activity):当自由的内存页面数量小于 MINFREE 时,很多进程将强制进入不活动状态 l 自由内存的数量很小,但活动的虚拟内存却很大(very small free memory and large active virtual memory) l 交换区所有磁盘的活动次数可高(high disk activity on swap devices) l 很高的全局系统 CPU 利用率(high global system CPU utilization): l 很长的运行进程队列,但 CPU 的空闲时间却很多(large run queue with idle CPU) l 内存不够出错(out of memory errors) l CPU 用于 vhand 和 swapper 两中守护进程的时间(CPU time to vhand and swapper) 必须注意的是,有时候我们发现 CPU 很忙,这似乎是 CPU 资源成为系统性能的瓶颈,但如果进一步分析,发现 vhand 和 swapper 守护进程占用了大量的系统 CPU 时间, 很显然,这时系统性能瓶颈真正所在可能是内存。 调优: 对内存需求密集型系统的性能调试 1) 基于硬件的方法: 增加物理内存 使用无盘工作站替代 X-terminal 2) 基于软件的方法: 减小内核参数 maxdsiz 的值; 减少内存锁定的使用; 杀死不必要的进程; 识别出需要大量内存的进程; 重新设计应用; 减小内核的大小; 减小系统表的大小; 减小缓存区的大小; PDF 文件使用 "pdfFactory Pro" 试用版本创建 www.fineprint.com.cn 组件 1:Unix 平台服务器操作系统(磁盘 I/O) 序号 指标名称(中英文) 指标理解 建议值 访问方式 瓶颈判断 1 %util %busy %disk time 一秒中设备有百分之多少的时间用于 I/O 操作,或者说一秒中有多少时间 I/O 队列是非空的 50% 监控命令: Iostat –x sar -d l 如果某个磁盘的%busy 列的 值大于 50%,则说明该磁盘 可能存在瓶颈; l 如果 %util 接近 100%,说 明产生的 I/O 请求太多,I/O 系统已经满负荷,该磁盘存 在瓶颈。 2 await(毫秒)+ svctm(毫 秒) avwait+ avserv 平均每次设备 I/O 操作的等待时间 平均每次设备 I/O 操作的服务时间 await 接近 svctm await 接近 avserv 监控命令: Iostat –x sar -d await 远大于 svctm 或 avserv,说 明 I/O 队列太长,应用响应时间 变慢, 该磁盘可能存在瓶颈 3 disk + b b 表示在等待 io 的进程数 disk 显示每秒的磁盘操作 b 小于 3 监控命令: vmstat 如果 disk 经常不等于 0, 且在 b 中的队列 大于 3, 表示 io 性能 不好 使用命令: l iostat [-t] [interval [count]] 其选项的含义为: -t:Report terminal statistics as well as disk statistics. interval: Display successive lines which are summaries of the last interval seconds. The first line reported is for the time since a reboot and each subsequent line is for the last interval only. count: Repeat the statistics count times. l 命令 sar -d,我们可以分析系统中的每个磁盘和磁带的活动情况。 每行结果数值如下: device:设备名; PDF 文件使用 "pdfFactory Pro" 试用版本创建 www.fineprint.com.cn %busy: Portion of time device was busy servicing a request; statistics. avque: Average number of requests outstanding for the device; r+w/s: Number of data transfers per second (read and writes) from and to the device; blks/s: Number of bytes transferred (in 512-byte units) from and to the device; avwait: Average time (in milliseconds) that transfer requests waited idly on queue for the device; avserv: Average time (in milliseconds) to service each transfer request (includes seek, rotational latency, and data transfer times) for the device. 判断瓶颈的方法以及调优方案: l 当 I/O 成为瓶颈时,会出现下面这些典型的症状: 过高的磁盘利用率(high disk utilization) 太长的磁盘等待队列(large disk queue length) 等待磁盘 I/O 的时间所占的百分率太高(large percentage of time waiting for disk I/O) 太高的物理I/O 速率:large physical I/O rate(not sufficient in itself) 过低的缓存命中率(low buffer cache hit ratio(not sufficient in itself)) 太长的运行进程队列,但 CPU 却空闲(large run queue with idle CPU) l 下面是一些占用大量 I/O 资源的活动: 换页(paging):paging 不仅会引起内存问题,还可能引起磁盘问题; open,creat,and stat system calls:系统调用会引起大量的磁盘 I/O; multiuser I/O and random I/O relational database core dumps 必须注意的是,有时候我们发现 CPU 很忙,这似乎是 CPU 资源成为系统性能的瓶颈,但如果进一步分析,发现 vhand 和 swapper 守护进程占用了大量的系统 CPU 时间, 很显然,这时系统性能瓶颈真正所在可能是内存。 PDF 文件使用 "pdfFactory Pro" 试用版本创建 www.fineprint.com.cn 组件 2:Windows 平台服务器操作系统 序号 指标名称(中英文) 指标理解 建议值 访问方式 瓶颈判断 内存 1 Available MBytes 物理内存的可用数(单位 Mbytes) 不小于 0 有时物理内存的可用数很大,但已 经被预占,所以仍然报物理内存不 足 l Page Faults/sec 是处理器每秒钟 处理的错误页(包括软错误和硬 错误);Pages Input/sec 是为了 解决硬错误页,从硬盘上读取的 页数; l Page Reads/sec 是为了解决硬错 误,从硬盘读取的次数; l Pages/sec 是指为解析硬页错误 从磁盘读取或写入磁盘的页数。 2 Page Faults/sec Page Reads/sec Pages/sec 注解: 当处理器向内存指定的位置请求一页 (可能是数据或代码)出现错误时, 这就构成一个 Page Fault。如果该页在 内存的其他位置,该错误被称为软错 误(用 Transition Fault/sec 计数器衡 量);如果该页必须从硬盘上重新读取 时,被称为硬错误。许多处理器可以 在有大量软错误的情况下继续操作。 l Page Reads/Sec 比 率 持 续 小 于 5; l Pages/sec 推荐 00-20。 监控工具: Loadrunner Quest l 如果 Page Reads/Sec 比率持 续保持为 5,表示可能物理内 存不足; l 如果服务器没有足够的内存 处理其工作负荷,Pages/sec 此数值将一直很高。如果大 于 80,表示有问题。 PDF 文件使用 "pdfFactory Pro" 试用版本创建 www.fineprint.com.cn 但是,硬错误可以导致明显的拖延。 3 Private Bytes+ Working Set Private Bytes 指这个处理不能与其 他处理共享的、已分配的当前字节数。 working Set 计数器反映了每个进程 使用的内存页的数量。 系统的内存页(poolPage)只能由操 作系统的核心模块直接访问,用户进 程不能访问。 如果 Process\Private Bytes 计数 器和 Process\Working Set 计数器 的值在长时间内持续升高,同时 Memory\Available bytes 计数器的 值持续降低,则很可能存在内存泄 漏。 4 File Cache Hits %+ File Cache Flushes+ File Cache Hits File Cache Hits %是文件缓存命 中全部缓存需求的比例,反映了 IIS 的文件缓存设置的工作情 况; File Cache Hits 是文件缓存命中 的具体值; File CacheFlushes 是自服务器 启动之后文件缓存刷新次数,如 果刷新太慢,会浪费内存;如果 刷新太快,缓存中的对象会太频 繁的丢弃生成,起不到缓存的作 FileCache Hits% 在 80%左右属于合理范围 ( 对于一个大部分是 静态网页组成的网站) PDF 文件使用 "pdfFactory Pro" 试用版本创建 www.fineprint.com.cn 用。 注解: 通过 File Cache Hits 和 File Cache Flushes 可以得到一个适当的刷新值 (参考 IIS 的设置 ObjectTTL 、 MemCacheSize 、MaxCacheFileSize) 是指以字节表示的确认虚拟内存。 5 CommittedBytes 注解: 确认内存是指为磁盘分页文件在磁盘 上保留的空间以便在需要将其写回磁 盘时使用。 推荐不超过物理内存 的 75% CPU 1 Processor Queue Length Processor Queue Length 是指处理列 队中的线程数。 小于 2 l 如果 Processor Queue Length 显示的队列长度保 持不变(>=2)个并且处理器 的 利 用 率 %Processor Time PDF 文件使用 "pdfFactory Pro" 试用版本创建 www.fineprint.com.cn 注解: l 即使在有多个处理器的计算机 上处理器时间也会有一个单列 队; l 不象磁盘计数器,这个计数器仅 计数就绪的线程,而不计数运行 中的线程。 平均值超过 85%,那么很有可 能存在处理器瓶颈。 l 如果处理器列队中总是有两 个以上的线程,而处理器利 用率(Processor Time)一 直很低,则存在着处理器阻 塞。 CPU 使用率。 2 %Processor Time CPU 注解: 这是查看处理器饱和状况的最佳计数 器。显示 CPU 的所有线程处理时间。 小于 75% l 如果一个或多个处理器该值 的平均值超过 85%,则表示此 测试的负载对于目前的硬件 过于沉重; l 排除内存因素,如果该计数 器的值比较大,而同时网卡 和硬盘的值比较低,那么可 以确定 CPU 瓶颈。 3 ContextSwitches/sec Context Switches/sec 指计算机上 的所有处理器全都从一个线程转换到 另一个线程的综合速率。 小于 5000*CPU 个数 l 如果切换次数到5000*CPU个 数和10000*CPU个数中,说明 它忙于切换线程而不是处理 ASP 脚本; l 如果系统的吞吐量降低并且 CPU 的使用率很高,并且此 现象发生时切换水平在 PDF 文件使用 "pdfFactory Pro" 试用版本创建 www.fineprint.com.cn 注解: 当正在运行的线程自动放弃处理器时 出现上下文转换,由一个有更高优先 就绪的线程占先或在用户模式和特权 (内核)模式之间转换以使用执行或分 系统服务。它是在计算机上的所有处 理器上运行的所有线程的 Thread: Context Switches/sec 的总数并且 用转换数量衡量。在系统和线程对象 上有上下文转换计数器。 15000 以上,那么意味着上 下文切换次数过高; l 同时还可以比较Context Switches/sec 和 %Privileged Time 来判断上 下文切换是否过量。如果后 者的值超过40%,且上下文切 换的速率也很高,那么应该 检查为什么会产生这样高的 上下文切换 这两个计数器能够反映处理器用在处 理中断以及推迟处理调用的时间。 Interrupts/sec 指处理器每秒钟接 收并维护的硬件中断的平均值。 4 Interrupts/sec %DPC Time 注解: 正常的线程操作在中断时悬停。大多 数的系统时钟每隔 10 毫秒中断处理 器一次,形成了间隔活动的后台。 如果处理器使用率超过 85% 且 %InterruptTime 大于 15%,则处理 器可能负荷过重,并发生中断。 Disk 1 %Disk Time % Privileged Time l %Disk Time 指所选磁盘驱动器 忙于为读或写入请求提供服务 所用的时间的百分比。 l % Privileged Time 是在特权模 式下处理线程执行代码所花时 间的百分比。 l 如果三个计数器%Disk Time、 %Processor Time 、 % Privileged Time 都比较大, 那么硬盘不是瓶颈。如果只 有%Disk Time 比较大,另外 两个都比较适中,硬盘可能 PDF 文件使用 "pdfFactory Pro" 试用版本创建 www.fineprint.com.cn 注解: 当调用 Windows 系统服务时,此服务 经常在特权模式运行,以便获取对系 统专有数据的访问。在用户模式执行 的线程无法访问这些数据。对系统的 调用可以是直接的(explicit)或间接 的(implicit),例如页面错误或中断。 不像某些早期的操作系统,Windows 除了使用用户和特权模式的传统保护 模式之外,还使用处理边界作为分系 统保护。某些由 Windows 为您的应用 程序所做的操作除了出现在处理的特 权时间内,还可能在其他子系统处理 出现。 会是瓶颈。 l 在记录该计数器之前,请在 Windows 2000 的命令行窗口 中运行 diskperf -yD。若数 值持续超过 80%,则可能是内 存泄漏。 2 Average Disk Queue Length Disk Reads/sec l Average Disk Queue Length 指 读取请求(为所选磁盘在实例间 隔中列队的)的平均数; l Disk Reads/sec 指在此盘上读 取操作的速率。 如果 Disk Time 和 Avg.Disk Queue Length 的值很高,而 Page Reads/sec 页面读取操作速率很 低,则可能存在磁盘瓶径。 network Bytes Total/sec 为发送和接收字节的 速率,包括帧字符在内。 1 Bytes Total/sec 注解; 判断网络连接速度是否是瓶颈,可以 用该计数器的值和目前网络的带宽比 该计数器的值和目前网络的带宽 相除,结果应该小于 50% PDF 文件使用 "pdfFactory Pro" 试用版本创建 www.fineprint.com.cn 较。 判断瓶颈的方法以及调优方案: l CPU 资源成为系统性能的瓶颈的征兆: 很慢的响应时间(slow response time) CPU 空闲时间为零(zero percent idle CPU) 过高的用户占用 CPU 时间(high percent user CPU) 过高的系统占用 CPU 时间(high percent system CPU) 长时间的有很长的运行进程队列(large run queue size sustained over time) l 内存资源成为系统性能的瓶颈的征兆: 很高的换页率(high pageout rate); 进程进入不活动状态; 交换区所有磁盘的活动次数可高; 可高的全局系统 CPU 利用率; 内存不够出错(out of memory errors) l I/O 资源成为系统性能的瓶颈的征兆 : 过高的磁盘利用率(high disk utilization) 太长的磁盘等待队列(large disk queue length) 等待磁盘 I/O 的时间所占的百分率太高(large percentage of time waiting for disk I/O) 太高的物理I/O 速率:large physical I/O rate(not sufficient in itself) 过低的缓存命中率(low buffer cache hit ratio(not sufficient in itself)) 太长的运行进程队列,但 CPU 却空闲(large run queue with idle CPU) PDF 文件使用 "pdfFactory Pro" 试用版本创建 www.fineprint.com.cn 组件 3:WAS(Websphere Application Server)服务器 序号 指标名称(中英文) 指标理解 建议值 访问方式 与客户端性能的关系 1 线程池 (thread pool) 线程池使服务器的组件能重用线程以 消除在运行时创建新线程的消耗,包 括时间和资源。 缺省值: 最小 10;最大 50 建议值: 最大 50(unix) 最小 25(linux) 上限: 最大 1000 主控台度量指标:服务器 > 管理应用程序服务器 > server_name > ORB 服务 > 线程池 Tivoli 度量指标:性能查 看器显示最大百分比度 量,最大百分比度量表明 使用已配置线程的时间 数。 LR 度量指标: activeThreads poolSize Threadscreates ThreadsDestroys 如果存在多个并发客户机连接到 服务器端 ORB,就需要考虑调整 此值的最大值 2 数据库连接池 (connection pool) 使用前提 可看到此资源定义的级别 - 单元、 节点或服务器级别,详见下述注解。 缺省值: 最小连接数 1 最大连接数 10 连接超时 180 秒 主控台度量指标:资源 > JDBC 提供程序 > JDBC_provider > 数据 源(V4) > data_source 最小池大小 可影响应用程序的性能。较小的池 在需求较低时需要较少的开销,因 为保持打开的数据库连接较少。当 PDF 文件使用 "pdfFactory Pro" 试用版本创建 www.fineprint.com.cn 最小和最大连接数 指定池中维护的最小连接数 指定池中维持的最大连接数 连接超时 指定在超时和向应用程序抛出 ConnectionWaitTimeoutException 前,应用程序等待池连接的最大秒数。 空闲超时 在除去空闲(未分配)连接以释放资 源之前,此空闲连接可保留在池中的 最长秒数。 孤立超时 指定在连接返回池之前,应用程序可 以保持此连接而不使用它的最大秒数 语句高速缓存大小 指定每个连接要保持的已高速缓存的 已准备语句数。 自动连接清除 指定在事务结束时,连接池软件是否 自动关闭来自此数据源的连接。 空闲超时 1800 秒 孤立超时 1800 秒 语句高速缓存大小 10 自动连接清除清除 建议值: 上限: > 连接池 Tivoli 度量指标: JDBC 连 接 池 ->Oracle JDBC Driver->jdbc/连接 池的名称下面的相关指 标 LR 度量指标: freePoolSize numCreates numDestorys poolSize 需求较高时,因为如果池中的所有 其它连接都在使用中,则创建新的 连接,所以第一个应用程序经历较 慢的响应。 最大池大小 如果已经达到了最大连接数并且 所有连接都在使用中,则其它连接 请求会最多等待指定为连接超时 的秒数。最大池大小会影响应用程 序的性能。较大的池在需求较高时 需要更多的开销,因为在需求高峰 时有更多的数据库连接打开。这 些 连 接 一 直 存 留 , 直到空闲而脱离 池。如果最大值较小,则在高峰期 会发生更长的等待时间或可能有 连接超时错误。确保数据库可支持 应用程序服务器中的最大连接数, 除了在应用程序服务器外可能有 的任何负载之外。 空闲超时 空闲的连接应该从池中脱离,因为 保持打开数据库连接会导致数据 库的内存问题。但是,并不是所有 的连接都会从池中脱离,即使它们 PDF 文件使用 "pdfFactory Pro" 试用版本创建 www.fineprint.com.cn 旧于“空闲超时”设置。如果除去连 接将导致池下降到它的最小大小 以下,则连接不是空闲的。这个值 设置为 0 将禁用空闲超时。 孤立超时 如果分配的连接上没有活动时间 长于“孤立超时”设置,则连接标记 为孤立。在另一个“孤立超时”秒数 后,如果连接仍然没有活动,则连 接返回池。如果应用程序尝试再次 使用连接,则它抛出 StaleConnectionException。加入 列表事务中的连接不是孤立的。这 个设置值为 0 将禁用孤立超时。 语句高速缓存大小 如果您不希望废弃任何高速缓存, 按以下设置需要的高速缓存大小 最大值:对于每个使用特殊服务器 上的数据源的应用程序,提高唯一 的已准备语句数(如同由 sql 字符 串、并发的和滚动类型所确定的那 样)。这是可能准备的语句的最大 数值,这 些语句可被高速缓存在服 务器活动期间给定的连接上。将高 速缓存大小设置为该值意味着您 PDF 文件使用 "pdfFactory Pro" 试用版本创建 www.fineprint.com.cn 不会再有高速缓存废弃的情况发 生。这 样 提供了更佳的性能。但是, 由于潜在的资源限制,这 种 情况不 会总是可行的。 自动连接清除 缺省为假,表明当事务完成时, WebSphere Application Server 关闭连接并将它返回到池。在 事 务 结 束 后 ,任 何连接的使用都导致一 个 StaleConnectionException,因 为连接关闭并已返回到池。这个机 制确保连接不被应用程序不限定 地保留。如果这个值设置为真,则 连接在事务结束时不返回到池。在 这 种 情况下,应用程序必须通过调 用 close() 将连接返回到池。如果 应用程序不关闭连接,则池能为使 用其它应用程序而用完连接。 指标解释: 资源(如 JDBC 提供程序、名称空间绑定或共享库)可以在多个作用域上定义,在较特定的作用域上定义的资源覆盖较一般作用域上定义的重复项。 注意,无论定义的资源的作用域是什么,资源的属性仅在单个服务器级别上应用。例如,如果您在单元级别上定义数据源的作用域(它在该单元内是唯一的),则 该单元中的所有用户都可以查找和使用该数据源。然而,资源属性设置对于单元中的每台服务器是本地的。例如,如果您定义最大连接数为 10,那么该单元中的每 PDF 文件使用 "pdfFactory Pro" 试用版本创建 www.fineprint.com.cn 台服务器都可以有 10 个连接。 基础知识: 单元 最常规的作用域。在“单元”作用域上定义的资源对于所有节点和服务器都是可见的,除非它们被覆盖了。要查看单元作用域中定义的资源,不要在作用域选择表单中 指定服务器或节点名。 节点 多数资源类型的缺省作用域。在“节点”作用域上定义的资源覆盖任何在“单元”作用域上定义的重复项,并且对于相同节点上的所有服务器都是可见的,除非它们在该 节点上的服务器作用域中被覆盖了。要查看节点作用域中定义的资源,不要指定服务器,但是要在作用域选择表单中选择节点名。 服务器 定义资源的最特定作用域。在“服务器”作用域上定义的资源覆盖任何在“单元”作用域或父“节点”作用域上定义的重复资源定义,并且它们仅对于特定服务器是可见的。 要查看服务器作用域中定义的资源,在作用域选择表单中指定服务器名和节点名。 当创建资源时,它们总是创建到面板中所选的当前作用域中。要在其它作用域中查看作用域,在作用域选择表单中指定不同的节点或服务器。 瓶颈判断方法: 当使用 Tivoli Performance Viewer 工具监控 JMS 时,某个连接工厂的连接池大小和空闲连接池大小指的是该工厂管理的使用 connection 数和空闲 connection 数。 而某个 connection 的连接池大小和空闲连接池大小指的是该 connection 管理的活动会话数和空闲会话数。在 WAS 管理控制台上看到连接工厂对应着 2 个属性:连 接池和会话池。连接池的最大连接数表示一个连接工厂内最多可以拥有的连接数,会话池的最大连接数表示一个连接内最多可以拥有的会话数。而“JMS 连接工厂” 节点中显示的池连接和空闲连接池的数值只是下面所有叶子节点的数值之和,本身并没有实际的意义。 PDF 文件使用 "pdfFactory Pro" 试用版本创建 www.fineprint.com.cn 组件 4:Weblogic 服务器 序号 指标名称(中英文) 指标理解 建议值 访问方式 与客户端性能的关系 1. Accept Backlog 服务器允许创建的新的 TCP 连 接的数量。BEA 缺省值为 50。 当设置为 0 时,不 允 许 任 何 新 建 连 接 访问服务器。 缺省值: 50 建议值: 根据需要可以适当 调整该数值,同时 该值还可能受限于 操作系统允许创建 的最大连接数量。 主控台:服务器 >配置 –> 调 整 –>Accept Backlog 限制最大的并发用户访问数量,同 时连接的 socket 数量 2. 线程数 线程数量是指 weblogic 对客户端进 行访问过程中启动的服务的子线程的 数量,当线程占满后,后继的访问将 进入等待队列等待线程空闲。一般用 于 配 置的线程是指 weblogic.kernel.default,缺省为 15。 同时建议启用本地 IO,即 NativeIO 来优化系统性能。 缺省值: 15 建议值: 视硬件处理能力以 及客户端并发需求 可以进行调整 主 控台:Monitoring ->Monitoring all Active Queues -> Configuaration 决定客户端的最大并发数量以及 客户端的响应速度,如果线程数量 少,会导致后续请求排队等待。 3. JDBC 连接池 Weblogic 应用服务器与数据库之间 的连接池大小,相应的决定应用的吞 吐能力 缺省值: 10 建议值: 与线程数基本保证 1:1 的匹配数量 主控台:服务 ->JDBC 相应的配置各连接池的 启始数量以及最大值 此项决定 weblogic 服务器与数据 库服务器之间的连接数量,与应用 有比较大的关联,如果相关的数据 库 SQL 调用比较大,也容易导致 应用线程挂起阻塞。 4. JVM 堆大小 JVM 堆的大小设置,可以设置 JVM 的启动大小和最大值,这个值的设置 缺省值: -Xms32m (最小) 直接编辑 weblogic 平台 的启动脚本 此项决定 JVM 运行的占用内存大 小,同时与垃圾回收相关,在应用 PDF 文件使用 "pdfFactory Pro" 试用版本创建 www.fineprint.com.cn 与 JVM 虚拟机的垃圾回收相关,太小 可能导致 JVM 回收频繁,太大可能导 致单次的回收时间较长。 -Xmx200m (最大) 建议值 受限与物理内存, 根据物理内存分 配,资料显示最大 分配 1.2G 左右 中可以使用 GC –VERBOSE 查看 日志信息,根据垃圾回收日志中的 收集时间、频度以及大小来适当调 整 JVM 堆的大小 补充说明: 目前可以直接使用 weblogic 的控制平台提供的监控功能的图片显示,查看吞吐量、排队长度以及 JVM 的内存使用信息,随时间变化。 同时可以使用 QUEST FOR Weblogic 工具查看服务器的相关指标,目前 QUEST 对监控 weblogic 的直观效果很好,建议使用。注意,quest 工具的缺省刷新速率是 8 秒。另 外,通过 QUEST 工具可以看到一些 servelet 的平均相应时间以及 JDBC 的当前使用信息。 LR 的监控需要自行配置定义,通过 LR 也能拿到丰富的信息,但手工的添加监控指标比较烦琐。 PDF 文件使用 "pdfFactory Pro" 试用版本创建 www.fineprint.com.cn 组件 5:Tuxedo 服务器 监控 指标 % Busy Clients (%忙碌的客户端)- 当前登录到 TUXEDO 应用服务器的等待服务器响应的客户端数与活动 客户端数的比 Active Clients (活动客户端)- 当前登录到 TUXEDO 应用服务器的活动客户端数 Busy Clients - 当前登录到 TUXEDO 应用服务器的等待服务器响应的客户端数 Current Accessers(当前访问数) - 当前访问该主机的客户端或者服务器的总数 Current Transactions (当前交易数)- 本机处于交易状态的数量 Idle Clients(空闲客户端) –当前连接客户端中无请求的数量 Workload Completed/second(负载完成速率/秒) - 本机上单位时间内所有服务器完成的负载请求 主机 Workload Initiated/second(启动负载/秒) - 本机上单位时间内初始化的请求 % Busy Servers(%忙碌服务器) - 当前处理 TUXEDO 请求的服务器比例 Active Servers(活动的服务器数) - 当前处于处理请求或等待请求的服务器数量 Busy Servers(忙碌的服务器数) – 当前忙碌的服务器数量,处于处理请求状态 Idle Servers(空闲的服务器数) - 处于等待请求的 TUXEDO 服务器数 队列 Number Queued(排队数量) -服务器中排队的队列数量 PDF 文件使用 "pdfFactory Pro" 试用版本创建 www.fineprint.com.cn Requests/second(请求/秒) - 每秒内的服务器处理请求 服务器 Workload/second(负载/秒) -负载是服务请求的一种权重表示。不同的请求权重不同。通常,负载是请求 数的 50 倍。 Bytes Received/sec – 工作站处理器收到的字节数/秒 Bytes Sent/sec -工作站处理器发送的字节数/秒 Messages Received/sec -工作站处理器收到的消息数/秒 Messages Sent/sec -工作站处理器发送的消息数/秒 工作站处理器(WSH)转 发 Number of Queue Blocks/sec – 每秒中受组的请求,以此表明服务器处理器过载。 TUXEDO 的监控数据可以通过 TUXADMIN 或者 TUXEDO 自带的 web 服务器看到当前服务器的处理速率以及各服务器处理的请求数量,从而衡量各个 消息队列以及服务器的数量部署是否合理。 TUXADMIN 自带一些命令 辅助类命令: help 命令名 显示该操作命令的帮助 berbose 要不要显示更详细的信息 page 要不要分页显示 查询类命令 psr:命令会显示该系统所有的 server 的信息 psc:命令会显示该系统所有的 service 的信息 pq:命令会显示该系统的队列情况 PDF 文件使用 "pdfFactory Pro" 试用版本创建 www.fineprint.com.cn pclt:当前连接到该 tuxedo 应用系统的客户端的状态 动态修改配置: suspend:可以把某个 group、server 的 service 挂起 resume:可以把已挂起的某个 group、server 的 service 重新投入可用。 adv:可以发布某个 service unadv:取消某个 service 的发布 changeload:可以修改某个 service 的负载因子 changepriority:可以修改某个 service 的优先级 管理类命令: bbclean:当 bbl 进行定时检测时,它会自动把死掉的 service 进程所占用的资源释放 pclean:清空某台服务器上的资源 broadcast:向某用户或者某类用户发消息 PDF 文件使用 "pdfFactory Pro" 试用版本创建 www.fineprint.com.cn TUXEDO 调优指南 TUXEDO 应用系统对 IPC 资源的要求 一个 TUXEDO 应用系统在运行时会大量用到 IPC 资源,包括信号灯,消息队列及共享内存,下面对他们的使用情况及与他们有关的操作系 统核心参数分别进行介绍: UBBCONFIG 中与 IPC 资源有关的配置参数 主要有: MAXACCESSERS ,REPLYQ,RQADDR,MAXSERVERS,MAXSERVICE,MAXGTT TUXEDO 应用系统对 IPC 资源的要求情况 信号灯: 一个进程在要存取 TUXEDO 应用系统的公告板(BB)之前,它要先获取一个信号灯,所以 TUXEDO 应用系统所需要的最大信号灯数与 MAXACCESSERS 的值相等.即: MAXACCESSERS = No. of semaphores 与信号灯有关的操作系统核心参数有: SEMMNS (maximum number of semaphores in use in the system) SEMMNI (maximum number of active semaphore sets) SEMMSL (maximum number of semaphores per semaphore set) SEMMAP (size of control map used to manage semaphore sets) SEMMNU (number of undo structures in the system) SEMUME (maximum number of undo entries per undo entries) 消息队列: TUXEDO 应用系统在以下几种情况下会用到操作系统的消息队列 PDF 文件使用 "pdfFactory Pro" 试用版本创建 www.fineprint.com.cn 1. 每个 SERVER 都对应一个消息队列,客户端的请求发送到该消息队列中,该 SEVER 从该消息队列中取请求并处理。 2. 如果是本地客户端,那么它也对应一个消息队列,用于接收 SERVER 的处理结果。如果 0fe8 是远程客户端,那么 SERVER 的处理结 果通过网络传送,不会占用消息队列。 3. 如果采用 MSSQ 方式,那么在个 MSSQ 中的所有 SERVER 共用一个请求队列。 4. 如果某个 SERVER 或在 MSSQ 中设置了 REPLYQ=Y,那么它要占用一个消息队列 所以一个 TUXEDO 应用系统需要的最大消息队列为: Number of Queues = (MAXACCESSERS + Number of Servers with Reply Queues + Number of MSSQ Sets - Number of Servers in MSSQ Sets) 与消息队列有关的操作系统核心参数必须满足: 1. 消息队列的个数要足够多,能够满足系统的最大需求 2. 消息的大小必须能满足系统可能出现的最大的消息的大小 3. 消息队列的长度要足够长,能容纳下较多的消息个数,使入对操作不用等待或不用等太长 的时间 与消息队列有关的操作系统核心参数有: MSGMNI (number of unique message queue identifiers) MSGMAP (size of control map to manage message segments) MSGMAX (maximum message size) MSGMNB (maximum message queue length) MSGSSZ (size of a message segment) MSGTQL (number of outstanding messages) MSGSEG (number of message segments in the system) PDF 文件使用 "pdfFactory Pro" 试用版本创建 www.fineprint.com.cn TUXEDO 把整个应用系统的配置信息放到共享内存中,一个 TUXEDO 应用系统所需要的共享内存由以下参数及配置决定: 1. MAXSERVERS,MAXSERVICE,MAXGTT 的值 2. *ROUTING,*GROUP,*NETWORK 节的大小 与共享内存有关的操作核心参数有: SHMMAX (maximum shared memory segment size) SHMSEG (maximum number of shared memory segments per process) SHMMNI (maximum number of shared memory identifiers in the system) SHMMIN(maximum shared memory segment size) 一般要设为 1 一个 TUXEDO 应用系统在运行时所需要的 IPC 资源的计算 一个 TUXEDO 应用系统在运行时所需要的 IPC 资源可用 tmboot -c 计算出来.如 UBBCONFIG 的内容为: *RESOURCES IPCKEY 123456 DOMAINID simpapp MASTER simple MAXACCESSERS 100 MAXSERVERS 50 MAXSERVICES 100 MODEL SHM *MACHINES MYSERVER LMID=simple APPDIR="d:\tuxdemo\conn" TUXCONFIG="d:\tuxdemo\conn\tuxconfig" TUXDIR="d:\ TUXEDO65" PDF 文件使用 "pdfFactory Pro" 试用版本创建 www.fineprint.com.cn MAXWSCLIENTS=5 *GROUPS GROUP1 LMID=simple GRPNO=1 GROUP2 LMID=simple GRPNO=11 *SERVERS DEFAULT: CLOPT="-A" call SRVGRP=GROUP1 SRVID=2 conn SRVGRP=GROUP2 SRVID=12 CONV=Y WSL SRVGRP=GROUP1 SRVID=1116 CLOPT="-A -- -n //XCJ:8888 -m 2 -M 5 -x 6" *SERVICES TOUPPER 以上的配置所需要的 IPC 资源可用 tmboot -c 计算出,结果如下,可 0fe7 根据计算结果调整操作系统的核心参数. D:\tuxdemo\conn>tmboot -c -y Ipc sizing (minimum /T values only) ... Fixed Minimums Per Processor PDF 文件使用 "pdfFactory Pro" 试用版本创建 www.fineprint.com.cn SHMMIN: 1 SHMALL: 1 SEMMAP: SEMMNI Variable Minimums Per Processor SEMUME, A SHMMAX SEMMNU, * * Node SEMMNS SEMMSL SEMMSL SEMMNI MSGMNI MSGMAP SHMSEG ------ ------ ------ ------ ------ ------ ------ ------ XCJ 120 15 115 A + 1 25 50 180K where 1 <= A <= 8. The number of expected application clients per processor should be added to each MSGMNI value. 从输出可知道: SEMUME,SEMMNU,SEMMNS 的值为 120, SEMMSL 为 15 A*SEMMSL=115,所以 A=7,SEMMNI=A+1,所以 SEMMNI=8 MSGMNI 为 25 MSGMAP 为 50 SHMMAX*SHMSEG 必须等于 180K PDF 文件使用 "pdfFactory Pro" 试用版本创建 www.fineprint.com.cn 其他核心参数: 在 UNIX 系统中,对一个用户能拥有的系统资源(如最多能启动的进程数,打开的文件数等)是有限制的。主要有以下参数决定: ULIMIT(maximum file size) TUXEDO 用户所能创建的最大文件,应考虑创建的 SERVER 文件的可能大小及 ULOG 的大小,一个应为 ULIMIT。 MAXUP(maximum number of processes per user) TUXEDO 用户所能创建的最大进程数,应设的足够大 IPC 资源不够时的出错信息 如果 ULOG 中出现类似下面的错误,那么就是操作系统的核心参数值或操作系统的资源不够,应进行调整 Clients cannot log into BEA TUXEDO, receive error messages at tpinit: no space in Bulletin Board can't register; table full system init function failed Global transaction fails, client or server reports failure message New servers or WSH cannot be started by BEA TUXEDO as needed, error in log file Message queues become clogged or inaccessible Write access errors, file system or disk is full 操作系统核心参数的调整方法 不同操作系统,核心参数的调整方法都不太一样,一般由系统管理员来进行调整.这里不作介绍.在 UNIX 系统中,只要 ROOT 用户才能对 系统的核心参数进行调整。并且一般要重新启动系统所做的调整才能生效。在调整之前最好对原来的参数做一个备份。 PDF 文件使用 "pdfFactory Pro" 试用版本创建 www.fineprint.com.cn SOLARISE 系统核心参数的调整 SOLARISE 系统的核心参数保存在文件/etc/system 中,可直接对它进行编辑 右边为添加的说明。 #与共享内存有关的核心参数 set shmsys:shminfo_shmmax = 4967295 #Maximum shared memory segment size in bytes. set shmsys:shminfo_shmmin = 1 # set shmsys:shminfo_shmmni = 100 # set shmsys:shminfo_shmseg = 10 #<6-15> Maximum 004c number of shared memory #segments per proce 0fe7 ss. The maximum amount of #shared memory in bytes to which a process can #attach is SHMMAX *SHMSEG. #与消息队列有关的核心参数 set msgsys:msginfo_msgmni = 600 #Number of unique message queue identifiers. set msgsys:msginfo_msgmax = 10240 #Maximum message size in bytes. set msgsys:msginfo_msgmnb = 6600000 #Maximum message queue length in bytes. set msgsys:msginfo_msgmap = 1200 #(2*msgmni) Number of entries in the control #map used to manage message segments. set msgsys:msginfo_msgseg = 1200 #(2*msgmni) Number of message segments in the #system. *set msgsys:msginfo_msgtql = 400 #与信号灯有关的核心参数 set semsys:seminfo_semmns = 600 #Maximum number of semaphores in the system. set semsys:seminfo_semmni = 100 =semmns #Maximum number of active semaphore sets. set semsys:seminfo_semmsl = 600 =semmns #Maximum number of semaphores per PDF 文件使用 "pdfFactory Pro" 试用版本创建 www.fineprint.com.cn #semaphore set. set semsys:seminfo_semmap = 600 =semmni set semsys:seminfo_semume = 1 set semsys:seminfo_semmnu = 600 >semmns 也可以在 SOLARISE 的图形化管理界面中进行配置。 HP 系统核心参数的调整 1.使用系统活动监视器(SAM-System Activity Momitor) (1) 运行 SAM 并选择"内核配置",系统会显示以下四个单元的标识。 子系统 可配置参数 堆集设备 设备驱动程序 (2)选择需要修改的单元:可配置参数 (3)按系统的提示回答问题 (4)系统询问是否重新引导系统,可回答"是",重新启动系统,使修改生效。 2.手工方式 (1) 执行下列命令进入重建内核的环境 # cd /stand/build (2) 使用下列的命令对当前的系统配置产生一个系统文件,名为 system s# /usr/lbin/sysadm/system_prep -s system 上面的命令将所有的系统配置信息放到一个文件中,文件名不一定要为 system,可 使用任何其他的文件名。 (3) 对 system 文件进行修改,如修改已存在的参数,增加未列出的参数等。 PDF 文件使用 "pdfFactory Pro" 试用版本创建 www.fineprint.com.cn (4) 使用 system 文件(如果前面使用其他文件名代替 system,那么这里要换为用户定义的文件名),产生 conf.c 文件,该文件中 使用常量对应与内核的可调参数。使用下面的命令执行 config 程序: # /usr/sbin/config -s system (5) 把驱动器对象连接到基本的内核上以重建内核。 # make -f config.mk (6) 保存旧的系统配置文件 # mv /stand/system /stand/system.prev (7) 保存旧的内核 # mv /stand/vmunix /stand/vmunix.prev (8) 将新的系统配置文件移到相应的目录下 # mv ./system /stand/system (9) 将新的内核移到相应的目录下 # mv /vmunix_test ./stand/vmunix (10) 重新引导系统并装如新的系统 0fe7 # shutdown -r -y 60 AIX 系统核心参数的调整 在 AIX 系统中,一般不能对与 IPC 资源有关的参数进行修改,它们是自适应的。但可对一个用户能打开的最多进程数等其他参数进行 修改。可以用 SMIT 工具进行修改。 TUXEDO 应用系统的性能优化方法 一、如何确定一个 TUXEDO 应用系统的性能瓶颈 一个 TUXEDO 应用系统的整体性能往往是由很多方面决定的,操作系统、网络、数据库、以及应用系统的设计,程序的编写水平都会影 响该 TUXEDO 应用系统的性能。当性能不好时,主要表现在对客户段的请求响应很慢。这时,如果用 tmadmin,中的 pq 命令察看,会发 PDF 文件使用 "pdfFactory Pro" 试用版本创建 www.fineprint.com.cn 现有较多的请求在排队。这时就要进行性能调优,而调优首先要确定整个系统的性能瓶颈所在。那么如何确定呢? 1、 如果客户端与服务端之间在进行大批量的数据传输。可计算一下它们之间的传输速度, 并与 FTP 工具的速度相比较,来判断网络的速度是不是正常。看网络是不是性能瓶颈。 2、 如果客户端与服务端之间的数据传输量较少,但是服务端有大量的数据库操作。则很有 可能数据库是性能的瓶颈,可增加该服务的进程数来提高性能。 如果增加该服务的进 程数之后,没起多大的作用。而且用数据库的性能分析工具观察发现数据库的压力较大。 则数据库是性能的瓶颈,应对数据库的进行性能调优。根据经验,数据库往往是一个应 用系统的性能瓶颈。 3、 对 UNIX 操作系统,可用 sar,glance(hp)等命令察看。看 CPU,IO,内存的利用率是不是正常。 对 WIND2000 系统,可用任务管理器察看系统的资源使用情况。可根据观察到的结果 做相应的系统调优。 4、采用 TUXEDO 的性能分析工具 txrpt。 txrpt 可统计出系统内每个 SERVICE 的在某段特定时间内所处理的请求的总数及平均处 理时间,它的使用方法如下: (1)在 UBBCONFIG 中 SERVER 节做如下设置:即在 CLOPT 中加 -r。 *SERVERS DEFAULT: CLOPT="-A -r" 或 clopt = "-A -e /log/wsl.log -r -- -n //32.22.22.22:9999" 说明:如果在 DEFAULT 的 CLOPT 中加-r 参数是对所有的 SERVICE 调用都进行统计, 如果只在某个 SERVER 的 CLOPT 中加-r 参数是对该 SERVER 中的所有的 SERVICE 调 用都进行统计。 重编译 UBBCONFIG 后,并重启动 TUXEDO 后,以后对 SERVICE 的调用统计信息会自 动写到标准错误输出文件中,默认为 stderr. PDF 文件使用 "pdfFactory Pro" 试用版本创建 www.fineprint.com.cn (2)一段时间后,可用 txrpt 进行性能分析,txrpt 的命令格式如下: txrpt [-t] [-n names] [-d mm/dd] [-s time] [-e time] 参数说明: -t 对输出进行排序,总计处理请求所花的时间越多的排的越靠前。如果不指定,按总 计被调用的次数越多的排的越靠前。 -n names 只输出指定名称的 SERVICE 的统计信息,如果有多个,可用,隔开。 -d mm/dd 限定日期,统计指定日期的信息。 缺省为当前日期。 -s time 指定统计开始时间:格式为:hr[:min[:sec]]。 -e time 指定统计结束时间:格式为:hr[:min[:sec]]。 例子: txrpt -nTOUPPER -d11/05 -s11:03 -e14:28
还剩52页未读

继续阅读

下载pdf到电脑,查找使用更方便

pdf的实际排版效果,会与网站的显示效果略有不同!!

需要 8 金币 [ 分享pdf获得金币 ] 1 人已下载

下载pdf

pdf贡献者

allensling

贡献于2012-06-06

下载需要 8 金币 [金币充值 ]
亲,您也可以通过 分享原创pdf 来获得金币奖励!
下载pdf