AIX 系统管理运维PPT,适合从事IT行业UNIX席婷婷运维人员使用

ray发布于2018/09/11

注脚

展开查看详情

1. 第十六章 性能分析与故障诊断

2.第十六章 性能分析与故障诊断 § 16.1 系统性能分析 §16.1.1 一般性能分析过程 §16.1.2 性能分析工具 § 16.2 系统故障诊断 §16.2.1 故障诊断工具 §16.2.2 测试题

3.第十六章 性能分析与故障诊断 (2) 本章要点 掌握基本的性能调试工具 掌握基本的故障诊断工具

4.16.1.1 一般性能分析过程 vmstat sar Y CPU CPU瓶颈? 瓶颈? nice ps N vmstat iostat ps Y N Y lslv 内存瓶颈? 内存瓶颈? I/O I/O瓶颈? 瓶颈? lsps filemon svmon fileplace N netstat nfsstat nfso no Y N 网络瓶颈? 网络瓶颈? More test ifconfig netpmon

5.16.1.2 性能分析工具 iostat vmstat sar topas svmon

6.iostat 查看系统 I/O 状态信息

7.iostat(2) TTY 的 I/O 状态 - tin 每秒从 tty 那里读取的字符数 - tout 每秒写到 tty 那里的字符数 ( 其中 tty 设备包括真实 (real) 和虚拟 (pseudo) 的 tty)

8.iostat(3) CPU 的使用状态 - % user ,表示平均用户占用时间 - % sys ,表示系统花费 CPU 时间 - % idle ,表示 CPU 空闲时间 - % iowait ,表示 CPU 等待 I/O 所花费 时间

9.iostat(4) 分析: 如果 %idle 数值都很高而且 %iowait 数值也很高,大 于 25 ,这个说明系统存在 I/O 或 则硬盘瓶颈 高数值的 %iowait 有可能下面几个原因: 1 . 内存不够而引起频繁的 swap 空间的 数据交换,导致数据存取存在交换空 间的 I/O 瓶颈 2 . 硬盘上面数据不合理的分布 3 . 数据的 fragment 不合理

10.iostat(5) 硬盘使用状态 - % tm_act 表示某个硬盘处于 active 状态的百分比 - tps 表示每秒某个硬盘有多少个数据传输次数 - Kb_read Kb_wrtn 分别显示从开机到运行 iostat 这个命令这段时间 内对 硬盘的 read 和 write 的总数据 量,单位 kb

11.vmstat 查看系统虚拟内存状态信息

12.vmstat(2) CPU 空闲时间百分比 = id % + wa % 算 CPU 平均一分钟空闲多少时间 (99 + 92 + 95 + 86+7 + 96)÷100÷5×60 = 56.16( 秒 )

13.vmstat(3) kthr 参数 -r 等待 CPU 运行的队列个数 若 r 数值偏大,表明 CPU 太忙 -b 等待 I/O 操作的阻塞队列个数 若 b 数值偏大,表明系统 I/O 出现瓶颈

14.vmstat(4) CPU 瓶颈 如果 sy 和 us 参数的数值加起来接近 100 ,表示系 统 CPU 使用率太高,同时也会看到 r 的数值也大于 1 内存瓶颈 内存不足,换页将变得频繁,这时 pi(page-in ) 和 po(page-out ) 参数将不是 0 ,同时 avm 和 fre 数 值的比值悬殊很大, fre 数值很小 .

15.sar 查看系统活动状态信息 查看系统所有活动状态信息

16.topas 哪个进程 使用 CPU 最多

17.svmon svmon 命令用来查看系统当前的内存的具体使 用 通过不同的选项参数,可以查看某个命令、进程 、用户等使用内存的具体状态

18.16.2.1 系统诊断工具 errpt diag

19.errpt 命令 每个管理员例行查错命令

20.errpt 常用选项 列出错误日志的详细信息 # errpt –a 显示具体某个错误项的详细信息 # errpt -a -j E18E984F

21.diag 命令

22.diag 命令 (2) 强大功能的用来检测硬件问题 简捷的菜单界面

23.Telnet 问题诊断 如果网络上的客户端可以 ping 通服务器,但是 telnet 不成功,显示拒绝连接的消息,有可能原因 是: 1. inetd 进程没有启动;用 startsrc –s inetd 命 令启动 2 . 换页空间不足;用 chps -s 命令添加空间 如果 telnet 时候要等很久才有响应,可能原因 是 / 、 /tmp 或 /var 文件系统空间不够,用 df 命 令查看

24.16.2.2 测试题 (1) 1 、当要从 CD-ROM 安装系统时,系统进入了 diagnostics 模式,查看发觉所有设备都连接正确, 可能是下面哪个原因 ? A. The battery on the machine is bad B. The root volume group is corrupt C. The low-level debugger is not enabled D. A hardware problem with the CD-ROM

25.测试题 (2) 2 、新的磁带机线路连接是正确的,但是要用这个磁带机 进行备份恢复时, it fails 。这种情况,要诊断问题 ,第一步要做是哪个 ? A. Replace the tape drive B. Run cfgmgr to reconfigure the tape device C. Check the error log for tape drive errors D. Use SMIT to change the compression attribute on the tape device

26.测试题 (3) 3 、 A user is able to get a login prompt for the server but gets a failed login error message when trying to login with an ID. Which of the following is the most likely cause of this problem? A. The hard drive is bad B. The /home file system is full C. The server is low on paging space D. User has entered an invalid ID or password

27.测试题 (4) 4 、 what is the average CPU idle time as a percentage? A. 45.5 B. 75.3 C. 44.04 D. 73.4

28.测试题 (5) 5 、 What can be concluded from this output? A. The machine is CPU bound B. The machine needs memory optimized C. The machine needs a FDDI card installed D. A user program is causing unnecessary paging

29.测试题 (6) 答案 1、D 4、D 2、C 5、A 3、D