Linux 系統(tǒng) CPU 100% 異常問題,能否用一個(gè) Shell 腳本完美解決?
2、排查思路
2.1 定位高負(fù)載進(jìn)程 pid
觀察各個(gè)進(jìn)程資源使用情況,可以看出進(jìn)程id為682的進(jìn)程,有著較高的CPU占比
2.2 定位具體的異常業(yè)務(wù)
可得出結(jié)論:該進(jìn)程對(duì)應(yīng)的就是數(shù)據(jù)平臺(tái)的web服務(wù)。
2.3 定位異常線程及具體代碼行
傳統(tǒng)的方案一般是4步:
1、top oder by with P:1040 // 首先按進(jìn)程負(fù)載排序找到 maxLoad(pid)
2、top -Hp 進(jìn)程PID:1073 // 找到相關(guān)負(fù)載 線程PID
3、printf “0x%x ”線程PID:0x431 // 將線程PID轉(zhuǎn)換為 16進(jìn)制,為后面查找 jstack 日志做準(zhǔn)備
4、jstack 進(jìn)程PID | vim +/十六進(jìn)制線程PID - // 例如:jstack 1040|vim +/0x431 -
但是對(duì)于線上問題定位來說,分秒必爭(zhēng),上面的 4 步還是太繁瑣耗時(shí)了,之前介紹過淘寶的 oldratlee 同學(xué)就將上面的流程封裝為了一個(gè)工具:show-busy-java-threads.sh,可以很方便的定位線上的這類問題:
可得出結(jié)論:是系統(tǒng)中一個(gè)時(shí)間工具類方法的執(zhí)行cpu占比較高,定位到具體方法后,查看代碼邏輯是否存在性能問題。
※ 如果線上問題比較緊急,可以省略 2.1、2.2 直接執(zhí)行 2.3,這里從多角度剖析只是為了給大家呈現(xiàn)一個(gè)完整的分析思路。
3、根因分析
異常方法邏輯:是把時(shí)間戳轉(zhuǎn)成對(duì)應(yīng)的具體的日期時(shí)間格式; 上層調(diào)用:計(jì)算當(dāng)天凌晨至當(dāng)前時(shí)間所有秒數(shù),轉(zhuǎn)化成對(duì)應(yīng)的格式放入到set中返回結(jié)果; 邏輯層:對(duì)應(yīng)的是數(shù)據(jù)平臺(tái)實(shí)時(shí)報(bào)表的查詢邏輯,實(shí)時(shí)報(bào)表會(huì)按照固定的時(shí)間間隔來,并且在一次查詢中有多次(n次)方法調(diào)用。
4、解決方案
5、總結(jié)
在編碼的過程中,除了要實(shí)現(xiàn)業(yè)務(wù)的邏輯,也要注重代碼性能的優(yōu)化。一個(gè)業(yè)務(wù)需求,能實(shí)現(xiàn),和能實(shí)現(xiàn)的更高效、更優(yōu)雅其實(shí)是兩種截然不同的工程師能力和境界的體現(xiàn),而后者也是工程師的核心競(jìng)爭(zhēng)力。 在代碼編寫完成之后,多做 review,多思考是不是可以用更好的方式來實(shí)現(xiàn)。 線上問題不放過任何一個(gè)小細(xì)節(jié)!細(xì)節(jié)是魔鬼,技術(shù)的同學(xué)需要有刨根問題的求知欲和追求卓越的精神,只有這樣,才能不斷的成長和提升。
附上show-busy-java-threads.sh腳本:
#!/bin/bash
# @Function
# Find out the highest cpu consumed threads of java, and print the stack of these threads.
#
# @Usage
# $ ./show-busy-java-threads.sh
#
# @author Jerry Lee
readonly PROG=`basename$0`
readonly-a COMMAND_LINE=("$0""$@")
usage(){
cat<<EOF
Usage: ${PROG}[OPTION]...
Find out the highest cpu consumed threads of java, and print the stack of these threads.
Example: ${PROG}-c 10
Options:
-p,--pid find out the highest cpu consumed threads from the specifed java process,
default from all java process.
-c,--count set the thread count to show, default is 5
-h,--helpdisplay this help and exit
EOF
exit$1
}
readonly ARGS=`getopt -n "$PROG" -a -o c:p:h -l count:,pid:,help -- "$@"`
[ $?-ne 0]&& usage 1
evalset--"${ARGS}"
whiletrue;do
case"$1"in
-c|--count)
count="$2"
shift2
;
-p|--pid)
pid="$2"
shift2
;
-h|--help)
usage
;
--)
shift
break
;
esac
done
count=${count:-5}
redEcho(){
[-c /dev/stdout ]&&{
# if stdout is console, turn on color output.
echo-ne " 类乌齐县| 吉木萨尔县| 富锦市| 平阴县| 建平县| 棋牌| 新巴尔虎左旗| 凤翔县| 凌源市| 中阳县| 当涂县| 朝阳县| 璧山县| 固始县| 车险| 南陵县| 奉贤区| 紫金县| 自治县| 凯里市| 抚宁县| 广昌县| 武定县| 威宁| 侯马市| 襄垣县| 监利县| 浪卡子县| 吴旗县| 屯门区| 嘉禾县| 轮台县| 育儿| 沙湾县| 平顶山市| 武乡县| 富阳市| 古蔺县| 白银市| 富川| 广德县|