写个bash采集CPU信息

优采云发布时间: 2022-05-09 12:25

　　写个bash采集CPU信息

　　有个bash命令我不会，向大家请教个一下零、背景

　　最近在做性能优化。

　　性能优化技术上暂不谈，结果上也有一套科学方法的。

　　比如最基本的是对照试验，即除了一个因素不同外，其他因素都需要保持不变。

　　对照试验做完之后，就是数据采集了。

　　压测数据阶段数据一般比较稳定，我都是人工采集的（下图是第一轮压测优化效果）。

　　而线上服务进行对照试验时，数据有一定的波动，人工采集就会产生较大的误差。

　　所以我写了一个 BASH 函数来采集各个对照系统的数据，最终生成数据结果。

　　是的。这篇文章是介绍这个 BASH 函数的，如何性能优化以后再分享。

　　一、采集需求

　　性能优化，访问量相同的情况下往往是采集优化前与优化后的 CPU 数据了。

　　而我的服务是多进程模式，即一个 8 核的机器，跑了 8 个进程，而且CPU 没有那么均匀。

　　另外每一秒的请求量也是有波动的，虽然相同连续两秒波动不大，但是时间拉长到十几秒，最大值与最小值相差还是蛮大的。

　　面对这两个问题，我得出两个结论。

　　1、需要采集所有 CPU 的数据。

　　2、需要连续采集一段时间的数据。

　　这两个结论分别为了解决上面的两种波动与不均匀。

　　那总结下就是，需要采集所有 CPU 在连续若干时间内的数据，并计算出一个 CPU 核的平均值。

　　二、相关技术

　　第一步是获取所有进程。

　　原先我是手动 TOP 或 PS 上 copy 出来的，后来重复了几次，怒了，就写了一个命令自动获取进程列表。

　　思路是ps出所有进程，然后grep出目标进程，最后awk计算出进程列表。

　　大概命令如下：

pidlist=$(

　　ps -aef |

　　grep "name" |

　　grep -v "name" |

　　awk 'BEGIN{ iplist=""; }

　　 {

　　 if(iplist=="") iplist=

全自动文章采集、AI生成、自动发布，网站自媒体全搞定！立即注册

写个bash采集CPU信息

优采云发布时间: 2022-05-09 12:25

　　写个bash采集CPU信息

　　有个bash命令我不会，向大家请教个一下零、背景

　　最近在做性能优化。

　　性能优化技术上暂不谈，结果上也有一套科学方法的。

　　比如最基本的是对照试验，即除了一个因素不同外，其他因素都需要保持不变。

　　对照试验做完之后，就是数据采集了。

　　压测数据阶段数据一般比较稳定，我都是人工采集的（下图是第一轮压测优化效果）。

　　而线上服务进行对照试验时，数据有一定的波动，人工采集就会产生较大的误差。

　　所以我写了一个 BASH 函数来采集各个对照系统的数据，最终生成数据结果。

　　是的。这篇文章是介绍这个 BASH 函数的，如何性能优化以后再分享。

　　一、采集需求

　　性能优化，访问量相同的情况下往往是采集优化前与优化后的 CPU 数据了。

　　而我的服务是多进程模式，即一个 8 核的机器，跑了 8 个进程，而且CPU 没有那么均匀。

　　另外每一秒的请求量也是有波动的，虽然相同连续两秒波动不大，但是时间拉长到十几秒，最大值与最小值相差还是蛮大的。

　　面对这两个问题，我得出两个结论。

　　1、需要采集所有 CPU 的数据。

　　2、需要连续采集一段时间的数据。

　　这两个结论分别为了解决上面的两种波动与不均匀。

　　那总结下就是，需要采集所有 CPU 在连续若干时间内的数据，并计算出一个 CPU 核的平均值。

　　二、相关技术

　　第一步是获取所有进程。

　　原先我是手动 TOP 或 PS 上 copy 出来的，后来重复了几次，怒了，就写了一个命令自动获取进程列表。

　　思路是ps出所有进程，然后grep出目标进程，最后awk计算出进程列表。

　　大概命令如下：

pidlist=$(

　　ps -aef |

　　grep "name" |

　　grep -v "name" |

　　awk 'BEGIN{ iplist=""; }

　　 {

　　 if(iplist=="") iplist=$2;

　　 else iplist=iplist","$2;

　　 }

END{ print iplist }')

　　grep -v参数是为了过滤grep自身这个命令。

　　awk是为了提取出对应的进程号，然后使用逗号链接起来。

　　$()代表运行一个命令，结果返回给前面的变量。

　　第二步是统计与计算各进程的CPU信息。

　　思路是先使用top收集所有时间这些进程的CPU信息，然后使用sed和awk来处理文本，得到CPU值，最后重定向到文件里。

　　大概命令如下：

top -b -n 60 -p $pidlist

　　| grep "name"

　　| sed "s/ \+/ /g"

　　| awk '{print $9 }'

> cpu_base.log

　　top -b -n 60 -p $pidlist是为了使用命令行模式采集 60 次这些进程的信息。

　　sed是为了进程正则替换。

　　awk是提取信息。

　　>重定向到文件。

　　当然我的实际情况是不同机器输出的TOP不一样，我对数据进行了归一化，写的非常复杂的sed正在表达式，这里简化只为了演示。

　　那么问题来了：大家知道怎么用TOP命令行式来输出指定的字段吗？

　　比如只输出进程和CPU，那就不需要那么多sed和awk了。

　　第三步是对数据加工去燥。

　　思路是排序，去掉最大的 8 个数据和最小的 8 个数据，然后保存起来。

cat cpu_base.log

　　| sort -n

　　| head --lines=-8

　　| tail --lines=+9

> cpu_sort.log

　　sort -n是按数字进行排序。

　　head --lines=-8过滤最后8行。

　　tail --lines=+9过滤前8行。

　　第四步是数据整理。

　　思路是对所有数据求和，求平均值。

sum=0

　　num=0

　　for v in $(cat cpu_sort.log);

　　do

　　 num=$((num+1))

　　 sum=$(echo "$sum + $v" | bc)

　　done

　　avg=$(echo "$sum / $num" | bc)

echo "SUM[$sum] num[$num] avg[$avg]"

　　for in ; do done是 bash 的循环语法。

　　$(())是进行整数运算。

　　bc是进程浮点数运算。

　　这样，我就采集完数据了，下图是最终数据，性能提升 43%，这种进行第二轮优化，应该还可以提升 30% 。

　　三、最后

　　上面我提到了，有个bash命令我不会，向大家请教个一下。

　　问题：大家知道怎么用TOP命令行式直接输出指定的字段吗？

　　如果你知道的话可以告诉我，有红包奖励。

　　-EOF-

　　题图：来源自朋友圈。

0

2022-05-09

自动采集编写

0 个评论

要回复文章请先登录或注册

视
频
教
程

在
线
客
服

官方客服QQ群

在
线
客
服

;

　　 else iplist=iplist","

全自动文章采集、AI生成、自动发布，网站自媒体全搞定！立即注册

写个bash采集CPU信息

优采云发布时间: 2022-05-09 12:25

　　写个bash采集CPU信息

　　有个bash命令我不会，向大家请教个一下零、背景

　　最近在做性能优化。

　　性能优化技术上暂不谈，结果上也有一套科学方法的。

　　比如最基本的是对照试验，即除了一个因素不同外，其他因素都需要保持不变。

　　对照试验做完之后，就是数据采集了。

　　压测数据阶段数据一般比较稳定，我都是人工采集的（下图是第一轮压测优化效果）。

　　而线上服务进行对照试验时，数据有一定的波动，人工采集就会产生较大的误差。

　　所以我写了一个 BASH 函数来采集各个对照系统的数据，最终生成数据结果。

　　是的。这篇文章是介绍这个 BASH 函数的，如何性能优化以后再分享。

　　一、采集需求

　　性能优化，访问量相同的情况下往往是采集优化前与优化后的 CPU 数据了。

　　而我的服务是多进程模式，即一个 8 核的机器，跑了 8 个进程，而且CPU 没有那么均匀。

　　另外每一秒的请求量也是有波动的，虽然相同连续两秒波动不大，但是时间拉长到十几秒，最大值与最小值相差还是蛮大的。

　　面对这两个问题，我得出两个结论。

　　1、需要采集所有 CPU 的数据。

　　2、需要连续采集一段时间的数据。

　　这两个结论分别为了解决上面的两种波动与不均匀。

　　那总结下就是，需要采集所有 CPU 在连续若干时间内的数据，并计算出一个 CPU 核的平均值。

　　二、相关技术

　　第一步是获取所有进程。

　　原先我是手动 TOP 或 PS 上 copy 出来的，后来重复了几次，怒了，就写了一个命令自动获取进程列表。

　　思路是ps出所有进程，然后grep出目标进程，最后awk计算出进程列表。

　　大概命令如下：

pidlist=$(

　　ps -aef |

　　grep "name" |

　　grep -v "name" |

　　awk 'BEGIN{ iplist=""; }

　　 {

　　 if(iplist=="") iplist=$2;

　　 else iplist=iplist","$2;

　　 }

END{ print iplist }')

　　grep -v参数是为了过滤grep自身这个命令。

　　awk是为了提取出对应的进程号，然后使用逗号链接起来。

　　$()代表运行一个命令，结果返回给前面的变量。

　　第二步是统计与计算各进程的CPU信息。

　　思路是先使用top收集所有时间这些进程的CPU信息，然后使用sed和awk来处理文本，得到CPU值，最后重定向到文件里。

　　大概命令如下：

top -b -n 60 -p $pidlist

　　| grep "name"

　　| sed "s/ \+/ /g"

　　| awk '{print $9 }'

> cpu_base.log

　　top -b -n 60 -p $pidlist是为了使用命令行模式采集 60 次这些进程的信息。

　　sed是为了进程正则替换。

　　awk是提取信息。

　　>重定向到文件。

　　当然我的实际情况是不同机器输出的TOP不一样，我对数据进行了归一化，写的非常复杂的sed正在表达式，这里简化只为了演示。

　　那么问题来了：大家知道怎么用TOP命令行式来输出指定的字段吗？

　　比如只输出进程和CPU，那就不需要那么多sed和awk了。

　　第三步是对数据加工去燥。

　　思路是排序，去掉最大的 8 个数据和最小的 8 个数据，然后保存起来。

cat cpu_base.log

　　| sort -n

　　| head --lines=-8

　　| tail --lines=+9

> cpu_sort.log

　　sort -n是按数字进行排序。

　　head --lines=-8过滤最后8行。

　　tail --lines=+9过滤前8行。

　　第四步是数据整理。

　　思路是对所有数据求和，求平均值。

sum=0

　　num=0

　　for v in $(cat cpu_sort.log);

　　do

　　 num=$((num+1))

　　 sum=$(echo "$sum + $v" | bc)

　　done

　　avg=$(echo "$sum / $num" | bc)

echo "SUM[$sum] num[$num] avg[$avg]"

　　for in ; do done是 bash 的循环语法。

　　$(())是进行整数运算。

　　bc是进程浮点数运算。

　　这样，我就采集完数据了，下图是最终数据，性能提升 43%，这种进行第二轮优化，应该还可以提升 30% 。

　　三、最后

　　上面我提到了，有个bash命令我不会，向大家请教个一下。

　　问题：大家知道怎么用TOP命令行式直接输出指定的字段吗？

　　如果你知道的话可以告诉我，有红包奖励。

　　-EOF-

　　题图：来源自朋友圈。

0

2022-05-09

自动采集编写

0 个评论

要回复文章请先登录或注册

视
频
教
程

在
线
客
服

官方客服QQ群

在
线
客
服

;

　　 }

END{ print iplist }')

　　grep -v参数是为了过滤grep自身这个命令。

　　awk是为了提取出对应的进程号，然后使用逗号链接起来。

　　$()代表运行一个命令，结果返回给前面的变量。

　　第二步是统计与计算各进程的CPU信息。

　　思路是先使用top收集所有时间这些进程的CPU信息，然后使用sed和awk来处理文本，得到CPU值，最后重定向到文件里。

　　大概命令如下：

top -b -n 60 -p $pidlist

　　| grep "name"

　　| sed "s/ \+/ /g"

　　| awk '{print }'

> cpu_base.log

　　top -b -n 60 -p $pidlist是为了使用命令行模式采集 60 次这些进程的信息。

　　sed是为了进程正则替换。

　　awk是提取信息。

　　>重定向到文件。

　　当然我的实际情况是不同机器输出的TOP不一样，我对数据进行了归一化，写的非常复杂的sed正在表达式，这里简化只为了演示。

　　那么问题来了：大家知道怎么用TOP命令行式来输出指定的字段吗？

　　比如只输出进程和CPU，那就不需要那么多sed和awk了。

　　第三步是对数据加工去燥。

　　思路是排序，去掉最大的 8 个数据和最小的 8 个数据，然后保存起来。

cat cpu_base.log

　　| sort -n

　　| head --lines=-8

　　| tail --lines=+9

> cpu_sort.log

　　sort -n是按数字进行排序。

　　head --lines=-8过滤最后8行。

　　tail --lines=+9过滤前8行。

　　第四步是数据整理。

　　思路是对所有数据求和，求平均值。

sum=0

　　num=0

　　for v in $(cat cpu_sort.log);

　　do

　　 num=$((num+1))

　　 sum=$(echo "$sum + $v" | bc)

　　done

　　avg=$(echo "$sum / $num" | bc)

echo "SUM[$sum] num[$num] avg[$avg]"

　　for in ; do done是 bash 的循环语法。

　　$(())是进行整数运算。

　　bc是进程浮点数运算。

　　这样，我就采集完数据了，下图是最终数据，性能提升 43%，这种进行第二轮优化，应该还可以提升 30% 。

　　三、最后

　　上面我提到了，有个bash命令我不会，向大家请教个一下。

　　问题：大家知道怎么用TOP命令行式直接输出指定的字段吗？

　　如果你知道的话可以告诉我，有红包奖励。

　　-EOF-

　　题图：来源自朋友圈。

0

2022-05-09

自动采集编写

0 个评论

要回复文章请先登录或注册

AI时代内容工厂

写个bash采集CPU信息

AI时代内容工厂

写个bash采集CPU信息

0 个评论

发起人

AI时代内容工厂

写个bash采集CPU信息

0 个评论

发起人

0 个评论

发起人

AI时代内容工厂

写个bash采集CPU信息

AI时代内容工厂

写个bash采集CPU信息

0 个评论

发起人

相关问题

AI时代内容工厂

写个bash采集CPU信息

0 个评论

发起人

相关问题

0 个评论

发起人

相关问题