Linux服务器性能分析与调优

1.1 cpu性能查看

cat /proc/cpuinfo |grep "physical id"|sort|uniq|wc -l
cat /proc/cpuinfo |grep "cpu cores"|wc -l
cat /proc/cpuinfo |grep "processor"|wc -l

物理cpu个数*核数=逻辑cpu个数(不支持超线程技术的情况下)

1.2 内存查看

#free -m
             total       used       free     shared    buffers     cached
Mem:          3949       2519       1430          0        189       1619
-/+ buffers/cache:        710       3239
Swap:         3576          0       3576

total:内存总数
used:已经使用的内存数
free:空闲内存数
shared:多个进程共享的内存总额
- buffers/cache:(已用)的内存数,即used-buffers-cached
+ buffers/cache:(可用)的内存数,即free+buffers+cached

Buffer Cache用于针对磁盘块的读写;
Page Cache用于针对文件inode的读写,这些Cache能有效地缩短I/O系统调用的时间。

对操作系统来说free/used是系统可用/占用的内存;
对应用程序来说-/+ buffers/cache是可用/占用内存,因为buffers/cache很快就会被使用。

我们工作时候应该从应用角度来看。

1.3 硬盘查看

fdisk -l
df -h
iostat -x 1 5

iostat是含在套装systat中的,可以用yum -y install systat来安装。

常关注的参数:

如%util接近100%,说明产生的I/O请求太多,I/O系统已经满负荷,该磁盘可能存在瓶颈。
如idle小于70%,I/O的压力就比较大了,说明读取进程中有较多的wait。
du -sh /root
du -cksh *|sort -rn|head -n 10

1.4 查看平均负载

有时系统响应很慢,但找不到原因,所以是时候检查平均负载,看看它是否有大量的进程在排队等待。

[En]

Sometimes the system is slow to respond, but can’t find the reason, so it’s time to check the average load to see if it has a large number of processes waiting in line.

最简单的命令:

uptime--查看过去的1分钟、5分钟和15分钟内进程队列中的平均进程数量。

还有动态命令top
我们只关心以下部分:

top - 21:33:09 up  1:00,  1 user,  load average: 0.00, 0.01, 0.05

如果每个逻辑cpu当前的活动进程不大于3,则系统性能良好;
如果每个逻辑cpu当前的活动进程不大于4,表示可以接受;
如果每个逻辑cpu当前的活动进程大于5,则系统性能问题严重。

一般计算方法:负载值/逻辑cpu个数

还可以结合vmstat命令来判断系统是否繁忙,其中:

procs
r:等待运行的进程数。
b:处在非中断睡眠状态的进程数。
w:被交换出去的可运行的进程数。

memeory
swpd:虚拟内存使用情况,单位为KB。
free:空闲的内存,单位为KB。
buff:被用来作为缓存的内存数,单位为KB。

swap
si:从磁盘交换到内存的交换页数量,单位为KB。
so:从内存交换到磁盘的交换页数量,单位为KB。

io
bi:发送到块设备的块数,单位为KB。
bo:从块设备接受的块数,单位为KB。

system
in:每秒的中断数,包括时钟中断。
cs:每秒的环境切换次数。

cpu
按cpu的总使用百分比来显示。
us:cpu使用时间。
sy:cpu系统使用时间。
id:闲置时间。

1.5 其他参数

查看内核版本号:
uname -a

简化命令:uname -r

查看系统是32位还是64位的:
file /sbin/init

查看发行版:
cat /etc/issue
或lsb_release -a

查看系统已载入的相关模块:
lsmod

查看pci设置:
lspci

2.1.1 影响Linux服务器性能的因素

CPU
内存
磁盘I/O带宽
网络I/O带宽

2.1.2 系统性能评估标准

影响性能因素好坏糟糕 CPU user% + sys%< 70% user% + sys%= 85% user% + sys% >=90% 内存 Swap In(si)=0 Swap Out(so)=0 Per CPU with 10 page/s More Swap In & Swap Out 磁盘 iowait % < 20% iowait % =35% iowait % >= 50%

其中:

%user&#xFF1A;&#x8868;&#x793A;CPU&#x5904;&#x5728;&#x7528;&#x6237;&#x6A21;&#x5F0F;&#x4E0B;&#x7684;&#x65F6;&#x95F4;&#x767E;&#x5206;&#x6BD4;&#x3002;
%sys&#xFF1A;&#x8868;&#x793A;CPU&#x5904;&#x5728;&#x7CFB;&#x7EDF;&#x6A21;&#x5F0F;&#x4E0B;&#x7684;&#x65F6;&#x95F4;&#x767E;&#x5206;&#x6BD4;&#x3002;
%iowait&#xFF1A;&#x8868;&#x793A;CPU&#x7B49;&#x5F85;&#x8F93;&#x5165;&#x8F93;&#x51FA;&#x5B8C;&#x6210;&#x65F6;&#x95F4;&#x7684;&#x767E;&#x5206;&#x6BD4;&#x3002;
swap in&#xFF1A;&#x5373;si&#xFF0C;&#x8868;&#x793A;&#x865A;&#x62DF;&#x5185;&#x5B58;&#x7684;&#x9875;&#x5BFC;&#x5165;&#xFF0C;&#x5373;&#x4ECE;SWAP DISK&#x4EA4;&#x6362;&#x5230;RAM
swap out&#xFF1A;&#x5373;so&#xFF0C;&#x8868;&#x793A;&#x865A;&#x62DF;&#x5185;&#x5B58;&#x7684;&#x9875;&#x5BFC;&#x51FA;&#xFF0C;&#x5373;&#x4ECE;RAM&#x4EA4;&#x6362;&#x5230;SWAP DISK

2.1.3 系统性能分析工具

Vmstat、sar、iostat、netstat、free、ps、top等

vmstat&#x3001;sar&#x3001;iostat&#x68C0;&#x6D4B;&#x662F;&#x5426;&#x662F;CPU&#x74F6;&#x9888;
free&#x3001;vmstat&#x68C0;&#x6D4B;&#x662F;&#x5426;&#x662F;&#x5185;&#x5B58;&#x74F6;&#x9888;
iostat&#x68C0;&#x6D4B;&#x662F;&#x5426;&#x662F;&#x78C1;&#x76D8;I/O&#x74F6;&#x9888;
netstat&#x68C0;&#x6D4B;&#x662F;&#x5426;&#x662F;&#x7F51;&#x7EDC;&#x5E26;&#x5BBD;&#x74F6;&#x9888;

2.1.4 Linux性能评估与优化

系统整体性能评估(uptime命令)
uptime

16:38:00 up 118 days, 3:01, 5 users,load average: 1.22, 1.02, 0.91

注意:

  • load average三值大小一般不能大于系统CPU的个数。

    系统有8个CPU,如load average三值长期大于8,说明CPU很繁忙,负载很高,可能会影响系统性能。

  • 但偶尔大于8,一般不会影响系统性能。
  • 如load average输出值小于CPU个数,则表示CPU有空闲时间片,比如本例中的输出,CPU是非常空闲的

2.2.1 CPU性能评估

显示系统各种资源之间相关性能简要信息,主要看CPU负载情况。

下面是vmstat命令在某个系统的输出结果:

[root@node1 ~]#vmstat 2 3

procs
 &#x2014;&#x2014;&#x2014;&#x2013;memory&#x2014;&#x2014;&#x2014;- &#x2014;swap&#x2013; &#x2014;&#x2013;io&#x2014;- &#x2013;system&#x2013; &#x2014;&#x2013;cpu&#x2014;&#x2014;

r  b swpd freebuff  cache si so bi bo incs us sy idwa st

0  0 0 162240 8304 67032 0 0 13 21 1007 23 0 1 98 0 0

0  0 0 162240 8304 67032 0 0 1 0 1010 20 0 1 100 0 0

0  0 0 162240 8304 67032 0 0 1 1 1009 18 0 1 99 0 0
Procs

r–运行和等待cpu时间片的进程数,这个值如果长期大于系统CPU的个数,说明CPU不足,需要增加CPU

b–在等待资源的进程数,比如正在等待I/O、或者内存交换等。

用户进程消耗的CPU 时间百分比。
us的值比较高时,说明用户进程消耗的cpu时间多,但是如果长期大于50%,就需要考虑优化程序或算法。

内核进程消耗的CPU时间百分比。Sy的值较高时,说明内核消耗的CPU资源很多。

根据经验,us+sy的参考值为80%,如果us+sy大于 80%说明可能存在CPU资源不足。

sar对系统每方面进行单独统计,但会增加系统开销,不过开销可以评估,对系统的统计结果不会有很大影响。

下面是sar命令对某个系统的CPU统计输出:

[root@webserver ~]# sar -u 3 5

Linux
 2.6.9-42.ELsmp (webserver) 11/28/2008_i686_
 (8 CPU)

11:41:24
 AM CPU %user %nice%system
 %iowait %steal %idle

11:41:27
 AM all 0.88 0.00 0.29 0.00 0.00 98.83

11:41:30
 AM all 0.13 0.00 0.17 0.21 0.00 99.50

11:41:33
 AM all 0.04 0.00 0.04 0.00 0.00 99.92

11:41:36
 AM all 90.08 0.00 0.13 0.16 0.00 9.63

11:41:39
 AM all 0.38 0.00 0.17 0.04 0.00 99.41

Average:
 all 0.34 0.00 0.16 0.05 0.00 99.45

输出解释如下:

%user&#x5217;&#x663E;&#x793A;&#x4E86;&#x7528;&#x6237;&#x8FDB;&#x7A0B;&#x6D88;&#x8017;&#x7684;CPU &#x65F6;&#x95F4;&#x767E;&#x5206;&#x6BD4;&#x3002;
%nice&#x5217;&#x663E;&#x793A;&#x4E86;&#x8FD0;&#x884C;&#x6B63;&#x5E38;&#x8FDB;&#x7A0B;&#x6240;&#x6D88;&#x8017;&#x7684;CPU &#x65F6;&#x95F4;&#x767E;&#x5206;&#x6BD4;&#x3002;
%system&#x5217;&#x663E;&#x793A;&#x4E86;&#x7CFB;&#x7EDF;&#x8FDB;&#x7A0B;&#x6D88;&#x8017;&#x7684;CPU&#x65F6;&#x95F4;&#x767E;&#x5206;&#x6BD4;&#x3002;
%iowait&#x5217;&#x663E;&#x793A;&#x4E86;IO&#x7B49;&#x5F85;&#x6240;&#x5360;&#x7528;&#x7684;CPU&#x65F6;&#x95F4;&#x767E;&#x5206;&#x6BD4;
%steal&#x5217;&#x663E;&#x793A;&#x4E86;&#x5728;&#x5185;&#x5B58;&#x76F8;&#x5BF9;&#x7D27;&#x5F20;&#x7684;&#x73AF;&#x5883;&#x4E0B;pagein&#x5F3A;&#x5236;&#x5BF9;&#x4E0D;&#x540C;&#x7684;&#x9875;&#x9762;&#x8FDB;&#x884C;&#x7684;steal&#x64CD;&#x4F5C; &#x3002;
%idle&#x5217;&#x663E;&#x793A;&#x4E86;CPU&#x5904;&#x5728;&#x7A7A;&#x95F2;&#x72B6;&#x6001;&#x7684;&#x65F6;&#x95F4;&#x767E;&#x5206;&#x6BD4;&#x3002;
&#x95EE;&#x9898;

你是否遇到过系统CPU整体利用率不高,而应用缓慢的现象?

在一个多CPU的系统中,如果程序使用了单线程,会出现这么一个现象,CPU的整体使用率不高,但是系统应用却响应缓慢,这可能是由于程序使用单线程的原因,单线程只使用一个CPU,导致这个CPU占用率为100%,无法处理其它请求,而其它的CPU却闲置,这就导致了整体CPU使用率不高,而应用缓慢现象的发生。

2.3.1 内存性能评估

free是监控Linux内存使用状况最常用的指令,看下面的一个输出:

[root@webserver ~]# free -m

total
 used freeshared
 buffers cached

Mem:
 8111 7185 926 0 243 6299

 -/+
 buffers/cache:
 643 7468

Swap:
 8189 0 8189

经验公式:

&#x5E94;&#x7528;&#x7A0B;&#x5E8F;&#x53EF;&#x7528;&#x5185;&#x5B58;/&#x7CFB;&#x7EDF;&#x7269;&#x7406;&#x5185;&#x5B58;>70%&#xFF0C;&#x8868;&#x793A;&#x7CFB;&#x7EDF;&#x5185;&#x5B58;&#x8D44;&#x6E90;&#x975E;&#x5E38;&#x5145;&#x8DB3;&#xFF0C;&#x4E0D;&#x5F71;&#x54CD;&#x7CFB;&#x7EDF;&#x6027;&#x80FD;;
&#x5E94;&#x7528;&#x7A0B;&#x5E8F;&#x53EF;&#x7528;&#x5185;&#x5B58;/&#x7CFB;&#x7EDF;&#x7269;&#x7406;&#x5185;&#x5B58;<20%,表示系统内存资源紧缺,需要增加系统内存; 20%<应用程序可用内存 系统物理内存<70%,表示系统内存资源基本能满足应用需求,暂时不影响系统性能< code></20%,表示系统内存资源紧缺,需要增加系统内存;>
[root@node1
 ~]#
 vmstat 2 3

procs
 &#x2014;&#x2014;&#x2014;&#x2013;memory&#x2014;&#x2014;&#x2014;- &#x2014;swap&#x2013; &#x2014;&#x2013;io&#x2014;- &#x2013;system&#x2013; &#x2014;&#x2013;cpu&#x2014;&#x2014;

r b swpd freebuff cache si so bi bo incs us sy idwa st

0 0 0 162240 8304 67032 0 0 13 21 1007 23 0 1 98 0 0

0 0 0 162240 8304 67032 0 0 1 0 1010 20 0 1 100 0 0

0 0 0 162240 8304 67032 0 0 1 1 1009 18 0 1 99 0 0

memory

swpd--&#x5207;&#x6362;&#x5230;&#x5185;&#x5B58;&#x4EA4;&#x6362;&#x533A;&#x7684;&#x5185;&#x5B58;&#x6570;&#x91CF;&#xFF08;k&#x4E3A;&#x5355;&#x4F4D;)&#x3002;&#x5982;swpd&#x503C;&#x5076;&#x5C14;&#x975E;0&#xFF0C;&#x4E0D;&#x5F71;&#x54CD;&#x7CFB;&#x7EDF;&#x6027;&#x80FD;
free--&#x5F53;&#x524D;&#x7A7A;&#x95F2;&#x7684;&#x7269;&#x7406;&#x5185;&#x5B58;&#x6570;&#x91CF;&#xFF08;k&#x4E3A;&#x5355;&#x4F4D;&#xFF09;
buff--buffers cache&#x7684;&#x5185;&#x5B58;&#x6570;&#x91CF;&#xFF0C;&#x4E00;&#x822C;&#x5BF9;&#x5757;&#x8BBE;&#x5907;&#x7684;&#x8BFB;&#x5199;&#x624D;&#x9700;&#x8981;&#x7F13;&#x51B2;
cache--page cached&#x7684;&#x5185;&#x5B58;&#x6570;&#x91CF;

一般作为文件系统cached,频繁访问的文件都会被cached,如cache值较大,说明cached的文件数较多,如果此时IO中bi比较小,说明文件系统效率比较好。

swap

si--&#x7531;&#x78C1;&#x76D8;&#x8C03;&#x5165;&#x5185;&#x5B58;&#xFF0C;&#x4E5F;&#x5C31;&#x662F;&#x5185;&#x5B58;&#x8FDB;&#x5165;&#x5185;&#x5B58;&#x4EA4;&#x6362;&#x533A;&#x7684;&#x6570;&#x91CF;&#x3002;
so--&#x7531;&#x5185;&#x5B58;&#x8C03;&#x5165;&#x78C1;&#x76D8;&#xFF0C;&#x4E5F;&#x5C31;&#x662F;&#x5185;&#x5B58;&#x4EA4;&#x6362;&#x533A;&#x8FDB;&#x5165;&#x5185;&#x5B58;&#x7684;&#x6570;&#x91CF;&#x3002;

si、so的值长期不为0,表示系统内存不足。需增加系统内存。

2.4.1磁盘I/O性能评估

频繁访问的文件或数据尽可能用 内存读写代替 直接磁盘I/O,效率高千倍。

将经常读写的文件从长期不变的文件中分离出来,放在不同的磁盘设备上。

[En]

Separate the files that are often read and written from the files that remain unchanged for a long time and put them on different disk devices.

对于写操作频繁的数据,可以考虑使用裸设备代替文件系统。

裸设备优点:

&#x6570;&#x636E;&#x53EF;&#x76F4;&#x63A5;&#x8BFB;&#x5199;&#xFF0C;&#x4E0D;&#x9700;&#x7ECF;&#x8FC7;&#x64CD;&#x4F5C;&#x7CFB;&#x7EDF;&#x7EA7;&#x7F13;&#x5B58;&#xFF0C;&#x8282;&#x7701;&#x5185;&#x5B58;&#x8D44;&#x6E90;&#xFF0C;&#x907F;&#x514D;&#x5185;&#x5B58;&#x8D44;&#x6E90;&#x4E89;&#x7528;;
&#x907F;&#x514D;&#x6587;&#x4EF6;&#x7CFB;&#x7EDF;&#x7EA7;&#x7EF4;&#x62A4;&#x5F00;&#x9500;&#xFF0C;&#x5982;&#x6587;&#x4EF6;&#x7CFB;&#x7EDF;&#x9700;&#x7EF4;&#x62A4;&#x8D85;&#x7EA7;&#x5757;&#x3001;I-node&#x7B49;;
&#x907F;&#x514D;&#x4E86;&#x64CD;&#x4F5C;&#x7CFB;&#x7EDF;cache&#x9884;&#x8BFB;&#x529F;&#x80FD;&#xFF0C;&#x51CF;&#x5C11;&#x4E86;I/O&#x8BF7;&#x6C42;

使用裸设备的缺点是:

数据管理、空间管理不灵活,需要很专业的人来操作。

[root@webserver ~]# iostat -d 2 3

Linux
 2.6.9-42.ELsmp (webserver) 12/01/2008_i686_
 (8 CPU)

Device:
 tps Blk_read/sBlk_wrtn/sBlk_read
 Blk_wrtn

sda 1.87 2.58 114.12 6479462 286537372

Device:
 tps Blk_read/sBlk_wrtn/sBlk_read
 Blk_wrtn

sda
 0.00 0.00 0.00 0 0

Device:
 tps Blk_read/sBlk_wrtn/sBlk_read
 Blk_wrtn

sda
 1.00 0.00 12.00 0 24

解释如下:

Blk_read/s--&#x6BCF;&#x79D2;&#x8BFB;&#x53D6;&#x6570;&#x636E;&#x5757;&#x6570;
Blk_wrtn/s--&#x6BCF;&#x79D2;&#x5199;&#x5165;&#x6570;&#x636E;&#x5757;&#x6570;
Blk_read--&#x8BFB;&#x53D6;&#x7684;&#x6240;&#x6709;&#x5757;&#x6570;
Blk_wrtn--&#x5199;&#x5165;&#x7684;&#x6240;&#x6709;&#x5757;&#x6570;

可通过Blk_read/s和Blk_wrtn/s值对磁盘的读写性能有一个基本的了解.

如Blk_wrtn/s值很大,表示磁盘写操作频繁,考虑优化磁盘或程序,
如Blk_read/s值很大,表示磁盘直接读操作很多,可将读取的数据放入内存

规则遵循:

长期的、超大的数据读写,肯定是不正常的,这种情况一定会影响系统性能。

通过”sar –d”组合,可以对系统的磁盘IO做一个基本的统计,请看下面的一个输出:

[root@webserver ~]# sar -d 2 3

Linux
 2.6.9-42.ELsmp (webserver) 11/30/2008_i686_
 (8 CPU)

11:09:33
 PM DEV tps rd_sec/swr_sec/savgrq-sz
 avgqu-sz await svctm %util

11:09:35
 PM dev8-0 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00

11:09:35
 PM DEV tps rd_sec/swr_sec/savgrq-sz
 avgqu-sz await svctm %util

11:09:37
 PM dev8-0 1.00 0.00 12.00 12.00 0.00 0.00 0.00 0.00

11:09:37
 PM DEV tps rd_sec/swr_sec/savgrq-sz
 avgqu-sz await svctm %util

11:09:39
 PM dev8-0 1.99 0.00 47.76 24.00 0.00 0.50 0.25 0.05

Average:
 DEV tps rd_sec/swr_sec/savgrq-sz
 avgqu-sz await svctm %util

Average:
 dev8-0 1.00 0.00 19.97 20.00 0.00 0.33 0.17 0.02

参数含义:

对磁盘IO性能评判标准:

正常svctm应小于await值,而svctm和磁盘性能有关,CPU、内存负荷也会对svctm值造成影响,过多的请求也会间接的导致svctm值的增加。

await&#x503C;&#x53D6;&#x51B3;svctm&#x548C;I/O&#x961F;&#x5217;&#x957F;&#x5EA6;&#x4EE5;&#x53CA;I/O&#x8BF7;&#x6C42;&#x6A21;&#x5F0F;&#xFF0C;
&#x5982;&#x679C;svctm&#x7684;&#x503C;&#x4E0E;await&#x5F88;&#x63A5;&#x8FD1;&#xFF0C;&#x8868;&#x793A;&#x51E0;&#x4E4E;&#x6CA1;&#x6709;I/O&#x7B49;&#x5F85;&#xFF0C;&#x78C1;&#x76D8;&#x6027;&#x80FD;&#x5F88;&#x597D;&#xFF0C;
&#x5982;&#x679C;await&#x7684;&#x503C;&#x8FDC;&#x9AD8;&#x4E8E;svctm&#x7684;&#x503C;&#xFF0C;&#x5219;&#x8868;&#x793A;I/O&#x961F;&#x5217;&#x7B49;&#x5F85;&#x592A;&#x957F;&#xFF0C;&#x7CFB;&#x7EDF;&#x4E0A;&#x8FD0;&#x884C;&#x7684;&#x5E94;&#x7528;&#x7A0B;&#x5E8F;&#x5C06;&#x53D8;&#x6162;&#xFF0C;
&#x6B64;&#x65F6;&#x53EF;&#x4EE5;&#x901A;&#x8FC7;&#x66F4;&#x6362;&#x66F4;&#x5FEB;&#x7684;&#x786C;&#x76D8;&#x6765;&#x89E3;&#x51B3;&#x95EE;&#x9898;&#x3002;

%util–衡量磁盘I/O重要指标,

如%util接近100%,表示磁盘产生的I/O请求太多,I/O系统已经满负荷工作,该磁盘可能存在瓶颈。

可优化程序或者 通过更换 更高、更快的磁盘。

2.5.1. 网络性能评估

&#xFF08;1&#xFF09;&#x901A;&#x8FC7;ping&#x547D;&#x4EE4;&#x68C0;&#x6D4B;&#x7F51;&#x7EDC;&#x7684;&#x8FDE;&#x901A;&#x6027;
&#xFF08;2&#xFF09;&#x901A;&#x8FC7;netstat &#x2013;i&#x7EC4;&#x5408;&#x68C0;&#x6D4B;&#x7F51;&#x7EDC;&#x63A5;&#x53E3;&#x72B6;&#x51B5;
&#xFF08;3&#xFF09;&#x901A;&#x8FC7;netstat &#x2013;r&#x7EC4;&#x5408;&#x68C0;&#x6D4B;&#x7CFB;&#x7EDF;&#x7684;&#x8DEF;&#x7531;&#x8868;&#x4FE1;&#x606F;
&#xFF08;4&#xFF09;&#x901A;&#x8FC7;sar &#x2013;n&#x7EC4;&#x5408;&#x663E;&#x793A;&#x7CFB;&#x7EDF;&#x7684;&#x7F51;&#x7EDC;&#x8FD0;&#x884C;&#x72B6;&#x6001;

1.为磁盘I/O调整Linux内核电梯算法

在选择文件系统后,该算法能够平衡低延迟要求,收集足够的数据,并有效地组织对磁盘的读写请求。

[En]

After selecting the file system, the algorithm can balance the low latency requirements, collect enough data, and effectively organize read and write requests to the disk.

2.禁用不必要的守护进程,节省内存和CPU资源

&#x8BB8;&#x591A;&#x5B88;&#x62A4;&#x8FDB;&#x7A0B;&#x6216;&#x670D;&#x52A1;&#x901A;&#x5E38;&#x975E;&#x5FC5;&#x9700;&#xFF0C;&#x6D88;&#x8017;&#x5B9D;&#x8D35;&#x5185;&#x5B58;&#x548C;CPU&#x65F6;&#x95F4;&#x3002;&#x5C06;&#x670D;&#x52A1;&#x5668;&#x7F6E;&#x4E8E;&#x9669;&#x5730;&#x3002;
&#x7981;&#x7528;&#x53EF;&#x52A0;&#x5FEB;&#x542F;&#x52A8;&#x65F6;&#x95F4;&#xFF0C;&#x91CA;&#x653E;&#x5185;&#x5B58;&#x3002;

&#x51CF;&#x5C11;CPU&#x8981;&#x5904;&#x7406;&#x7684;&#x8FDB;&#x7A0B;&#x6570;

一些应被禁用的Linux守护进程,默认自动运行:

序号 守护进程 描述
1 Apmd 高级电源管理守护进程
2 Nfslock 用于NFS文件锁定
3 Isdn ISDN Moderm支持
4 Autofs 在后台自动挂载文件系统(如自动挂载CD-ROM)
5 Sendmail 邮件传输代理
6 Xfs X Window的字体服务器

3.关掉GUI

4、清理不需要的模块或功能

服务器软件包中太多被启动的功能或模块实际上是不需要的(如Apache中的许多功能模块),禁用掉有助于提高系统内存可用量,腾出资源给那些真正需要的软件,让它们运行得更快。

5、禁用控制面板

在Linux中,有许多流行的控制面板,如Cpanel,Plesk,Webmin和phpMyAdmin等,禁用释放出大约120MB内存,内存使用量大约下降30-40%。

6、改善Linux Exim服务器性能

使用DNS缓存守护进程,可降低解析DNS记录需要的带宽和CPU时间,DNS缓存通过消除每次都从根节点开始查找DNS记录的需求,从而改善网络性能。

Djbdns是一个非常强大的DNS服务器,它具有DNS缓存功能,Djbdns比BIND DNS服务器更安全,性能更好,可以直接通过http://cr.yp.to/下载,或通过Red Hat提供的软件包获得。

7、使用AES256增强gpg文件加密安全

为提高备份文件或敏感信息安全,许多Linux系统管理员都使用gpg进行加密,在使用gpg时,最好指定gpg使用AES256加密算法,AES256使用256位密钥,它是一个开放的加密算法,美国国家安全局(NSA)使用它保护绝密信息。

8、远程备份服务安全

安全是选择远程备份服务的最重要因素,大多数系统管理员害怕两件事:(黑客)可以删除备份文件,而不能从备份中恢复系统。

[En]

Security is the most important factor in choosing a remote backup service, and most system administrators are afraid of two things: (hackers) can delete backup files and cannot restore the system from backup.

为了保证备份文件100%的安全,备份服务公司提供远程备份服务器,使用scp脚本或RSYNC通过SSH传输数据,这样,没有人可以直接进入和访问远程系统,因此,也没有人可以从备份服务删除数据。在选择远程备份服务提供商时,最好从多个方面了解其服务强壮性,如果可以,可以亲自测试一下。

9、更新默认内核参数设置

为了顺利和成功运行企业应用程序,如数据库服务器,可能需要更新一些默认的内核参数设置,例如,2.4.x系列内核消息队列参数msgmni有一个默认值(例如,共享内存,或shmmax在Red Hat系统上默认只有33554432字节),它只允许有限的数据库并发连接,下面为数据库服务器更好地运行提供了一些建议值(来自IBM DB2支持网站):

kernel.shmmax=268435456 (32位)
kernel.shmmax=1073741824 (64位)
kernel.msgmni=1024
fs.file-max=8192
kernel.sem=”250 32000 32 1024″

10、优化TCP

优化TCP协议有助于提高网络吞吐量,跨广域网的通信使用的带宽越大,延迟时间越长时,建议使用越大的TCP Linux大小,以提高数据传输速率,TCP Linux大小决定了发送主机在没有收到数据传输确认时,可以向接收主机发送多少数据。

11、选择正确的文件系统

使用ext4文件系统取代ext3

● Ext4是ext3文件系统的增强版,扩展了存储限制

●具有日志功能,保证高水平的数据完整性(在非正常关闭事件中)

●非正常关闭和重启时,它不需要检查磁盘(这是一个非常耗时的动作)

●更快的写入速度,ext4日志优化了硬盘磁头动作

12、使用noatime文件系统挂载选项

在文件系统启动配置文件fstab中使用noatime选项,如果使用了外部存储,这个挂载选项可以有效改善性能。

13、调整Linux文件描述符限制

Linux限制了任何进程可以打开的文件描述符数量,默认限制是每进程1024,这些限制可能会阻碍基准测试客户端(如httperf和apachebench)和Web服务器本身获得最佳性能,Apache每个连接使用一个进程,因此不会受到影响,但单进程Web服务器,如Zeus是每连接使用一个文件描述符,因此很容易受默认限制的影响。

打开文件限制是一个可以用ulimit命令调整的限制,ulimit -aS命令显示当前的限制,ulimit -aH命令显示硬限制(在未调整/proc中的内核参数前,你不能增加限制)。

Linux第三方应用程序性能技巧

对于运行在Linux上的第三方应用程序,一样有许多性能优化技巧,这些技巧可以帮助你提高Linux服务器的性能,降低运行成本。

14、正确配置MySQL

为了给MySQL分配更多的内存,可设置MySQL缓存大小,要是MySQL服务器实例使用了更多内存,就减少缓存大小,如果MySQL在请求增多时停滞不动,就增加MySQL缓存。

15、正确配置Apache

检查Apache使用了多少内存,再调整StartServers和MinSpareServers参数,以释放更多的内存,将有助于你节省30-40%的内存。

16、分析Linux服务器性能

提高系统效率的最好办法是找出导致整体速度下降的瓶颈,并加以解决。以下是识别系统关键瓶颈的一些基本技术:

[En]

The best way to improve the efficiency of the system is to identify the bottlenecks that lead to the overall speed decline and solve them. Here are some basic techniques for identifying the key bottlenecks of the system:

● 当大型应用程序,如OpenOffice和Firefox同时运行时,计算机可能会开始变慢,内存不足的出现几率更高。

● 如果启动时真的很慢,可能是应用程序初次启动需要较长的加载时间,一旦启动好后运行就正常了,否则很可能是硬盘太慢了。

●CPU负载持续很高,内存也够用,但CPU利用率很低,可以使用CPU负载分析工具监控负载时间。

17、学习5个Linux性能命令

使用几个命令就可以管理Linux系统的性能了,下面列出了5个最常用的Linux性能命令,包括
top、vmstat、iostat、free和sar,它们有助于系统管理员快速解决性能问题。

当前内核服务任务还显示许多主机的状态统计信息,默认情况下每5秒自动更新一次。

[En]

The current kernel service task also displays statistics on the status of many hosts, which are automatically updated every 5 seconds by default.

如:当前正常运行时间,系统负载,进程数量和内存使用率,

此外,这个命令也显示了那些使用最多CPU时间的进程(包括每个进程的各种信息,如运行用户,执行的命令等)。

Vmstat命令提供当前CPU、IO、进程和内存使用率的快照,它和top命令类似,自动更新数据,如:

$ vmstat 10

Iostat提供三个报告:CPU利用率、设备利用率和网络文件系统利用率,使用-c,-d和-h参数可以分别独立显示这三个报告。

显示主内存和交换空间内存统计数据,指定-t参数显示总内存,指定-b参数按字节为单位,使用-m则以兆为单位,默认情况下千字节为单位。

Free命令也可以使用-s参数加一个延迟时间(单位:秒)连续运行,如:

$ free -s 5

收集、查看和记录性能数据,此命令比以前的命令更旧,它可以收集和显示更长时间段的数据。

[En]

Collect, view, and record performance data, this command is older than the previous commands, it can collect and display longer periods of data.

下面是一些归类为其它的性能技巧:

18、将日志文件转移到内存中

当一台机器处于运行中时,最好是将系统日志放在内存中,当系统关闭时再将其复制到硬盘,当你运行一台开启了syslog功能的笔记本电脑或移动设备时,ramlog可以帮助你提高系统电池或移动设备闪存驱动器的寿命,使用ramlog的一个好处是,不用再担心某个守护进程每隔30秒向syslog发送一条消息,放在以前,硬盘必须随时保持运转,这样对硬盘和电池都不好。

19、先打包,后写入

在内存中划分出固定大小的空间保存日志文件,这意味着笔记本电脑硬盘不用一直保持运转,只有当某个守护进程需要写入日志时才运转,注意ramlog使用的内存空间大小是固定的,否则系统内存会很快被用光,如果笔记本使用固态硬盘,可以分配50-80MB内存给ramlog使用,ramlog可以减少许多写入周期,极大地提高固态硬盘的使用寿命。

20、一般调优技巧

尽可能使用 静态内容替代动态内容,如果你在生成天气预告,或其它每隔1小时就必须更新的数据,最好是写一个程序,每隔1小时生成一个静态的文件,而不是让用户运行一个CGI动态地生成报告。

为动态应用程序选择最快最合适的API,CGI可能最容易编程,但它会为每个请求产生一个进程,通常,这是一个成本很高,且不必要的过程,FastCGI是更好的选择,和Apache的mod_perl一样,都可以极大地提高应用程序的性能。

Original: https://www.cnblogs.com/YatHo/p/8657685.html
Author: YatHo
Title: Linux服务器性能分析与调优

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/10114/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

最近整理资源【免费获取】:   👉 程序员最新必读书单  | 👏 互联网各方向面试题下载 | ✌️计算机核心资源汇总