linux 进程 io linux软件源配置

大家好,如果您还对linux 进程 io不太了解,没有关系,今天就由本站为大家分享linux 进程 io的知识,包括linux软件源配置的问题都会给大家分析到,还望可以解决大家的问题,下面我们就开始吧!

如何查看Linux下进程的IO活动状况 00 Hey,Linux

前段时间,几台测试服务器的Web应用响应速度非常慢,系统负载也比较高,> 10,但CPU和内存却很闲,于是怀疑是磁盘的性能瓶颈,通过vmstat和iostat看到IO的读写量非常大,尤其是用iostat-x 1命令可以很直观的看到IO的使用率一直在100%。

但究竟是什么进程导致的高IO呢,由于每台服务器上都有JBoss和MySQL的存在,JBoss会不停的产生很多小的数据文件和生成文本数据库的数据,而MySQL则会不停的从Master同步新的数据。因此我们怀疑是这两个进程导致的高IO,通过停止了JBoss和MySQL之后,IO立刻降为0%.但我们还是不能确定谁是主因,于是寻找可以查看特定进程IO的方法。

最后,找到了两个方法可以查看进程IO的活动状况。

1.第一个方法是通过一个python脚本来实现。

方法是将以下内容另存为一个叫io.py的脚本中,然后直接以root身份执行脚本,就可以看到如下图所示的信息(由于我们已经通过升级到SSD硬盘解决了MySQL的IO问题,所以不能提供关于MySQL的截图了),其中出现次数最多,数据最大的进程,就是导致高IO的主因。不过比较遗憾的是这个脚本并不能显示进程在每一秒的准确的IO读写。

# vim io.py

# chmod+x io.py

#./io.py

#!/usr/bin/python

# Monitoring per-process disk I/O activity

# written by

import sys, os, time, signal, re

class DiskIO:

def __init__(self, pname=None, pid=None, reads=0, writes=0):

self.pname= pname

self.pid= pid

self.reads= 0

self.writes= 0

def main():

argc= len(sys.argv)

if argc!= 1:

print"usage:./iotop"

sys.exit(0)

if os.getuid()!= 0:

print"must be run as root"

sys.exit(0)

signal.signal(signal.SIGINT, signal_handler)

os.system('echo 1>/proc/sys/vm/block_dump')

print"TASK PID READ WRITE"

while True:

os.system('dmesg-c>/tmp/diskio.log')

l= []

f= open('/tmp/diskio.log','r')

line= f.readline()

while line:

m= re.match(\

'^(\S+)\((\d+)\):(READ|WRITE) block(\d+) on(\S+)', line)

if m!= None:

if not l:

l.append(DiskIO(m.group(1), m.group(2)))

line= f.readline()

continue

found= False

for item in l:

if item.pid== m.group(2):

found= True

if m.group(3)=="READ":

item.reads= item.reads+ 1

elif m.group(3)=="WRITE":

item.writes= item.writes+ 1

if not found:

l.append(DiskIO(m.group(1), m.group(2)))

line= f.readline()

time.sleep(1)

for item in l:

print"%-10s%10s%10d%10d"%\

(item.pname, item.pid, item.reads, item.writes)

def signal_handler(signal, frame):

os.system('echo 0>/proc/sys/vm/block_dump')

sys.exit(0)

if __name__=="__main__":

main()

2.另一个方法是将Linux的内核升级到>=2.6.20,然后安装一个iotop软件来实现。

不过这种改动并不适用于生产环境,因为在RHEL5.6和5.7上,内核都在 2.6.20以下。但是它所显示的结果是非常准确的,所以对于新上线的机器以及测试环境,非常值得一试,具体方法如下:

下载和升级新内核(>=2.6.20),编译时打开 TASK_DELAY_ACCT和 TASK_IO_ACCOUNTING选项。

解压内核后进入配置界面:

# wget

# tar jxvf linux-2.6.39.tar.gz

# mv linux-2.6.39/usr/src/

# cd/usr/src/linux-2.6.39

# make oldconfig//使用make oldconfig可以继承老的kernel的配置,为自己的配置省去很多麻烦。

# make menuconfig

把General setup- Enable per-task storage I/O accounting这个选项选上。

# vim.config

将#CONFIG_SYSFS_DEPRECATED_V2 is not set的注释去掉的,将其改为y,即修改为CONFIG_SYSFS_DEPRECATED_V2=y。

保存内核后编译内核:

# make

# make modules

# make modules_install

# make install

修改默认以新的内核启动:

# vi/boot/grub/grub.conf

default=0

将新的内核配置文件复制到/boot目录:

# cp/usr/src/linux-2.6.39/.config/boot/config-2.6.39

重启服务器:

# reboot

# uname–r

2.6.39

重启完成后确认内核版本是否正确。

源码安装iotop所需的Python 2.7.2(>= 2.5):

# wget

# tar xzvf Python-2.7.2.tgz

# cd Python-2.7.2

#./configure

# make; make install

下载并安装iotop:

# wget

# tar-xjvf iotop-0.4.4.tar.bz2

# cd iotop-0.4.4

# python setup.py build

# python setup.py install

然后就可以使用iotop看到如下图所示的信息:

求高手,linux系统几乎所有进程处于sleep状态是否正常

你的sleep进程基本上都是java相关的。可能是由于某个进程长期得不到响应,比如nfs造成的IO中断,应用一直在等待响应,等的都睡着了。。所以也看不到报错,呵呵。具体的也看不出到底是哪个进程引起的。建议就是重启相关的java应用。或者重启机器。

进程为什么会被置于uninterruptible sleep状态呢?处于uninterruptible sleep状态的进程通常是在等待IO,比如磁盘IO,网络IO,其他外设IO,如果进程正在等待的IO在较长的时间内都没有响应,那么就很会不幸地被 ps看到了,同时也就意味着很有可能有IO出了问题,可能是外设本身出了故障,也可能是比如挂载的远程文件系统已经不可访问了,我以前遇到的问题就是由 down掉的NFS服务器引起的。

正是因为得不到IO的相应,进程才进入了uninterruptible sleep状态,所以要想使进程从uninterruptible sleep状态恢复,就得使进程等待的IO恢复,比如如果是因为从远程挂载的NFS卷不可访问导致进程进入uninterruptible sleep状态的,那么可以通过恢复该NFS卷的连接来使进程的IO请求得到满足,除此之外,要想干掉处在D状态进程就只能重启整个Linux系统了。

linux 系统查看哪个进程占io

lsof是一个列出当前系统打开文件的工具。在linux环境下,任何事物都以文件的形式存在,通过文件不仅仅可以访问常规数据,还可以访问网络连接和硬件。

常用的参数列表

lsof filename显示打开指定文件的所有进程

lsof-a表示两个参数都必须满足时才显示结果

lsof-c string显示COMMAND列中包含指定字符的进程所有打开的文件

lsof-u username显示所属user进程打开的文件

lsof-g gid显示归属gid的进程情况

lsof+d/DIR/显示目录下被进程打开的文件

lsof+D/DIR/同上,但是会搜索目录下的所有目录,时间相对较长

lsof-d FD显示指定文件描述符的进程

lsof-n不将IP转换为hostname,缺省是不加上-n参数

lsof-i用以显示符合条件的进程情况

lsof-i[46] [protocol][@hostname|hostaddr][:service|port]

46--> IPv4 or IPv6

protocol--> TCP or UDP

hostname--> Internet host name

hostaddr--> IPv4地址

service-->/etc/service中的 service name(可以不只一个)

port-->端口号(可以不只一个)

阅读剩余
THE END