linux 进程 io linux软件源配置
大家好,如果您还对linux 进程 io不太了解,没有关系,今天就由本站为大家分享linux 进程 io的知识,包括linux软件源配置的问题都会给大家分析到,还望可以解决大家的问题,下面我们就开始吧!
如何查看Linux下进程的IO活动状况 00 Hey,Linux
前段时间,几台测试服务器的Web应用响应速度非常慢,系统负载也比较高,> 10,但CPU和内存却很闲,于是怀疑是磁盘的性能瓶颈,通过vmstat和iostat看到IO的读写量非常大,尤其是用iostat-x 1命令可以很直观的看到IO的使用率一直在100%。
但究竟是什么进程导致的高IO呢,由于每台服务器上都有JBoss和MySQL的存在,JBoss会不停的产生很多小的数据文件和生成文本数据库的数据,而MySQL则会不停的从Master同步新的数据。因此我们怀疑是这两个进程导致的高IO,通过停止了JBoss和MySQL之后,IO立刻降为0%.但我们还是不能确定谁是主因,于是寻找可以查看特定进程IO的方法。
最后,找到了两个方法可以查看进程IO的活动状况。
1.第一个方法是通过一个python脚本来实现。
方法是将以下内容另存为一个叫io.py的脚本中,然后直接以root身份执行脚本,就可以看到如下图所示的信息(由于我们已经通过升级到SSD硬盘解决了MySQL的IO问题,所以不能提供关于MySQL的截图了),其中出现次数最多,数据最大的进程,就是导致高IO的主因。不过比较遗憾的是这个脚本并不能显示进程在每一秒的准确的IO读写。
# vim io.py
# chmod+x io.py
#./io.py
#!/usr/bin/python
# Monitoring per-process disk I/O activity
# written by
import sys, os, time, signal, re
class DiskIO:
def __init__(self, pname=None, pid=None, reads=0, writes=0):
self.pname= pname
self.pid= pid
self.reads= 0
self.writes= 0
def main():
argc= len(sys.argv)
if argc!= 1:
print"usage:./iotop"
sys.exit(0)
if os.getuid()!= 0:
print"must be run as root"
sys.exit(0)
signal.signal(signal.SIGINT, signal_handler)
os.system('echo 1>/proc/sys/vm/block_dump')
print"TASK PID READ WRITE"
while True:
os.system('dmesg-c>/tmp/diskio.log')
l= []
f= open('/tmp/diskio.log','r')
line= f.readline()
while line:
m= re.match(\
'^(\S+)\((\d+)\):(READ|WRITE) block(\d+) on(\S+)', line)
if m!= None:
if not l:
l.append(DiskIO(m.group(1), m.group(2)))
line= f.readline()
continue
found= False
for item in l:
if item.pid== m.group(2):
found= True
if m.group(3)=="READ":
item.reads= item.reads+ 1
elif m.group(3)=="WRITE":
item.writes= item.writes+ 1
if not found:
l.append(DiskIO(m.group(1), m.group(2)))
line= f.readline()
time.sleep(1)
for item in l:
print"%-10s%10s%10d%10d"%\
(item.pname, item.pid, item.reads, item.writes)
def signal_handler(signal, frame):
os.system('echo 0>/proc/sys/vm/block_dump')
sys.exit(0)
if __name__=="__main__":
main()
2.另一个方法是将Linux的内核升级到>=2.6.20,然后安装一个iotop软件来实现。
不过这种改动并不适用于生产环境,因为在RHEL5.6和5.7上,内核都在 2.6.20以下。但是它所显示的结果是非常准确的,所以对于新上线的机器以及测试环境,非常值得一试,具体方法如下:
下载和升级新内核(>=2.6.20),编译时打开 TASK_DELAY_ACCT和 TASK_IO_ACCOUNTING选项。
解压内核后进入配置界面:
# wget
# tar jxvf linux-2.6.39.tar.gz
# mv linux-2.6.39/usr/src/
# cd/usr/src/linux-2.6.39
# make oldconfig//使用make oldconfig可以继承老的kernel的配置,为自己的配置省去很多麻烦。
# make menuconfig
把General setup- Enable per-task storage I/O accounting这个选项选上。
# vim.config
将#CONFIG_SYSFS_DEPRECATED_V2 is not set的注释去掉的,将其改为y,即修改为CONFIG_SYSFS_DEPRECATED_V2=y。
保存内核后编译内核:
# make
# make modules
# make modules_install
# make install
修改默认以新的内核启动:
# vi/boot/grub/grub.conf
default=0
将新的内核配置文件复制到/boot目录:
# cp/usr/src/linux-2.6.39/.config/boot/config-2.6.39
重启服务器:
# reboot
# uname–r
2.6.39
重启完成后确认内核版本是否正确。
源码安装iotop所需的Python 2.7.2(>= 2.5):
# wget
# tar xzvf Python-2.7.2.tgz
# cd Python-2.7.2
#./configure
# make; make install
下载并安装iotop:
# wget
# tar-xjvf iotop-0.4.4.tar.bz2
# cd iotop-0.4.4
# python setup.py build
# python setup.py install
然后就可以使用iotop看到如下图所示的信息:
求高手,linux系统几乎所有进程处于sleep状态是否正常
你的sleep进程基本上都是java相关的。可能是由于某个进程长期得不到响应,比如nfs造成的IO中断,应用一直在等待响应,等的都睡着了。。所以也看不到报错,呵呵。具体的也看不出到底是哪个进程引起的。建议就是重启相关的java应用。或者重启机器。
进程为什么会被置于uninterruptible sleep状态呢?处于uninterruptible sleep状态的进程通常是在等待IO,比如磁盘IO,网络IO,其他外设IO,如果进程正在等待的IO在较长的时间内都没有响应,那么就很会不幸地被 ps看到了,同时也就意味着很有可能有IO出了问题,可能是外设本身出了故障,也可能是比如挂载的远程文件系统已经不可访问了,我以前遇到的问题就是由 down掉的NFS服务器引起的。
正是因为得不到IO的相应,进程才进入了uninterruptible sleep状态,所以要想使进程从uninterruptible sleep状态恢复,就得使进程等待的IO恢复,比如如果是因为从远程挂载的NFS卷不可访问导致进程进入uninterruptible sleep状态的,那么可以通过恢复该NFS卷的连接来使进程的IO请求得到满足,除此之外,要想干掉处在D状态进程就只能重启整个Linux系统了。
linux 系统查看哪个进程占io
lsof是一个列出当前系统打开文件的工具。在linux环境下,任何事物都以文件的形式存在,通过文件不仅仅可以访问常规数据,还可以访问网络连接和硬件。
常用的参数列表
lsof filename显示打开指定文件的所有进程
lsof-a表示两个参数都必须满足时才显示结果
lsof-c string显示COMMAND列中包含指定字符的进程所有打开的文件
lsof-u username显示所属user进程打开的文件
lsof-g gid显示归属gid的进程情况
lsof+d/DIR/显示目录下被进程打开的文件
lsof+D/DIR/同上,但是会搜索目录下的所有目录,时间相对较长
lsof-d FD显示指定文件描述符的进程
lsof-n不将IP转换为hostname,缺省是不加上-n参数
lsof-i用以显示符合条件的进程情况
lsof-i[46] [protocol][@hostname|hostaddr][:service|port]
46--> IPv4 or IPv6
protocol--> TCP or UDP
hostname--> Internet host name
hostaddr--> IPv4地址
service-->/etc/service中的 service name(可以不只一个)
port-->端口号(可以不只一个)