centos文件句柄,linux文件句柄满了

修改文件句柄数

在Linux系统中,文件句柄数量的管理是保证系统资源有效利用的关键环节。对于Ubuntu、CentOS等常见的发行版,我们可以通过以下步骤来调整文件句柄限制:

首先,以超级用户权限登录系统,这一步至关重要,因为文件句柄的修改需要系统级别的权限。然后,打开终端或者命令行界面,以便进行后续操作。

接下来,找到并打开系统配置文件/etc/security/limits.conf。这是一份包含用户和系统资源限制的配置文件,我们通常使用文本编辑器如vi来操作它:

sudo vi/etc/security/limits.conf

在文件的末尾,添加新的行以增加文件句柄的限制,这里我们引入一个可自定义的变量<new_limit>,它将决定新的句柄限制值:

* soft nofile<new_limit>* hard nofile<new_limit>

这里的soft代表软限制,即用户可以使用的最大句柄数;hard则是硬限制,它设定的是软限制的上限。通常情况下,两者设置为相同的数值最为合适。

确保添加了上述行后,记得save并exit编辑器,以保存你的更改。

最后,为了使更改生效,系统需要重启或者当前用户重新登录。这样,新的文件句柄限制将被应用,有助于优化资源管理,防止因文件句柄过多导致的性能问题。

通过这个过程,你可以灵活地调整你的Linux系统中文件句柄的数量,以适应不同的应用需求,提升系统的整体性能和稳定性。

linux中文件句柄未释放,会导致什么问题

linux删除文件后没有释放空间

今天发现一台服务器的home空间满了,于是要清空没用的文件,当我删除文件后,发现可用空间没有变化

os:centos4.7

现象:

发现当前磁盘空间使用情况:

[root@ticketb~]# df-h

Filesystem Size Used Avail Use% Mounted on

/dev/sda1 981M 203M 729M 22%/

none 16G 0 16G 0%/dev/shm

/dev/sda9 2.9G 37M 2.7G 2%/tmp

/dev/sda7 4.9G 1.9G 2.7G 42%/usr

/dev/sda8 2.9G 145M 2.6G 6%/var

/dev/mapper/vghome-lvhome

20G 19G 11M 100%/home

/dev/mapper/vgoradata-lvoradata

144G 48G 90G 35%/u01/oradata

/dev/mapper/vgbackup-lvbackup

193G 7.8G 175G 5%/u01/backup

通过以下的命令找到没用的文件,然后删除

[root@ticketb~]# find/home/oracle/admin/dbticb/udump/-name"dbticb_*.trc"-mtime+50| xargs rm-rf

然后在查看磁盘空间使用情况,发现没有/home空间没有变化

[root@ticketb~]# df-h

Filesystem Size Used Avail Use% Mounted on

/dev/sda1 981M 203M 729M 22%/

none 16G 0 16G 0%/dev/shm

/dev/sda9 2.9G 37M 2.7G 2%/tmp

/dev/sda7 4.9G 1.9G 2.7G 42%/usr

/dev/sda8 2.9G 145M 2.6G 6%/var

/dev/mapper/vghome-lvhome

20G 19G 11M 100%/home

/dev/mapper/vgoradata-lvoradata

144G 48G 90G 35%/u01/oradata

/dev/mapper/vgbackup-lvbackup

193G 7.8G 175G 5%/u01/backup

这个郁闷啊,明明删除文件了,怎么空间没有被释放啊,rm命令应该是直接删除啊,在查看下/home下还有什么占用空间

[root@ticketb~]# du-h--max-depth=1/home

16K/home/lost+found

2.6G/home/oracle

2.6G/home

可这里显示空间已经释放了啊,于是google下,

未释放磁盘空间原因:

在Linux或者Unix系统中,通过rm或者文件管理器删除文件将会从文件系统的文件夹结构上解除链接(unlink).然而假设文件是被

打开的(有一个进程正在使用),那么进程将仍然能够读取该文件,磁盘空间也一直被占用。而我删除的是oracle的告警log文件

删除的时候文件应该正在被使用

解决方法

首先获得一个已经被删除可是仍然被应用程序占用的文件列表,例如以下所看到的:

[root@ticketb~]# lsof|grep deleted

oracle 12639 oracle 5w REG 253,0 648 215907/home/oracle/admin/dbticb/udump/dbticb_ora_12637.trc(deleted)

oracle 12639 oracle 6w REG 253,0 16749822091 215748/home/oracle/admin/dbticb/bdump/alert_dbticb.log(deleted)

oracle 12639 oracle 7u REG 253,0 0 36282/home/oracle/oracle/product/10.2.0/db_1/dbs/lkinstdbticb(deleted)

oracle 12639 oracle 8w REG 253,0 16749822091 215748/home/oracle/admin/dbticb/bdump/alert_dbticb.log(deleted)

oracle 12641 oracle 5w REG 253,0 648 215907/home/oracle/admin/dbticb/udump/dbticb_ora_12637.trc(deleted)

oracle 12641 oracle 6w REG 253,0 16749822091 215748/home/oracle/admin/dbticb/bdump/alert_dbticb.log(deleted)

oracle 23492 oracle 6w REG 253,0 16749822091 215748/home/oracle/admin/dbticb/bdump/alert_dbticb.log(deleted)

oracle 23492 oracle 7u REG 253,0 0 36282/home/oracle/oracle/product/10.2.0/db_1/dbs/lkinstdbticb(deleted)

oracle 23492 oracle 8w REG 253,0 16749822091 215748/home/oracle/admin/dbticb/bdump/alert_dbticb.log(deleted)

oracle 23494 oracle 10u REG 253,0 0 36307/home/oracle/oracle/product/10.2.0/db_1/dbs/lkinstrmandb(deleted)

从输出结果能够看到/home/oracle/admin/dbticb/bdump/alert_dbticb.log还被使用,未被释放空间

怎样让进程释放呢?

一种方法是kill掉相应的进程,或者停掉使用这个文件的应用,让os自己主动回收磁盘空间

我这个环境有非常多进程在使用的这个文件,停掉进程有点麻烦,再有就是风险非常大

当linux打开一个文件的时候,Linux内核会为每个进程在/proc/『/proc/nnnn/fd/文件夹(nnnn为pid)』建立一个以其pid

为名的文件夹用来保存进程的相关信息,而其子文件夹fd保存的是该进程打开的全部文件的fd(fd:file descriptor)。

kill进程是通过截断proc文件系统中的文件能够强制要求系统回收分配给正在使用的的文件。

这是一项高级技术,仅到管理员确定不会对执行中的进程造成影响时使用。应用程序对这样的方

式支持的并不好,当一个正在使用的文件被截断可能会引发不可预知的问题

所以我还是采用停应用来解决

restart oracle数据库,发现/home/oracle/admin/dbticb/bdump/alert_dbticb.log相应的空间被释放

在查看磁盘空间的使用情况,发现空间已经回收了

[root@ticketb~]# df-h

Filesystem Size Used Avail Use% Mounted on

/dev/sda1 981M 203M 729M 22%/

none 16G 0 16G 0%/dev/shm

/dev/sda9 2.9G 37M 2.7G 2%/tmp

/dev/sda7 4.9G 1.9G 2.7G 42%/usr

/dev/sda8 2.9G 145M 2.6G 6%/var

/dev/mapper/vghome-lvhome

20G 2.6G 16G 15%/home

/dev/mapper/vgoradata-lvoradata

144G 48G 90G 35%/u01/oradata

/dev/mapper/vgbackup-lvbackup

193G 7.8G 175G 5%/u01/backup

ok,问题解决,然后做下收尾工作就可以

-------------------------------------------------------------------------------------------------

学习下lsof命令

lsof全名list opened files,也就是列举系统中已经被打开的文件。我们都知道,linux环境中,不论什么事物都是文件,

设备是文件,文件夹是文件,甚至sockets也是文件。所以,用好lsof命令,对日常的linux管理非常有帮助。

lsof是linux最常常使用的命令之中的一个,通常的输出格式为:

引用

COMMAND PID USER FD TYPE DEVICE SIZE NODE NAME

如何查看进程所打开的文件句柄数

1.lsof-n|awk'{print$2}'|sort|uniq-c|sort-nr|more

在系统访问高峰时间以root用户执行上面的脚本,可能出现的结果如下:

1.# lsof-n|awk'{print$2}'|sort|uniq-c|sort-nr|more

2. 131 24204

3. 57 24244

4. 57 24231

5. 56 24264

其中第一行是打开的文件句柄数量,第二行是进程号。得到进程号后,我们可以通过ps命令得到进程的详细内容。

1.ps-aef|grep 24204

2.mysql 24204 24162 99 16:15? 00:24:25/usr/sbin/mysqld

哦,原来是mysql进程打开最多文件句柄数量。但是他目前只打开了131个文件句柄数量,远远底于系统默认值1024。

但是如果系统并发特别大,尤其是squid服务器,很有可能会超过1024。这时候就必须要调整系统参数,以适应应用变化。Linux有硬性限制和软性限制。可以通过ulimit来设定这两个参数。方法如下,以root用户运行以下命令:

1.ulimit-HSn 4096

上命令中,H指定了硬性大小,S指定了软性大小,n表示设定单个进程最大的打开文件句柄数量。个人觉得最好不要超过4096,毕竟打开的文件句柄数越多响

应时间肯定会越慢。设定句柄数量后,系统重启后,又会恢复默认值。如果想永久保存下来,,可以修改/etc/profile

把上面命令加到最后。(findsun提出的办法比较合理)

/////////////////////////////////////////////////////////////////////////////

在 Linux下面部署应用的时候,有时候会遇上Socket/File: Can't open so many

files的问题,其实Linux是有文件句柄限制的(就像WinXP?),而且默认不是很高,一般都是1024,作为一台生产服务器,其实很容易就达到

这个数量,因此我们需要把这个值改大一些。

大概知道ulimit这个命令是相关的,上Google搜索了一下,大多数说的很含糊,也没有统一说一下,经过两个小时看了不少文章终于弄清楚ulimit相关的一些配置问题。

我们可以用ulimit-a来查看所有限制值,我只关心文件句柄数量的问题

open files(-n) 1024

这个就是限制数量

这里,有很多ulimit的文章都说的很含糊,究竟这个1024是系统的限制,还是用户的限制呢。其实,这个是用户限制来的,完整的说法,应该是当前用户准备要运行的程序的限制。

1、这个限制是针对单个程序的限制

2、这个限制不会改变之前已经运行了的程序的限制

3、对这个值的修改,退出了当前的shell就会消失

比如说,我先运行了一个程序A,然后通过ulimit修改了限制为2048,然后运行B,然后退出了shell再登录,然后运行C。那就只有B可以打开2048个句柄。

如果我们需要改变整体的限制值,或者我们运行的程序是系统启动的,应该怎么处理呢

其中一个方法,是想ulimit修改命令放入/etc/profile里面,但是这个做法并不好

正确的做法,应该是修改/etc/security/limits.conf

里面有很详细的注释,比如

* soft nofile 2048

* hard nofile 32768

就可以将文件句柄限制统一改成软2048,硬32768

这里涉及另外一个问题,什么是软限制,什么是硬限制

硬限制是实际的限制,而软限制,是warnning限制,只会做出warning

其实ulimit命令本身就有分软硬设置,加-H就是硬,加-S就是软

默认显示的是软限制,如果修改的时候没有加上的话,就是两个一起改

配置文件最前面的一位是domain,设置为星号代表全局,另外你也可以针对不同的用户做出不同的限制

修改了,重新登录用ulimit一开就立刻生效了,不过之前启动过的程序要重新启动才能使用新的值。我用的是CentOS,似乎有些系统需要重启才能生效。

ulimit其实就是对单一程序的限制

那系统总限制呢

其实是在这里,/proc/sys/fs/file-max

可以通过cat查看目前的值,echo来立刻修改

另外还有一个,/proc/sys/fs/file-nr

只读,可以看到整个系统目前使用的文件句柄数量

查找文件句柄问题的时候,还有一个很实用的程序lsof

可以很方便看到某个进程开了那些句柄

也可以看到某个文件/目录被什么进程占用了。

阅读剩余
THE END