centos监控磁盘(centos镜像)
今天给各位分享centos监控磁盘的知识,其中也会对centos镜像进行解释,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在开始吧!
在CentOS系统上安装网络监控软件ntopng
ntopng是什么
Ntopng是一个基于网页的高速通信分析器和流量收集器。Ntopng基于ntop,它运行于所有Unix平台、MacOS X和Windows。
特性
从ntopng网站上,我们可以看到他们说它有众多的特性。这里列出了其中一些:
按各种协议对网络通信排序
显示网络通信和IPv4/v6的激活主机
持续不断以RRD格式存储定位主机的通信数据到磁盘
通过nDPI,ntop的DPI框架,发现应用协议
显示各种协议间的IP通信分布
分析IP通信,并根据源/目的地址进行排序
显示IP通信子网的矩阵(谁在和谁通信?)
报告按协议类型排序的IP协议使用率
生成HTML5/AJAX网络通信数据
安装的先决条件
Ntop为CentOS和基于64位Ubuntu预编译好了包,你可以在它们的下载页面找到这些包。对于32位操作系统,你必须从源代码编译。本文在CentOS 6.4 32位版本上测试过。但是,它也可以在其它基于CentOS/RedHat的Linux版本上工作。让我们开始吧。
开发工具
你必须确保你安装了编译ntopng所需的所有开发工具,要安装开发工具,你可以使用yum命令:
代码如下:
# yum groupinstall‘Development Tools’
安装TCL
代码如下:
# yum install tcl
安装libpcap
代码如下:
# yum install libpcap libpcap-devel
安装Redis
代码如下:
# wget
# tar zxfv redis-2.6.13.tar.gz
# cd redis-2.6.13
# make 32bit
# make test
# make install
安装ntopng
方法 1:
代码如下:
# wget
# tar zxfv ntopng-1.1_6932.tgz
# cd ntopng-1.1_6932
#./configure
# make
# make install
方法 2:
在我的CentOS 6.4上,我使用方法 1时收到了一个错误消息,错误消息内容如下:
代码如下:
./third-party/LuaJIT-2.0.2/src/libluajit.a: could not read symbols: File in wrong format
所以,我切换到了SVN来安装。对于此方法,需要联网,步骤如下:
代码如下:
# svn co
#./autogen.sh
#./configure
# make
# make install
由于ntopng是一个基于网页的应用,你的系统必须安装有工作良好的 Web服务器
为ntopng创建配置文件
如果一切都已安装完毕,那么我们该来运行它了。默认情况下,如果我们在./configure这一步没有明确修改安装文件夹的话,redis和ntopng将安装到/usr/local/文件夹。接下来,我们需要为ntopng创建配置文件。在本文中,我们使用vi作为文本编辑器。你也可以使用你所中意的文本编辑器来创建ntopng的配置文件。
代码如下:
# cd/usr/local/etc
# mkdir ntopng
# cd ntopng
# vi ntopng.start
放入这些行:
代码如下:
--local-network"10.0.2.0/24"
--interface 1
p# vi ntopng.pid
放入该行:
代码如下:
-G=/var/run/ntopng.pid
保存这些文件,然后继续下一步。
运行ntopng
我们假定你已正确安装了网络服务器,那么下一步就是运行redis服务器。
复制代码
代码如下:
#/usr/local/bin/redis-server
然后,运行ntopng
复制代码
代码如下:
#/usr/local/bin/ntopng
测试ntopng
现在,你可以通过访问来测试ntopng应用,你将会看到ntopng登录页面。首次登录,你可以使用用户‘admin’和密码‘admin’。
仪表盘相当简洁。当你登入后,你将看到关于最高流量通信者页面。
如果你点击右侧顶部的流量菜单,ntopng将会显示活动流量的更多细节。
在主机菜单上,你可以看到连接到流的所有主机。
Ntopng Hosts List
如果你点击主机交互,ntop将显示一个漂亮的主机间的交互信息图表。
仪表盘菜单
组成部分:
顶级主机(发送+接收)
顶级应用协议
Ntopng Apps
界面菜单将引领你进入更多内部菜单。包菜单将给你显示包的大小分布。
协议菜单将为你显示使用了多少协议及其使用百分比。
你也可以通过使用历史活跃度菜单查看活跃度。
最后一项要点是,你也可以通过顶部右侧区域的设置菜单(齿轮图标的那一个)管理哪些用户可以访问ntopng。
Ntopng为你提供了一个范围宽广的时间线,从5分钟到1年都可以。你只需要点击你想要显示的时间线。图表本身是可以点击的,你可以点击它来进行缩放。
当然,ntopng能做的事比上面图片中展示的还要多得多。你也可以将定位和电子地图服务整合进来。在ntopng自己的网站上,有已付费的模块可供使用,如nprobe可以扩展ntopng可以提供给你的信息。更多关于ntopng的信息,你可以访问ntopng网站。
CentOS下检测硬盘上的坏道和坏块
让我们从坏道和坏块的定义开始说起,它们是一块磁盘或闪存上不再能够被读写的部分,一般是由于磁盘表面特定的物理损坏或闪存晶体管失效导致的。
随着坏道的继续积累,它们会对你的磁盘或闪存容量产生令人不快或破坏性的影响,甚至可能会导致硬件失效。
同时还需要注意的是坏块的存在警示你应该开始考虑买块新磁盘了,或者简单地将坏块标记为不可用。
因此,在这篇文章中,我们通过几个必要的步骤,使用特定的磁盘扫描工具让你能够判断 Linux磁盘或闪存是否存在坏道。
以下就是步骤:
在 Linux上使用坏块工具检查坏道坏块工具可以让用户扫描设备检查坏道或坏块。设备可以是一个磁盘或外置磁盘,由一个如/dev/sdc这样的文件代表。
首先,通过超级用户权限执行 fdisk命令来显示你的所有磁盘或闪存的信息以及它们的分区信息:
sudo fdisk-l列出 Linux文件系统分区
然后用如下命令检查你的 Linux硬盘上的坏道/坏块:
sudo badblocks-v/dev/sda10> badsectors.txt在 Linux上扫描硬盘坏道
上面的命令中,badblocks扫描设备/dev/sda10(记得指定你的实际设备),-v选项让它显示操作的详情。另外,这里使用了输出重定向将操作结果重定向到了文件 badsectors.txt。
如果你在你的磁盘上发现任何坏道,卸载磁盘并像下面这样让系统不要将数据写入回报的扇区中。
你需要执行 e2fsck(针对 ext2/ext3/ext4文件系统)或 fsck命令,命令中还需要用到 badsectors.txt文件和设备文件。
-l选项告诉命令将在指定的文件 badsectors.txt中列出的扇区号码加入坏块列表。
------------针对 for ext2/ext3/ext4文件系统------------$ sudo e2fsck-l badsectors.txt/dev/sda10或------------针对其它文件系统------------$ sudo fsck-l badsectors.txt/dev/sda10这个方法对带有 S.M.A.R.T(自我监控分析报告技术Self-Monitoring, Analysis and Reporting Technology)系统的现代磁盘(ATA/SATA和 SCSI/SAS硬盘以及固态硬盘)更加的可靠和高效。S.M.A.R.T系统能够帮助检测,报告,以及可能记录它们的健康状况,这样你就可以找出任何可能出现的硬件失效。
你可以使用以下命令安装 smartmontools:
------------在基于 Debian/Ubuntu的系统上------------$ sudo apt-get install smartmontools------------在基于 RHEL/CentOS的系统上------------$ sudo yum install smartmontools安装完成之后,使用 smartctl控制磁盘集成的 S.M.A.R.T系统。你可以这样查看它的手册或帮助:
$ man smartctl$ smartctl-h然后执行 smartctrl命令并在命令中指定你的设备作为参数,以下命令包含了参数-H或--health以显示 SMART整体健康自我评估测试结果。
$ sudo smartctl-H/dev/sda10检查 Linux硬盘健康
上面的结果指出你的硬盘很健康,近期内不大可能发生硬件失效。
要获取磁盘信息总览,使用-a或--all选项来显示关于磁盘所有的 SMART信息,-x或--xall来显示所有关于磁盘的 SMART信息以及非 SMART信息。
在Linux中使用Smartctl监控磁盘性能的方法
Smartctl(S.M.A.R.T自监控,分析和报告技术)是类Unix系统下实施SMART任务命令行套件或工具,它用于打印SMART自检和错误日志,启用并禁用SMRAT自动检测,以及初始化设备自检。
Smartctl对于Linux物理服务器十分有用,在这些服务器上,可以对智能磁盘进行错误检查,并将与硬件RAID相关的磁盘信息摘录下来。
在本帖中,我们将讨论smartctl命令的一些实用样例。如果你的Linux上海没有安装smartctl,请按以下步骤来安装。
安装 Smartctl
对于 Ubuntu
复制代码代码如下:$ sudo apt-get install smartmontools
对于 CentOS& RHEL
复制代码代码如下:# yum install smartmontools
启动Smartctl服务
对于 Ubuntu
复制代码代码如下:$ sudo/etc/init.d/smartmontools start
对于 CentOS& RHEL
复制代码代码如下:# service smartd start; chkconfig smartd on
样例
样例:1检查磁盘的 Smart功能是否启用
复制代码代码如下:root@linuxtechi:~# smartctl-i/dev/sdb
smartctl 6.2 2013-07-26 r3841 [x86_64-linux-3.13.0-32-generic](local build)
Copyright(C) 2002-13, Bruce Allen, Christian Franke, www.smartmontools.org
=== START OF INFORMATION SECTION===
Model Family: Seagate Momentus 5400.6
Device Model: ST9320325AS
Serial Number: 5VD2V59T
LU WWN Device Id: 5 000c50 020a37ec4
Firmware Version: 0002BSM1
User Capacity: 320,072,933,376 bytes [320 GB]
Sector Size: 512 bytes logical/physical
Rotation Rate: 5400 rpm
Device is: In smartctl database [for details use:-P show]
ATA Version is: ATA8-ACS T13/1699-D revision 4
SATA Version is: SATA 2.6, 1.5 Gb/s
Local Time is: Sun Nov 16 12:32:09 2014 IST
SMART support is: Available- device has SMART capability.
SMART support is: Enabled
这里‘/dev/sdb’是你的硬盘。上面输出中的最后两行显示了SMART功能已启用。
样例:2启用磁盘的 Smart功能
复制代码代码如下:root@linuxtechi:~# smartctl-s on/dev/sdb
smartctl 6.2 2013-07-26 r3841 [x86_64-linux-3.13.0-32-generic](local build)
Copyright(C) 2002-13, Bruce Allen, Christian Franke, www.smartmontools.org
=== START OF ENABLE/DISABLE COMMANDS SECTION===
SMART Enabled.
样例:3禁用磁盘的 Smart功能
复制代码代码如下:root@linuxtechi:~# smartctl-s off/dev/sdb
smartctl 6.2 2013-07-26 r3841 [x86_64-linux-3.13.0-32-generic](local build)
Copyright(C) 2002-13, Bruce Allen, Christian Franke, www.smartmontools.org
=== START OF ENABLE/DISABLE COMMANDS SECTION===
SMART Disabled. Use option-s with argument'on' to enable it.
样例:4显示磁盘的详细 Smart信息
复制代码代码如下:root@linuxtechi:~# smartctl-a/dev/sdb// For IDE drive
root@linuxtechi:~# smartctl-a-d ata/dev/sdb// For SATA drive
样例:5显示磁盘总体健康状况
复制代码代码如下:root@linuxtechi:~# smartctl-H/dev/sdb
smartctl 6.2 2013-07-26 r3841 [x86_64-linux-3.13.0-32-generic](local build)
Copyright(C) 2002-13, Bruce Allen, Christian Franke, www.smartmontools.org
=== START OF READ SMART DATA SECTION===
SMART overall-health self-assessment test result: PASSED
Warning: This result is based on an Attribute check.
Please note the following marginal Attributes:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
190 Airflow_Temperature_Cel 0x0022 067 045 045 Old_age Always In_the_past 33(Min/Max 25/33)
样例:6使用long和short选项测试硬盘
Long测试
复制代码代码如下:root@linuxtechi:~# smartctl--test=long/dev/sdb
smartctl 6.2 2013-07-26 r3841 [x86_64-linux-3.13.0-32-generic](local build)
Copyright(C) 2002-13, Bruce Allen, Christian Franke, www.smartmontools.org
=== START OF OFFLINE IMMEDIATE AND SELF-TEST SECTION===
Sending command:"Execute SMART Extended self-test routine immediately in off-line mode".
Drive command"Execute SMART Extended self-test routine immediately in off-line mode" successful.
Testing has begun.
Please wait 102 minutes for test to complete.
Test will complete after Sun Nov 16 14:29:43 2014
Use smartctl-X to abort test.
或者,我们可以重定向测试输出到日志文件,就像下面这样
复制代码代码如下:root@linuxtechi:~# smartctl--test=long/dev/sdb>/var/log/long.text
Short测试
复制代码代码如下:root@linuxtechi:~# smartctl--test=short/dev/sdb
smartctl 6.2 2013-07-26 r3841 [x86_64-linux-3.13.0-32-generic](local build)
Copyright(C) 2002-13, Bruce Allen, Christian Franke, www.smartmontools.org
=== START OF OFFLINE IMMEDIATE AND SELF-TEST SECTION===
Sending command:"Execute SMART Short self-test routine immediately in off-line mode".
Drive command"Execute SMART Short self-test routine immediately in off-line mode" successful.
Testing has begun.
Please wait 1 minutes for test to complete.
Test will complete after Sun Nov 16 12:51:45 2014
Use smartctl-X to abort test.
或
复制代码代码如下:root@linuxtechi:~# smartctl--test=short/dev/sdb>/var/log/short.text
注意:short测试将花费最多2分钟,而在long测试中没有时间限制,因为它会读取并验证磁盘的每个段。
样例:7查看驱动器的自检结果
复制代码代码如下:root@linuxtechi:~# smartctl-l selftest/dev/sdb
smartctl 6.2 2013-07-26 r3841 [x86_64-linux-3.13.0-32-generic](local build)
Copyright(C) 2002-13, Bruce Allen, Christian Franke, www.smartmontools.org
=== START OF READ SMART DATA SECTION===
SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Short offline Completed: read failure 90% 492 210841222
# 2 Extended offline Completed: read failure 90% 492 210841222
样例:8计算测试时间估值
复制代码代码如下:root@linuxtechi:~# smartctl-c/dev/sdb
smartctl 6.2 2013-07-26 r3841 [x86_64-linux-3.13.0-32-generic](local build)
Copyright(C) 2002-13, Bruce Allen, Christian Franke, www.smartmontools.org
=== START OF READ SMART DATA SECTION===
General SMART Values:
Offline data collection status:(0x00) Offline data collection activity
was never started.
Auto Offline Data Collection: Disabled.
Self-test execution status:( 121) The previous self-test completed having
the read element of the test failed.
Total time to complete Offline
data collection:( 0) seconds.
Offline data collection
capabilities:(0x73) SMART execute Offline immediate.
Auto Offline data collection on/off support.
Suspend Offline collection upon new
command.
No Offline surface scan supported.
Self-test supported.
Conveyance Self-test supported.
Selective Self-test supported.
SMART capabilities:(0x0003) Saves SMART data before entering
power-saving mode.
Supports SMART auto save timer.
Error logging capability:(0x01) Error logging supported.
General Purpose Logging supported.
Short self-test routine
recommended polling time:( 1) minutes.
Extended self-test routine
recommended polling time:( 102) minutes.
Conveyance self-test routine
recommended polling time:( 2) minutes.
SCT capabilities:(0x103b) SCT Status supported.
SCT Error Recovery Control supported.
SCT Feature Control supported.
SCT Data Table supported.
样例:9显示磁盘错误日志
复制代码代码如下:root@linuxtechi:~# smartctl-l error/dev/sdb
Sample Output
smartctl 6.2 2013-07-26 r3841 [x86_64-linux-3.13.0-32-generic](local build)
Copyright(C) 2002-13, Bruce Allen, Christian Franke, www.smartmontools.org
=== START OF READ SMART DATA SECTION===
SMART Error Log Version: 1
ATA Error Count: 5
CR= Command Register [HEX]
FR= Features Register [HEX]
SC= Sector Count Register [HEX]
SN= Sector Number Register [HEX]
CL= Cylinder Low Register [HEX]
CH= Cylinder High Register [HEX]
DH= Device/Head Register [HEX]
DC= Device Command Register [HEX]
ER= Error register [HEX]
ST= Status register [HEX]
Powered_Up_Time is measured from power on, and printed as
DDd+hh:mm:SS.sss where DD=days, hh=hours, mm=minutes,
SS=sec, and sss=millisec. It"wraps" after 49.710 days.
Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
----------------------------------------------------
25 da 08 e7 e5 a5 4c 00 00:30:44.515 READ DMA EXT
25 da 08 df e5 a5 4c 00 00:30:44.514 READ DMA EXT
25 da 80 5f e5 a5 4c 00 00:30:44.502 READ DMA EXT
25 da f0 5f e6 a5 4c 00 00:30:44.496 READ DMA EXT
25 da 10 4f e6 a5 4c 00 00:30:44.383 READ DMA EXT