损坏服务器 服务器坏了怎么修
服务器硬盘坏了怎么办
问题一:公司服务器有2块硬盘,其中1块坏了,该怎么办,2快硬盘里面都有数据和程序?求教给位需要看原来这两块硬盘安装时候是怎么个形式,如实只是一般的双硬盘的话,那么一块坏掉后另一块的数据还郸,还能拷贝出来,只损失第一块坏的硬盘的数据;如果做的磁盘阵列raid0,那就没办法了,raid0速度速度快,加倍,但是没有冗余纠错功能,数据都是分开存放,一块盘坏掉,另一块也没法用,因为所有有效数据只有一半在好的硬盘上,数据全部损失,没救了;如果做的是raid 1的话,两块盘互为备份盘,有很高的安全性,这样一台坏了,另一个上面还是有100%的数据,数据不会丢失。你可以询问一下管理员看原先的存储模式,看有没有修复的可能。能修复的话在把盘挂在别的机器上,把数据拷贝出来。
问题二:服务器硬盘坏了怎么办如果是做了阵列的,拨打服务器客服电话咨询,不要自己乱操作,防止数据丢失
问题三:服务器一块硬盘损坏,请问数据如何恢复阵列很麻烦的,最好不要乱折腾,Raid6一般坏一个盘是没问题的。还是找专家看看吧。
问题四:服务器硬盘损坏数据恢复一般多少钱 1、单盘还是做了raid
2、单盘的话根据硬盘型号普通盘还是服务器盘(scsi sas)硬盘具体故障(坏道、固件、磁头损坏、电机等)
做raid的话,几块盘做的raid几?具体是什么情况
问题五:服务器硬盘坏了怎么办找数据恢复师恢复吧。只能这样了。如果数据不太重要的话还好说,重要的话就去找人恢复吧。
问题六:服务器的硬盘有六个,坏了一个,怎么办既然做了raid5,那它就会在数据出错或丢失时自动纠错和找回来。所以如果你确定了是那块盘坏了,你可以直接换了,至于是关机换还是开机换那就要看你的盘是不是支持热插拔的,如果支持就可以直接拔了,如果不支持那只能关机再拔了。
个人观点,仅供参考,希望能对你有所帮助。
问题七:服务器坏了硬盘数据丢失了怎么办这种事,哎
去年网站硬盘坏了,去科技市场找牛人花了好多钱才找回。没办法,网站几年的数据不找回损失太大。
现在果断每周备份,而且还做了RAID。
对于一些企业用户
除了RAID以外,服务器还可以做个双机热备,这样的话可以避免数据丢失以及单点故障造成业务中断。
如果对双机热备了解,可以去景安,哪里有详细的介绍!
问题八:服务器RAID硬盘损坏,无法重建?你的卡应该已做过一些操作,不好判断了。
第一个阵列是由两块3.5寸希捷600gb sas盘做的raid1,槽位c0,c1.看c0状态已变为spare0,是不是换了新盘?
raid1任意一块盘ok,不影响进系统或数据。目前你进不了系统,很可能c1亦损坏,建议把两块600g先拿到别的机器上备份数据,然后先插回一块好盘,进系统后再在另一槽位插入新备件。
问题九:服务器双硬盘,坏了一块怎么换新的? raid1是最安全的,这个操作也很简单。
HD1是工作盘,HD2是镜像盘,也就是备份盘,100%备份你HD1盘中的所有数据。
当HD1正常运行时,并不需要在镜像盘中读取数据。并HD1出错后,自动从HD2中读取数据。
硬盘坏了一块后,直接拔下坏硬盘,换上正常的硬盘后就行了。阵列系统会自动备份数据到新硬盘中。
如果你不喜欢热插拔(raid1支持这个),就关机后再换硬盘。重新开机,即可。
上面的操作,是指的你坏的是HD2。
如果坏的是HD1,那么也简单,关机。把HD2换到HD1去,把新硬盘接到HD2的位置。
开机,一切会ok。。阵列系统会自动备份数据到新硬盘,也就是HD2中。
哦,对了,还有。坏的取出,更换上新的,在RAID控制里面,ADD/REMOVE SPARE(添加空闲磁盘),成功后,RAID状态是rebuild,等修复!!!这个需要一点时间的。
问题十:服务器硬盘用的好好的,突然坏了,我还想继续用里面的数据,怎么办?这种情况,首先应先明确服务器的类型,是raid0,raid1,还是什么其他的;其次,千万不要联系你的服务器供应商进行数据同步,同步完了数据就没救了,这种情况只能找个做数据恢复的公司去做,供应商只管换盘,把服务器弄好,不会管你的数据还在不在的。应联系好厂家,先找数据恢复公司先恢复完数据后再把坏盘拿去供应商厂家进行更换。
服务器坏了怎么办
当服务器坏了,首要的应对措施是尽快恢复服务,并对损坏的原因进行调查以防止类似事件的再次发生。
详细来说,面对服务器故障,我们应当采取以下几步行动:
第一步:故障诊断与隔离
当发现服务器异常或故障时,第一步是迅速而准确地诊断问题。这通常涉及检查服务器的硬件状态(如硬盘、内存、电源、散热系统等),查看系统日志以获取可能的错误消息,以及使用网络诊断工具检查网络连接。一旦确定了故障的范围和可能的原因,就可以采取措施隔离故障,防止问题进一步扩散到其他系统。
第二步:恢复服务
在确保故障不会进一步造成损害后,下一步是尽快恢复服务。这可能意味着从备份中恢复数据、重启服务器、替换故障硬件或重新配置软件系统。许多组织都采用了冗余系统或负载均衡技术,以在主服务器故障时能够无缝切换到备用服务器,从而最大程度地减少服务中断的时间。
第三步:调查根本原因
虽然恢复服务是当务之急,但了解故障的根本原因同样重要。这需要进行详细的故障分析,可能包括硬件测试、软件审计、系统日志分析和网络安全检查等。确定了根本原因后,就可以采取措施防止类似故障再次发生。
第四步:预防措施与持续改进
最后,根据故障分析的结果,应采取预防措施来减少未来发生故障的风险。这可能包括硬件升级、软件补丁、配置更改、增强安全措施或改进维护流程等。此外,持续监控服务器的性能和状态也是预防故障的关键,因为它可以及时发现并处理潜在问题,避免小问题发展成大的故障。
总的来说,处理服务器故障需要一套综合的方法,包括快速响应、故障诊断、恢复服务、根本原因分析和预防措施。通过这些步骤,组织不仅可以有效应对当前的故障,还可以提高系统的整体可靠性和稳定性,从而更好地服务于用户和业务需求。
服务器故障和服务器资源共享故障的区别
前者包含后者
服务器软件故障是在服务器故障中占有比例最高的部份,约占70%,解决的过程必须更加深思熟虑。导致服务器出现软件故障的原因有很多,最常见的是服务器BIOS版本太低、服务器的管理软件或服务器的驱动程序有BUG、应用程序有冲突及人为造成的软件故障。下面分别举例说明各类软件故障的维修方法。
有一台HP LH6000R服务器,配置为双PIII XEON 700带2M高速缓存的CPU、512M内存。开机后,系统日志报电压调节模块异常(VRM)的错误,报错的信息是:“Voltage Regulator Module(VRM) over/under-voltage 2.88V/0V”。从表面来看,极有可能是服务器的电压调节模块或其它硬件出现故障,极容易导致维护人员认为是硬件故障。维护人员立刻使用其它LH6000R上的硬件来测试,发现即使使用新的配件,此服务器依然报VRM错。就在一筹莫展的时候,维修工程师带来了最新的CPU管理板(CPU Management Control)的固件(FIRMWARE),于是升级了CPU管理板块的FIRMWARE后,服务器恢复立即正常。
FIRMWARE升级方法是,在服务器的NAVIGATOR(导航光盘)中提取CPU管理板(CMC)FIRMWARE的刷新程序,程序为FLASH.EXE,然后将从网上下载的LH6KC.BIN(CPU管理板的FIRMWARE)拷贝到一张DOS启动盘上,用这张盘启动服务器。然后在DOS下运行”FLASH/CMC A:LH6KC.BIN”,刷新完成后重新启动服务器后即可。这种升级方法也适合刷新系统BIOS等,只是FLASH命令的参数不同以及更新FIRMWARE及BIOS文件名不同,参数请参考服务器的说明。
任何一款服务器的FIRMWARE及BIOS都会有不同的BUG,因为BUG在所难免,所以我们不能错误地认为服务器的BIOS程序就很完善,而应该经常更新服务器的FIRMWARE及BIOS,只是在升级之前应该小心谨慎,错误的升级方法会导致严重的后果。
目前流行的中高档服务器都拥有强大的管理程序,为客户提供了方便的管理途径;服务器也拥有各种操作系统下的驱动程序,方便了客户在各种操作系统中的使用。但是,世上任何一款程序都会有一些BUG,这些BUG将影响用户使用。但是服务器厂商总是会在第一时间内开发出新的程序,客户只需要及时更新这些程序就可以避免这类故障。
当服务器的软件故障为此类时,表现的现象也不尽相同。一般来说,管理程序BUG会导致系统速度变慢,CPU占用率变高,无法正常使用某些功能等;驱动程序的BUG会导致死机、与某些软件有冲突,磁盘工作不稳定等。查看管理程序是否出错的最好的办法就是在系统中首先禁止此类管理工具,再观察服务器是否还是异常。由于管理工具是随着系统启动而启动的,所以应首先避免它的启动。以WINDOWS NT4为例,就首先在管理工具服务中禁用某些服务器软件服务,再修改注册表中的启动项即可。如果是驱动程序有问题的话,就以安全模式进入系统,看是否正常。但是需要注意的是,在安全模式中,系统速度变慢是正常的(特别是磁盘I/O方面)。
服务器的管理人员就应该经常在服务器网站上下载最新的管理工具程序及驱动程序。这样会减少很大一部份软件故障的发生。
相比之下,软件冲突造成的故障判断比较困难,需要管理人员有比较丰富的经验以及敏锐的观察力。
曾经有一位朋友告诉我说,他有一台浪潮的服务器无法安装SQL SERVER 2000,已经重装N次NT了,排除是系统故障。而这唯一的服务器又将作为非常重要数据库服务器,因此非常着急。于是我陪着朋友去了他的公司查看。
这台服务器所在的机房是非常标准、完善的机房,我检查了这台服务器的情况,发现并没有硬件上的故障,于是排除了光驱读盘力差的可能。但是,朋友刻的SQL SERVER 2000光盘引起了我的怀疑,我让他拿出了正版的SQL SERVER安装,结果还是不行。
在安装的过程中,没有出现丝毫错误,可就是在运行的时候会自动退出,没有任何提示。但是,我在管理工具中的事件查看器的系统日志中却发现了一条信息:windata.exe导致一个无效的数据溢出。Windata是朋友自己编写的一个程序,而且是随操作系统启动而启动的程序。我立即结束掉这个进程后,再运行SQL一切正常。
对于此类软件故障,操作员最好先查看有关的日志,看看系统中是否有可疑的进程。目前的服务器无论是高端还是低端,对于SQL等标准程序的支持是相当可靠的,所以排除的重点就是结束可疑进程。
还有一种软件故障是人为因素造成的,它一般是人为误操作(包括没按操作流程的操作)、意外关机(包括电源突然不供电)或非正常关闭应用程序造成的。
人为误操作因素只要加强管理都可以避免此类故障发生。在这里就详细说明意外关机或非正常关闭程序造成故障的方法。
正常关闭系统程序非常重要,尤其是WEB服务器。我的一个朋友就是因为没有正常关闭系统程序而经历了一次数据损坏甚至丢失的经历。我的朋友是使用的HP web hosting server appliance,因此我向他提供了一些使用规则。
这些方法对于服务器的维护非常有效,主要包括了正确的关闭系统程序、怎样避免数据丢失以及非正常关闭系统后的恢复方法。下面以我朋友的HP web hosting server appliance为例(使用的是UNIX,但思路对于其它操作系统均有效)。
正确关机的过程包括通过按动Power键来使系统断电,你应该一直按住电源开关持续几秒钟才能使系统进入正常的关闭过程中。
另外,为了避免数据丢失,你应该按照如下的步骤操作:
·经常备份Web Hosting Server Appliance的数据,可以通过网络管理界面来完成。
·安装第二块硬盘并与原来的硬盘设置成镜像,
一旦Server Apliance未能正确关闭,并无法重起,请按如下操作恢复:
1.当appliance已经断电时,连接一条非modem的串口线(可在机盒中找到)到背面的控制口上。
2.连接串口线的另一头到一台运行Windows的PC的串口上。
3.运行超级链接程序(HyperTerminal),并设置端口的参数为19200, n-8-1, Flow control- None.你可以看到appliance的控制提示,并要求你输入管理员口令。
4.重起appliance,等到提示“LILO boot:”,按住Tab键5秒钟,直到提示变为“boot:”。
5.敲入"emergency"并回车。此时需要耐心等待几分钟。然后,登录提示又将出现,此时,LCD屏又能正常工作了。
6.在LCD屏上选择一个随机的密码(此密码只是用于紧急恢复时用)
翻至Defaults…并按右箭头键选中。
翻至Root Password…并按右箭头键选中。
翻至Random并按右箭头键选中,会提示一个随机产生的密码。
记下此密码。
翻至Yes并按右箭头键选中,系统密码会立刻更改。
7.回到超级链接的控制屏,登录appliance,用"root"用户名和刚才的密码,此时会出现“#”提示。
8.为修复分区,请按如下方法操作:
对于sa1100,按顺序输入:
[…]#: fsck/dev/hda5
[…]#: fsck/dev/hda6
[…]#: fsck/dev/hda7
对于sa1120,按顺序输入:
[…]#: fsck/dev/sda5
[…]#: fsck/dev/sda6
[…]#: fsck/dev/sda7
当所有的分区都被修复后,应回到“#”提示符下。
9.输入“reboot”重新启动系统。
如果系统仍无法启动,请记录下控制屏显示的内容并求助技术支持。
对于服务器的软件故障,只要平时管理员注意维护,应该是可以避免的。