服务器运行中如何维护

admin3年前云服务器67

服务器运行中维护的方法:1、需要及时检查服务器本地硬盘,避免出现硬盘空间不足导致服务器无法正常运行;2、需要检查事件日志输出,及时排查服务器潜在异常问题并进行处理;3、需要定期给服务器安装并更新操作系统以及安全补丁,避免服务器出现系统漏洞被黑客恶意入侵;4、需求注意给服务器进行除尘操作,避免沉淀积累导致部分硬件出现故障,从而影响服务器稳定性;5、需要坚持对服务器进行例行维护,提高服务器安全性,从而确保服务器能够不间断正常运行。

具体内容如下:

1、检查本地硬盘

许多服务器依赖内部硬盘,用于承载工作量和存储,保存用户数据以及其他功能。硬盘介质出现问题会严重影响负载性能和稳定性,最终会导致硬盘故障。

磁盘介质是不完美的,常见问题包括坏道和碎片化。RAID可以比较稳定地确保出现磁盘故障时数据稳定与一致性,但更小型的服务器,如1U的机架式服务器可能无法提供足够的空间来实施RAID。使用如CHKDSK(Check Disk)这样的工具来检查硬盘完整性,还可以尝试修复其中损坏的扇区。Windows Server 2012最新版的CHKDSK可以快速分析并修复文件系统结构的磁盘问题。

磁盘碎片不会消失,只要使用NFS并且文件分配表或FAT,文件系统会使用首个可用集群的磁盘空间。碎片可能会降低服务器磁盘速度并引发故障。诸如Windows Server 2012自带的卷组优化工具,可以安排每个文件集群,并确保数据连续。

2、检查事件日志输出

服务器事件日志中记录着丰富的信息,尤其是细节问题。如果没有仔细审查系统日志,恶意软件日志和其他日志,服务器维护是不完整的。当然,关键的系统问题应该引起IT管理员和技术人员注意,但也有无数的非关键问题,可能是慢性或严重问题的信号。

如果你在维护服务器,那么请检查报告设置,并验证告警与告警接收人地址正确。例如,如果某个技术人员离开服务器组,你需要更新服务器的报告系统。双重检查联系名单和联系方式也很重要,仅仅将关键错误报告发送到技术人员公司电子邮箱地址是完全不够的,需要确保其在非工作时间也能联系的上。

要积极主动的分析日志数据。当日志检查发现慢性或反复出现的问题,积极主动的寻找解决这个问题的方案,避免问题升级。例如,如果服务器日志显示一些内存模块的可恢复报告,那么不会触发严重告警。但报告说明了某个模块的问题,IT人员可以进行更详细的诊断程序以识别即将发生的故障。

如果问题影响轻微,无须关闭服务器,那么它可以返回到线上继续服务,直至需要更换硬件的时候。

3、定期安装补丁与更新

服务器软件栈——BIOS、操作系统、虚拟机管理程序、驱动程序、应用程序、支持工具——必须确保所有互动与协作。不幸的是,软件代码很少完美或没有任何问题,所以此类软件问题需要经常通过修补或更新来修复错误、提高安全性、简化操作性、提高性能等。

不是所有软件都可以自动更新,管理员需要确认哪些补丁或升级包是必要的,然后评估和测试更新效果。如果更新包修复的是服务器不存在的问题,那么无须多此一举冒这个险。

软件开发者无法测试到每个软硬件兼容性以及补丁、更新的潜在问题,因此可能会导致更多的问题,这种情况可能在特定的服务器或软件集中发生。例如监控软件的代理补丁可能导致某个重要应用程序的性能问题,因为新代理需要比预期更高的带宽。

转换到DevOps后,更小、更频繁的更新过程加剧了潜在的问题。在部署之前仍然要在实验室环境内测试任何补丁或更新。始终要确保可以撤销原来的更改,并可以恢复修改前的软件配置。

4、确保服务器可以呼吸

一旦服务器关机,目视检查其内部和外部的空气流动路径。清除任何积累的灰尘和杂物,确保冷却空气通行顺畅。

从外部空气出入口开始,然后继续到系统机箱CPU散热器和风扇组件,内存模块和所有冷却风扇叶片与风道路径。防静电工作区用清洁、干燥的压缩空气去除尘和碎屑。不要在机架中清洁服务器。

除尘是个历史悠久的传统过程,但这并不意味着它已经过时。灰尘是一种热绝缘体,需要清除掉,现代的替代冷却方案以及ASHARE建议已经提出了调高数据中心工作温度。灰尘和其他空气流动的障碍物会导致服务器使用更多能源,甚至沉淀积累导致某些组件过早出现故障。

5、坚持例行维护

服务器管理员往往忽视计划好的例行维护。不要等到实际出现故障才进行维护,预留时间进行日常维护可以防止问题。

维护频率取决于设备年龄、数据中心环境、待维护的服务器容量和其他因素。例如,放置在设备间的旧设备会比放置在配有HEPA过滤器、良好冷却设施数据中心里的设备需要更频繁的检查。组织可以根据供应商或第三方的例行巡检策略来安排日常维护表,如果供应商合同中约定没4个月或6个月检查,那就按该时间表执行。

标签: 服务器
免责声明:本文内容来自用户上传并发布,站点仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。请核实广告和内容真实性,谨慎使用。

相关文章

美国服务器稳定性的影响因素有哪些

美国服务器稳定性的影响因素有:1、美国服务器的网络物理设备 ,网络物理设备存在问题会引发信息受损,导致数据传输不稳定;2、美国服务器的主机配件 ,主机配件故障的不定性因素是无法预测,如硬盘、内存、中央...

香港服务器和香港虚拟主机租用的区别有哪些

香港服务器和香港虚拟主机租用的区别有:1、香港服务器的资源可以独享,香港虚拟主机需要和其他网站共享资源,很容易受到其他网站客户的影响;2、香港服务器的主机是独立的,更稳定可靠,香港虚拟主机是多个网站共...

导致香港服务器速度慢的因素有哪些

导致香港服务器速度慢的因素有:1、租用的香港服务器带宽资源不足导致;2、租用香港服务器的自身配置已经无法满足业务需求导致;3、租用的香港服务器正在遭受大规模恶意网络攻击导致。具体内容如下:1、服务器带...

香港服务器租用为什么深受大家喜爱

香港服务器租用深受大家喜爱的原因:1、香港服务器具有专属的硬件设施,不会被相邻的服务器影响,从而为用户提供了相对稳定的环境;2、香港服务器租用会给用户提供Root访问权限,使用户能够自由管理香港服务器...

解决香港服务器安全性弱的方法有哪些

解决香港服务器安全性弱的方法有:1、对香港服务器上的数据库进行维护管理;2、及时更新香港服务器的软件版本;3、对香港服务器的数据进行备份保存;4、给管理服务器的内部人员进行权限分配,提高香港服务器内部...

做电商网站怎么选择服务器

做电商网站选择服务器的方法有:1、看服务器的安全性,如网站是否三天两天无法访问或网站出现故障时能不能及时恢复等;2、看服务器的访问速度及能不能提供试用服务,可以ping一下主机的速度,且注意服务器的售...