在某些情况下,网络基础设施需要具备适当的机制,以保证网络在接近 100% 的时间内可用。以下章节描述了一些相关的技术。以下大部分资料可以在优秀的 Linas 网站找到:http://linas.org/linux/index.html 以及 Linux 高可用性 HOWTO 中。
冗余用于防止整个 IT 系统出现单点故障。仅具有一块网卡或单个 SCSI 磁盘的服务器具有两个单点故障。目标是以一种让用户能够快速继续工作的方式,掩盖计划外中断对用户的影响。高可用性软件是一组脚本和工具,可以自动监视和检测故障,采取适当的步骤来恢复正常运行并通知系统管理员。
RAID,是 Redundant Array of Inexpensive Disks(廉价磁盘冗余阵列)的缩写,是一种将信息分散到多个磁盘上的方法,使用磁盘条带化(RAID 0 级)和磁盘镜像(RAID 1 级)等技术来实现冗余,降低延迟和/或提高读写带宽,以及从硬盘崩溃中恢复。已经定义了六种以上不同类型的 RAID 配置。Linux 用户可以使用三种类型的 RAID 解决方案选项:软件 RAID、外置 DASD 盒和 RAID 磁盘控制器。
相关 HOWTO
linas.org 上的 RAID
IP 地址接管 (IPAT)。当网络适配器卡发生故障时,其 IP 地址应由同一节点或另一节点中的工作网卡接管。MAC 地址接管:当发生 IP 接管时,应确保网络中的所有节点都更新其 ARP 缓存(IP 和 MAC 地址之间的映射)。
有关更多详细信息,请参阅高可用性 HOWTO:http://metalab.unc.edu/pub/Linux/ALPHA/linux-ha/High-Availability-HOWTO.html