当您运行 'mosmon' 时,按 't' 查看正在运行的机器总数。它是否警告您 openMosix 没有运行?
如果它警告了您,那么请确保您的机器的 IP 地址包含在 /etc/openmosix.map 中。不要使用 127.0.0.1。如果您这样做,您可能会在 DHCP 服务器或 DNS 名称服务器方面遇到问题。
如果它没有警告您,那么请查看显示了哪些机器。您只看到您的机器吗?
如果是,那么您的机器很可能正在运行防火墙,并且不允许 openMosix 通过。
如果不是,那么问题很可能出在没有显示的机器上。
另外:您的节点上有两张 NIC 卡吗?如果是,您必须编辑 /etc/hosts 以使其包含具有以下格式的行
<non-cluster ip> <cluster-hostname>.<cluster-domain> <cluster-hostname> |
也许您在每台机器上使用了不同的内核参数?特别是如果您使用“支持具有复杂网络拓扑的集群”选项,您应该注意在每台机器上对同时出现的选项“最大网络拓扑复杂性支持”使用相同的值。
它们代表了 Mosix/openmosix 增长的三个阶段。文件 /etc/mosix.map 是原始的 Mosix 映射名称,文件 /etc/hpc.map 是早期的 openMosix 映射名称(并且 'hpc' 仍然用于 openMosix 中的 /proc 文件)。当前的映射名称是 /etc/openmosix.map。
您需要修改您的 /etc/hosts 文件。在 Red Hat 机器上,大多数情况下 /etc/hosts 文件包含如下行
127.0.0.1 hostname.domain.com localhost |
如果 hostname.domain.com 的 IP 地址为 192.168.10.250,并且您查找 hostname.domain.com,您可能会得到 127.0.0.1 作为答案。
但是,如果您输入
192.168.10.250 hostname.domain.com 127.0.0.1 localhost |
机器永远不会太弱:我有三台 P200(每台 64MB)和两台 P166(一台 48MB,一台 192MB)。其中两台在 10Base-T 上,另外三台在 100Base-T 上。即使使用这些过时的机器和“异构”网络,我也可以获得完美的负载均衡来运行我用 Perl 编写的模拟程序。(看看我们的 ProgramToTestACluster”)。不要因为你的机器旧而退缩。对我们来说,这是 openMosix 的一个很好的特性:您可以随着新机器的可用而将其添加到现有集群中。而且您不需要拥有所有相同的机器。这太棒了!
但是,建议使用 100Base-T 网络!由 Charles Nadeau 贡献。
如果您打算在 openMosix 下运行 VMWare,以便 openMosix 可以负载均衡该程序的多个实例(是的,这可以工作)。但是,如果您想在多个 VMWare 实例中运行 openMosix 并让这些实例进行负载均衡(这会失败)。
第一种情况有效。后一种情况不起作用,因为 VMware 在其 Pentium 仿真中存在一个错误,该错误会导致 VMware 在首次迁移时崩溃(不是 openMosix,而是 VMware 二进制文件)。
目前仅支持 IA-32。openMosix 到 Intel(r) Itanium(tm) IA-64 处理器系列的移植已完成。openMosix 第二年的项目计划包括移植到 64 位 AMD Opteron(tm) 处理器。