运行于 SuSe Linux V7.1 的 IBM eServer pSeries 630 与 690 服务器作为印度政府用于强大功能计算研究的超级计算信息网格的构建模块。
客户URL:http://www.cdacindia.com
地点与行业: 印度班加罗尔市 Pune,政府
客户背景:高级计算开发中心 (CDAC) 是印度政府信息技术部创建的最早一家高能计算组织 (HPC)。CDAC 主要涉及与天气预报、地震分析和生物遗传学相关的 HPC 应用领域的研究。该公司还开发了在多语言及多媒体技术领域中的应用。CDAC 位于 Pune(PARAM 机构)和班加罗尔(开发小组地址)以外。该组织在整个印度具有各种教育/培训中心网络。
业务需求
CDAC 已开始构建印度第一个针对 HPC 研究的 TeraFlop 超级计算设施。CDAC 原先采用 Sun 服务器来作为其超级计算机的构建块。
新一代 TeraFlop 超级计算机称为 PARAM 20000。下一阶段是在整个印度的主要教育研究机构应用该设施,同时将这些设施进行互连,以形成印度的网格计算基地。这称为"India-Grid of I-GRID"。
CDAC 所面临的挑战是构建一种 TeraFlop 超级计算机来迎合该组织不断增长的需求,即,如何解决在天气预报、地震分析和生命科学领域中日益复杂的 HPC 问题。为解决这一问题, CDAC 需要具有在 HPC 方面具有良好领域技能的合作伙伴来联合开发 HPC 工具、中间件等。CDAC 还评估了厂商在网格计算领域中的投入与技能情况。最初的评估标准还包括处理器发展策略、性能及 Linux 的亲和力。所有评估进行完之后,这家客户选择了 IBM 作为其首选的超级计算合作伙伴。
TeraFlop 设施将是印度最大的 HPC 基础设施之一,该设施将专用于整个印度 HPC 领域的研发。通过在其他主要机构复制类似的设施并对这些设施进行互连,以形成 India-Grid 或 I-GRID,TeraFlop 设施还将作为网格计算的网络中心。
解决方案
该客户选择将 62 台 pSeries 630 (POWER4) 服务器和一个 pSeries 690 Regatta 实施为运行作为 TeraFlop 计算设施--强大的信息网格系统——一部分的通用并行文件系统 (GPFS) 的计算节点。p690 采用逻辑分区 (LPAR),从研究观点来看,采用这种分区对 CDAC 非常有利,并且 p690 还可为 CDAC 提供配置更大 SMP 分区所需的灵活性,以便解决更大性能(相比与将多个 p630 结合到 Param_Net 与 GPFS 间的 SMP 节点中)的大型问题。所有 p630 与 p690 服务器均为运行通过 CDAC 自己的专用交换机(称为 PARAM_Net)连接的 AIX 5L 与 SuSe Linux V7.1 的计算节点。
CDAC 所拥有的用户组涉及每个应用领域--天气预报、地震分析、生命科学和计算流体力学 (CFD)。这些用户/研究人员将使用计算基础设施来提交复杂问题以及获得限时结果。
CDAC 的最后目标是获得 Linux TeraFlop 计算设施;然而,由于相关的时间限制和 AIX 5L 上已验证的 GPFS 性能,该客户计划取消 AIX,并在可获得 Linux 端口且性能得以稳定时逐渐向 Linux 转移。
该客户还没有在不同研究领域共享服务器工作中断的详细信息;但由于所建议的设置为并行 GPFS 计算节点基础设施,因此这与应用工作的中断并不相关。超级计算环境还支持各种 IBM HPC 库以及例如 MMP、MPI I/O、PE、POE、PSSP 和 LoadLeveller 等系统软件。
该解决方案的优势
CDAC 清楚地目睹了 IBM 解决方案优胜于惠普 (HP) (Intel-McKinley) 和 Sun (UltraSPARC-III) 的同类产品的价值。从技术立场看,选择 IBM 的原因是由于 POWER 4 系统 (p630) 的适时性、处理器发展策略、性能(CDAC 在每个的两所厂商实验室进行了基准测试) 以及 Linux 的亲和力。此外,在构建 TeraFlop HPC 设施的最佳合作厂商评估中,IBM 还满足了 CDAC 的商业标准。
在商业评估范围以外给 CDAC 带来的优势无法量数;但是,POWER4 技术的发展策略和 IBM 在 HPC 项目上通力合作的意愿是促成 CDAC 选择 IBM pSeries 解决方案的主要原因。 |