“一直以来我们用的都是小型机,业务量的增加让我们必须购买新服务器。到底继续用小型机,还是改弦易张?”中国科学院上海生命科学研究院生物信息中心(以下简称中心)选型的经历才刚刚开始。
小型机变成机群
“生物计算运算量大,对浮点运算和吞吐量要求高,在某种程度上可与大家都知道的复杂性高、运算量大的地质运算、油气层运算相比。”中心上来就给自己定义了工作的难度。其实,中心最主要的任务是开展和促进生物信息技术领域的原始性创新研究,建立生物信息分析、数据挖掘和知识发现的技术体系。
现在中心承担着生物信息资源的收集和管理服务、生物信息学研究等众多任务。为了完成任务,中心运行着MPI、OpenMP、PVM等很多专业分析软件。而这些软件的普遍特性就是运算量大,对平台挑剔。
一直以来,中心大规模计算都使用的是某国际知名厂商的小型机。刚开始,中心只负责为上海地区提供生物运算分析的任务,随着中心业务不断扩大,上海地区已经远远不能满足中心需求,他们将触角伸到了上海周边地区,这就意味着数据量和运算量的陡增。购买新的服务器成为中心持续发展的必要条件。
“按常理来说,这种购买只是系统扩容,照以前的拷贝一份就可以,起码用着一直不错的小型机应该是首选。”中心最早打的也是这样的如意算盘。既然以前一直不错,干脆这次复制一个好了。还用得着考虑什么选型问题吗?
当然得考虑。在IT产品不断推陈出新的今天,为什么非要守着价格动辄上百万,每年维护费用又在十万以上的小型机?是不是可以找一个替代品,又能省钱,又能完成计算任务?
别忙!换产品可以,可是得完成运算任务。再便宜,也不能买了没法用吧。
中心先仔细分析了一下对服务器计算能力的具体需求。从运算能力、运算特点来看,中心要求服务器能支持并行计算,支持批处理运算。同时,中心运行的有很多分析软件,比如计算分子生物学算法、生物开发专用软件环境等,新服务器必须能支持这些软件。其余更为细节,但也是明确门槛的要求是:浮点计算能力到1000亿次/秒,内置大容量存储设备,相关设备能够相对独立,比如电源。
当然小型机也算是理想。但除小型机之外,机群也可以考虑。单个性能并不算太高,但有机、可靠整合的机群系统,从指标上能满足计算需求,也能保证系统的安全可靠。
先拿张纸算算机群的好处有哪些,是否值得换。中心是这样认识机群的。首先它便宜,比起同档次的小型机,购买价格和后期维护费用都小很多。其次,机群也能满足中心的计算能力。无论是中心要求的生物分析、进化分析、比对软件等并行计算能力,还是序列比对等批处理计算能力,机群都可以满足。同时,在中心看重的大存储方面,机群的数据存取也让中心比较乐观。
不过选择机群也不是百分之选,比如,在小型机上“跑”惯了的应用软件,突然转移到机群上行不行?要做多大的转变和接口转换,中心能力行不行,机群提供商能给多大支持?
国际品牌改为国内
服务器国内外厂商有很多。中心列了一张大表,挨个写下自己比较熟悉的国际大厂商,用排除法选型。
最早心仪的是DELL服务器,便宜,性能好,而且不少用户也在青睐DELL。但一比对数据发现,DELL没有机群解决方案。白忙活一场!还是看看几个专业机群厂商吧。
Sun当然也是不错的选择。作为国际知名解决方案提供商,Sun的产品和服务不用怀疑,其中间件产品跨平台性不错,软件体系非常完善。但在价格上,还是偏贵。另外,Sun不能按照中心计算方法进行定制服务,也不能满足移植需求。
中心开始将眼光转向国内。在国内品牌选择上,2003年联想深腾以4.183万亿次的LINPACK速度列世界第14位的信息一下子打动了中心。联想在机群体系上已经建立了品牌和知名度,而且,有数据表明其在国际上的排名也不错,是不是可以考虑呢?中心将电话打到了联想。
在性能上,中心并没有太多顾虑。而关键是,联想能否提供软件移植服务,保证中心运行的软件能够在机群上运行。
“当时我们只是试探一下,抱着希望成功的目的。没想到,移植并不难,而且联想派出了几个工程师,将我们的MPI、OpenMP、PVM应用支撑平台顺利迁移到了机群上。”中心这样回忆。
当然还有其他吸引中心的地方。比如,联想提供的机群是安腾结点。经过测试,中心发现安腾结点的综合能力是其他结点的两倍以上。而且中心私下认为,安腾结点是将来的发展方向。“有些运算对内存要求很高。而安腾能够支持最多128GB的内存,让我们不再发愁。”测试数据让中心在联想后面打了勾。
“不要以为我们选择了联想,就是百分之百满意。”中心强调,“毕竟我们第一次用机群,不敢把身家性命放在新东西上。”中心以前从来没用过联想,不了解情况,要冒一定风险。为了保险起见,中心来了个保险方案—Itanium2结点和Xeon结点并存的混合机型,同时与联想积极沟通,逐步做调优工作。
2003年底,联想向上海生物信息中心推荐联想定制的深腾1800高性能机群服务器产品,即“上海生物信息中心机群系统”。2004年4月签订合同,5月底到货,7月份进入安装测试,到现在效果不错。
“用了机群以后,我们忙着做内部应用软件的迁移。不过这不是一朝一夕的事情,需要慢慢解决。”中心心有不甘,知道自己任重而道远。下一步,中心开始琢磨与联想成立联合实验室中心,将运算和分析软件与服务器匹配的问题“扼杀”在实验室里。同时,中心对机群提出的更高要求也需要寄希望于实验室,比如磁盘阵列的性能还需要再加强,机群作业的调度系统需要改进,在高强度下某些服务器容易挂起等问题。
到今天,中心总结自己从小型机一步跨越到机群,从国外品牌直接换成国内品牌的经历还在感慨:继承以前的选型习惯当然没错,但是,打破常规,用更新的产品也是不错的选择。
核心关注:拓步ERP系统平台是覆盖了众多的业务领域、行业应用,蕴涵了丰富的ERP管理思想,集成了ERP软件业务管理理念,功能涉及供应链、成本、制造、CRM、HR等众多业务领域的管理,全面涵盖了企业关注ERP管理系统的核心领域,是众多中小企业信息化建设首选的ERP管理软件信赖品牌。
读过这篇文章的人还读过:
4006199527