(6)屏蔽其它用户对偏移作业运行节点的访问,使作业在运行期间不受其它干扰。
(7)重点监控参与偏移任务的节点机的关键性能指标的变化趋势,如温度、风扇速度,及时评估节点运行状态,做好故障处理预案。
(8)记录、统计计算节点故障次数,分析、总结故障原因,进一步完善该方案。
现以屏蔽其它用户对偏移作业运行节点的访问,使作业在运行期间不受其它干扰,提高并行系统效能方面,来详细阐述一下实现过程:
三屏蔽其它用户对偏移作业运行节点访问的实现过程
首先选择参与并行运算的一百个节点形成hostsl00cheny文件,再将系统允许正常访问各节点的用户形成usernames文件;其次,编写denyuser脚本程序进行封装、屏蔽其他用户,确保进行并行计算的大作业(一到二个月内)不受任何干扰;最后当偏移作业运行结束时再释放这些节点交给其他用户使用,提高并行机群系统性能的整体发挥。
实现方法:
1.hostsl00cheny文件
该文件定义了参与并行计算的100个节点主机名
COOl
GlOO
2.usernames文件
该文件定义了系统允许正常访问机群节点的用户名
lill
liw
wuql
chenzd
fanxc
him
heyq
weidl
liyl
cheny
livf
3.denydo文件
该文件确保系统的可靠性,避免进行一些不正当的非法操作,给系统带来隐患。
4.denyuser脚本程序的编写
该程序实现了限制、屏蔽其他用户,禁止访问这100个节点的功能,程序如下:
静!/bin/bash
if[¥群一h2]
then
edho”USAGE:¥0HOSTNAME
exitlistallowu∞rname’’
fi
讧[一f/export/bin/.denydo]一78—