如果您无法下载资料,请参考说明:
1、部分资料下载需要金币,请确保您的账户上有足够的金币
2、已购买过的文档,再次下载不重复扣费
3、资料包下载后请先用软件解压,在使用对应软件打开
浪潮天梭TS10K集群培训9/10/2024一、什么是集群?二、为什么用集群?三、集群有哪些部分组成?硬件架构网络架构网络规划9/10/2024需要的条件:并行环境搭建并行环境搭建-rsh服务配置并行环境搭建-rsh服务配置并行环境搭建-rsh服务配置并行环境搭建-ssh服务配置并行环境搭建-ssh服务配置并行环境搭建-nfs服务配置并行环境搭建-nfs服务配置并行环境搭建-nis服务配置并行环境搭建-nis服务配置并行环境搭建-nis服务配置编译环境编译软件编译软件-Intel并行环境变量设置MPI程序的并行编译程序编译步骤简介下载源码包(不是版本越新越好)查看INSTALL文件或官方installation指导(查看依赖和参数)configure--prefix=path/to/your/soft(可选)makemakeinstall依赖库1.查看版本2.指定安装路径3.设置环境变量写到~/.bash_profile(普通用户)exportPATH=$PATH:/path/to/your/binexportLD_LIBRARY_PATH=$LD_LIBRARY_PATH:/path/to/your/libTSExa并行文件系统TSExa并行文件系统TSCE集群作业管理调度软件TSCE集群作业管理调度软件qsub作业提交,用法:qsubtest.pbsqstat查看作业状态。qstat–an查看作业使用节点及核心情况qdel删除作业,用法:qdel作业号几种作业的状态(S):Q作业排队R作业执行C作业清除E作业退出PBS相关指令所装软件版本Vasp脚本NP=`cat$PBS_NODEFILE|wc-l`NN=`cat$PBS_NODEFILE|sort|uniq|tee/tmp/nodes.$$|wc-l`cat$PBS_NODEFILE>/tmp/nodefile.$$mpirun-genvI_MPI_DEVICErdssm-machinefile/tmp/nodefile.$$-n$NP$EXECrm-f/tmp/nodefile.$$TSCE网页管理界面TSCE网页管理界面TSCE网页管理界面9/10/2024集群批处理软件使用机器开机说明机器关机说明节点IPMI管理界面存储挂载情况新建一个用户并提交作业流程解析新建一个用户并提交作业流程解析Step3提交作业打开ssh工具新建一个用户并提交作业流程解析开关机按钮机器硬件识别常用命令集群常见故障的解决集群常见故障的解决集群常见硬件故障报修方式2024/9/10