广西大学超算平台(在运行)
 
 首页  |  中心概况  |  中心新闻  |  中心公告  |  学术动态  |  下载中心  |  网站地图 
信息查询:
 
软件下载

广西大学超算平台使用规范
重要:平台并行存储系统P300S升级预告
超算中心系统优化培训通知
新超算中心第一次培训通知
新超算中心重新开放试运行的通知
超算中心暂停服务的通知



 
当前位置: 首页>>中心公告>>公告>>正文

广西大学超算平台使用规范
2020-06-22 11:51  

各位超算用户:

根据前期的运营经验总结,现提出以下超算平台使用规范(自202071日起执行),请所有用户遵照执行,共同营造一个高效、和谐的计算环境。

1、 DEBUG队列,供新用户熟悉环境,及简单调试用

用于作业的调试,在DEBUG队列上,每个用户同时只可以提交1个作业,作业运行时长不超过1个小时。超时自动删除。

   

2、 Slurm脚本中请同时写上-N-n参数

    #SBATCH -N 1   --使用的节点数(comput队列每个节点40个核,请计算好自己需要几个节点)

    #SBATCH -n 20       --使用的总核数

总核数只能设置为20的倍数20406080100120…如果出现胡乱设置的情况,管理员有权删除作业,重犯3次则停用账号1个月!

使用客户端进行提交作业的软件使用人请遵照执行。无法查证使用人的,按上述规定,重犯3次则停用软件1个月!

 

3、单个小作业

使用核数<=10个的小作业,请提交到I950队列进行计算。使用GPU资源的除外。

 

4、 多个小作业

用户同时有多个小作业需要提交,可以在comput上提交,但是请将同一用户的多个小作业都提交在同一个计算节点上,且多个作业使用的总核数为20的倍数。

指定节点提交作业,需在脚本中添加一行“#SBATCH -w节点名称”

 

    例如:user14个作业,每个作业只需要使用10个核。

    方法一,提交到I950队列执行,脚本设置“#SBATCH -p I950”,不用理会-w参数;

    方法二,用sinfosview查看平台节点使用情况,查询到comput20是空闲节点,则为每个作业的slurm脚本修改-w参数 #SBATCH -w comput20”,逐个提交comput队列指定节点执行。

 

5、大内存作业和多核数作业

如作业对内存的需求较大(>200G)或对核数要求较多(>100核),学生账号请提交到I950队列,教师账号请提交到fat队列。

 

6、 使用CJavaPython等编程语言进行自编代码的作业,以及简单命令的执行

可以自编SBATCH脚本,也可以简单使用“srun -p I950 -w comput1 ***.sh”的方式进行提交。

     例如:查看指定节点的gpu卡使用情况:“srun -p gpu1 -w gpu8 nvidia-smi”;提交简单的python脚本:“srun -p I950 -w fat5 python test.py


提醒:自编代码,如果没有使用并行或 MPI ,一般都是使用 1 个核心进行计算的,请参考第 3,4 项内容。

 

请所有用户遵照执行,合理使用公共资源,不盲目抢占,如有特殊情况,特殊需求,请提前与管理员沟通解决~

感谢您的大力支持~~

 

                                                                                             广西大学超算中心

                                                                                                   2020-6-22        


 

关闭窗口

广西大学超算中心   版权所有    西安博达软件有限公司  技术支持