Chapter 6 LSF 集群维护管理
了解如何管理 IBM Spectrum LSF 集群,如何控制守护程序,更改集群配置以及如何使用主机和队列。管理您的LSF 作业和作业调度策略。查看工作信息并控制工作。 了解如何为 LSF 作业配置和分配资源。 了解如何在 LSF 群集中提交,监视和控制高吞吐量和并行工作负载。 了解有关 LSF 错误和事件日志记录,以及 LSF 如何处理作业异常的信息。 调整 LSF 集群的性能和可伸缩性。
IBM Spectrum LSF 集群管理要点
了解如何管理 LSF 集群,控制守护程序,更改集群配置以及使用主机,队列和用户。
监视 IBM Spectrum LSF 集群操作和运行状况
了解如何监视集群性能,作业资源使用情况以及有关队列,作业和用户的其他信息。
管理 IBM Spectrum LSF 作业执行
了解如何管理 LSF 作业和作业调度策略。 查看作业信息,控制作业,并管理作业相关性,作业优先级,作业阵列,交互式作业,作业预处理和后处理,以及作业启动器。
配置和共享 IBM Spectrum LSF 作业资源
了解如何为 LSF 作业配置和分配资源。 在用户和项目之间公平地共享计算资源。 将资源分配限制应用于作业,管理主机和用户组,保留资源并指定作业的资源要求。
GPU 资源
了解如何为 LSF 作业配置和使用 GPU 资源。
使用 LSF 配置容器
为容器配置和使用 LSF 集成。
管理 IBM Spectrum LSF 的高吞吐量工作负载
了解如何在 LSF 集群中提交,监视和控制高吞吐量工作负载。 配置调度策略,以实现对短期作业的有效排队,调度和执行。
管理 IBM Spectrum LSF 并行工作负载
了解如何在 LSF 集群中提交,监视和控制并行工作负载。 配置保留资源的调度策略,以保证大型并行作业高效执行。
IBM Spectrum LSF 安全性
了解如何优化 LSF 集群的安全性。
IBM Spectrum LSF 高级配置
了解关于 LSF 错误和事件日志记录以及 LSF 如何处理作业异常的信息。 配置高级 LSF 功能。
IBM Spectrum LSF 性能调优
调整 LSF 集群的性能和可伸缩性。
IBM Spectrum LSF 能源感知调度
在大规模 LSF 安装中配置,管理和使用 IBM Spectrum LSF 能源感知调度功能,其中运行大型系统的能源需求,已成为这些系统总体成本的重要因素。
IBM Spectrum LSF 多集群功能
了解如何使用和管理 IBM Spectrum LSF 多集群功能,来实现跨 LSF 集群之间的资源共享。
IBM Spectrum LSF 高级版
配置和使用 IBM Spectrum LSF 高级版本(LSF Advanced Edition)。 学习使用专为具有高性能工作负载要求的大型集群,而设计的 LSF 的高级功能。
最后更新于