LSF Handbook
搜索文档…
前言
Part I 入门介绍篇
Chapter 1 LSF 介绍
Chapter 2 安装、升级与迁移
Part II 基础操作篇
Chapter 3 用户操作基础
3.1 LSF 概览
3.2 LSF 细观
LSF 服务与进程
集群通信方式
容错
安全
3.3 作业负载管理
3.4 启用 EGO 的 LSF
Chapter 4 管理员操作基础
Part III 作业调度篇
Chapter 5 作业调度管理
Part IV 集群运维篇
Chapter 6 LSF 集群维护管理
Chapter 7 参考文档
Part V 功能拓展篇
Chapter 8 LSF 拓展
Chapter 9 最佳实践与建议
Chapter 10 LSF 许可证调度程序
Part VI 经验总结篇
Chapter 11
Chapter 12
Chapter 10000000000
后记
附录
参考资料
由
GitBook
提供支持
3.2 LSF 细观
了解在 LSF 主机上运行的各种守护进程,LSF 集群通信路径,以及 LSF 如何容许集群中的主机故障。
LSF 守护程序和进程
集群中的每个主机上都运行多个 LSF 进程。 正在运行的进程的类型和数量,取决于主机是主节点还是计算节点。
LSF 集群通信路径
了解集群中 LSF daemon 之间的通信路径。
容错和自动主控主机故障转移
LSF 的强大体系结构在设计时考虑了容错能力。 系统中的每个组件,都有一个恢复操作。关键组件由另一个组件监视,并且可以自动从故障中恢复。
安全性
了解 LSF 安全模型,身份验证和用户角色。
以前
集群组件
下一个
LSF 服务与进程
最近更新
1yr ago
复制链接