Homelab Cluster Management
管理家庭实验室多层AI推理集群,涵盖健康监控、专家混合(MoE)路由、自动节点恢复,支持Ollama与llama.cpp跨节点模型部署。包含GPU内存规划、大模型Docker存储策略、顺序启动避免CUDA死锁,以及LiteLLM统一API网关构建。
SkillHub618 下载2v1.0.0更新于 2026-03-25
codeskills install homelab-cluster该技能详情正在完善中。
查看原文获取完整内容管理家庭实验室多层AI推理集群,涵盖健康监控、专家混合(MoE)路由、自动节点恢复,支持Ollama与llama.cpp跨节点模型部署。包含GPU内存规划、大模型Docker存储策略、顺序启动避免CUDA死锁,以及LiteLLM统一API网关构建。
codeskills install homelab-cluster该技能详情正在完善中。
查看原文获取完整内容基于分类和标签推荐
将Clawdbot技能导出为独立可部署的微服务。适用于Docker化技能、部署至Railway/Fly.io或创建独立API服务。自动生成Dockerfile、FastAPI封装、requirements.txt、部署配置及可选LLM客户端集成。
通过 GraphQL API 查询和监控 Unraid 服务器。用于检查状态、磁盘温度与健康、日志、共享文件夹、阵列状态、容器、虚拟机及奇偶校验等。
基于FTA故障树分析法的Kubernetes问题定位和修复工具。当用户遇到k8s集群问题、Pod运行异常、服务访问失败、RBAC权限问题、DNS解析失败、OOMKilled、健康检查失败、网络策略限制、存储挂载问题、HPA扩展问题、API Server连接问题等情况时,使用此技能自动执行kubectl命令进行故障...
通过API管理TrueNAS SCALE,实现存储池健康检查、数据集/快照管理、告警监控、服务控制、应用管理、Dockge容器编排及书签管理。适用于NAS、存储、备份、容器、书签或家庭实验室服务相关查询。