算力Uber SkyCetus — 天鲸之城
150万+ 闲置GPU
算力 Uber
分布式算力调度 · 150万闲置GPU的Uber时刻
核心洞察:全球有超过150万张闲置GPU分散在中小数据中心、大学实验室、矿场。就像Uber整合了闲置车辆,算力Uber整合闲置GPU,为AI任务提供按需、弹性、低成本的算力服务。
市场机会
供给端
150万+ 闲置GPU
中小数据中心利用率仅 30-50%
高校实验室夜间几乎空闲
矿场转型算力出租
需求端
AI推理需求爆发
中小企业买不起A100/H100
推理任务弹性大(峰谷差10x)
多模型路由需要异构算力
产品架构
| 模块 | 功能 |
|---|---|
| 算力发现 | 自动探测闲置GPU节点,评估性能/网络/可用性 |
| 智能调度 | 基于任务类型、延迟要求、成本预算的最优匹配 |
| 安全隔离 | 容器化执行环境,数据加密传输 |
| 计费系统 | 按实际使用的GPU-秒计费,透明定价 |
| 质量保障 | SLA保证,自动故障转移,结果校验 |
与珑珠引擎的协同
珑珠引擎负责「选择哪个模型」(路由层),算力Uber负责「在哪里运行」(执行层)。两者结合实现:
最优模型 + 最优算力 + 最低成本
商业模式
| 收入来源 | 比例 |
|---|---|
| 算力调度服务费(10-30%抽成) | 60% |
| 企业级SLA套餐 | 25% |
| 数据增值服务(使用分析/优化建议) | 15% |