算力Uber SkyCetus — 天鲸之城

150万+ 闲置GPU

📄 简报

📊 4个章节

🔬 技术分析

首页 · 架构 · AIоƬ · 技术 · 星辰大海

算力 Uber

分布式算力调度 · 150万闲置GPU的Uber时刻

核心洞察：全球有超过150万张闲置GPU分散在中小数据中心、大学实验室、矿场。就像Uber整合了闲置车辆，算力Uber整合闲置GPU，为AI任务提供按需、弹性、低成本的算力服务。

150万+ 闲置GPU

中小数据中心利用率仅 30-50%
高校实验室夜间几乎空闲
矿场转型算力出租

AI推理需求爆发

中小企业买不起A100/H100
推理任务弹性大（峰谷差10x）
多模型路由需要异构算力

珑珠引擎负责「选择哪个模型」（路由层），算力Uber负责「在哪里运行」（执行层）。两者结合实现：

最优模型 + 最优算力 + 最低成本