JustDEV

摘要

长上下文模型的能力还在往前走，但在线推理服务遇到的压力，很多时候已经不只是计算量本身。

正文摘录

长上下文模型的能力还在往前走，但在线推理服务遇到的压力，很多时候已经不只是计算量本身。

← 返回 AI追踪