bitpie钱包下载|大模型推理速度飙升3.6倍,「美杜莎」论文来了,贾扬清:最优

去年,在加速大语言模型推理层面,我们迎来了一个比推测解码更高效的解决方案 —— 普林斯顿、UIUC 等机构提出的 Medusa。如今,关于 Medusa 终于有了完整...

更多