10 Matching Annotations
  1. Apr 2026
    1. The era of 1-bit LLMs is here — now with WebGPU acceleration!

      令人惊讶的是:1位大语言模型时代的到来意味着每个参数只需1位存储空间,相比传统的32位浮点表示,这代表了模型压缩技术的重大突破,结合WebGPU加速,使AI计算效率提升数十倍。

  2. May 2023
  3. Apr 2023
  4. Nov 2022