BitNet
微软1-bit LLM推理框架,超低比特量化,边缘设备高效运行大模型
所属分类AIGC
网站描述
BitNet 1-bit大模型推理引擎
核心定位
微软开源,全球首个1-bit LLM推理框架,将大模型权重压缩至1-bit,显存占用降低99%,边缘设备流畅运行7B/13B模型。
核心功能
- 1-bit量化:无损压缩,性能接近FP16
- 边缘推理:手机、IoT、嵌入式设备运行大模型
- 速度提升:推理速度提升10-100倍
- 兼容主流模型:LLaMA、Qwen、Mistral、Llama 3
- 轻量级:无依赖,易集成
热度与优势
- Star:22,000+(2026.3)
- 微软技术,行业标杆
- 适合边缘AI、移动端AIGC、IoT设备