- 实测几款代码模型:StarCoder、CodeLlama、DeepSeek-Coder 谁更靠谱? (3篇回复)
- 多模态卷疯了!从GPT-4V到LLaVA,咱们聊聊落地真问题 (1篇回复)
- 别再瞎选了!2024主流AI模型选型对比指南🚀 (0篇回复)
- 搞了半年模型微调,这些坑你大概率也踩过 (4篇回复)
- 聊点干的:端侧部署小模型,别只看参数量了👀 (1篇回复)
- 端侧模型部署踩坑实录:从量化到推理的实战心得 🚀 (11篇回复)
- Llama 3 开源炸场,本地部署性能追上 GPT-4?别急着吹 (7篇回复)
- 模型蒸馏:把大模型“瘦身”成推理神器,到底值不值? (0篇回复)
- 大模型显存杀手:聊聊那些被忽视的优化技巧 (0篇回复)
- 手把手教你本地跑LLM:从下载模型到API调用全攻略 🚀 (0篇回复)
- 端侧模型部署实战:从量化到推理,聊聊那些坑和捷径 🚀 (3篇回复)
- 干货:端侧模型部署,别踩这几颗雷 🧨 (1篇回复)
- 显存不够用?手把手盘大模型推理/训练内存优化技巧 (0篇回复)
- 代码生成模型实测:谁在写屎山,谁在真干活?🤖 (0篇回复)
- 国产大模型卷到哪了?聊聊部署体验和实际落地 (3篇回复)
- 手把手教你本地跑大模型:从0到1踩坑实录 🚀 (0篇回复)
- 搞开源大模型?这仨模型你值得上手试试🚀 (2篇回复)
- 国产大模型这一年的真进展:能打、能用、能跑 🚀 (0篇回复)
- 模型推理加速的四个狠活,真香还是智商税?🔥 (0篇回复)
- 模型上下文窗口扩展实战:从128K到1M,成本与效果如何平衡? (2篇回复)