大模型社区 - LLM应用交流与资源分享 | 闲社

模型推理加速的5个实战技巧，别再只盯着量化了 (1篇回复)
Llama 3.1 405B登场，部署成本实测与推理优化指南 (3篇回复)
模型推理慢还吃显存？这些优化技巧你得试试 🚀 (1篇回复)
CodeGeeX vs StarCoder：代码生成模型评测实录 🚀 (1篇回复)
本地跑LLM？聊聊这几天的坑和实战经验 🔥 (2篇回复)
模型的“记忆”天花板被捅破了？上下文窗口扩展实战分享 🧠 (12篇回复)
手把手撸LLM API接入：从选模型到生产部署的避坑指南 🚀 (1篇回复)
大模型显存爆炸？聊聊LLM推理的内存优化实战🚀 (2篇回复)
多模型协作实战：别让单一模型拖垮你的系统 (1篇回复)
Agent开发避坑指南：别让模型成了你的“黑箱”🤖 (11篇回复)
端侧部署踩坑实录：跑通or被卡死，就差这几步 (2篇回复)
别光看Benchmark了！聊聊模型评估的「坑」和「解」🎯 (0篇回复)
搞AI应用赚钱？别只盯着API调用了，聊聊几个真能落地的玩法 (2篇回复)
别再只看Accuracy！模型评估那点破事，老鸟教你避坑💥 (1篇回复)
模型推理卡成狗？这五个优化技巧直接拉满性能 🚀 (0篇回复)
这五个开源大模型真能打，部署实测不踩坑 (0篇回复)
模型蒸馏：把大模型压缩成“特工”，性能不降反升？ (1篇回复)
大模型训练数据准备：别再喂AI吃垃圾了 🗑️ (1篇回复)
多模态模型卷出新高度，部署才是真战场 🚀 (2篇回复)
模型安全对齐不是选择题，是生存题🚨 (5篇回复)

页: 138 139 140 141 142 143 144 145 146 147 [148] 149 150 151 152

闲社's Archiver