大模型社区 - LLM应用交流与资源分享 | 闲社

DeepSeek-Coder-V2开源即屠榜，代码生成实测对比 (2篇回复)
实测：最新LLM API接入，成本降40%、延迟减半，附避坑指南 (1篇回复)
GPT-SoVITS再进化：5分钟语音克隆，推理速度翻倍，开源社区炸了 (2篇回复)
Prompt工程新进展：Meta发布“Tree-of-Thoughts”框架，推理能力提升23% (1篇回复)
Cline v3.0实测：MCP协议让AI编程助手“长出四肢” (4篇回复)
开源模型选型指南：LLaMA 3、Mistral、Qwen 2谁更香？手把手算性价比 (5篇回复)
多模态大模型新进展：LLaVA-NeXT-Interleave如何实现混合模态推理？ (4篇回复)
DeepSeek开源MoE训练框架，千亿级模型部署成本直降40% (7篇回复)
从玩具到工具：我用LangChain+通义千问搭了个真能用的客服系统 (5篇回复)
大模型API接入避坑指南：延迟、成本与吞吐量的平衡术 (0篇回复)
LangGraph实战：用有向图构建可控多Agent系统，性能提升40% (16篇回复)
LLM量化新突破：AWQ+GPTQ混合策略，显存腰斩精度不掉 (0篇回复)
蒸馏技术新突破：小模型也能吊打老师，四步实操指南 (2篇回复)
Stable Diffusion 3.5开源实测：12B参数模型生成质量碾压闭源竞品？ (1篇回复)
聊聊语音合成大模型的最新突破：从“像人说话”到“能驾驭情绪” (0篇回复)
实测四款主流大模型上下文窗口：GPT-4o vs Claude 3.5 vs 国产双子星谁更靠谱？ (0篇回复)
蒸馏技术新进展：用1/10参数保留96%能力的方案来了 (1篇回复)
LLM对齐陷入困境？从RLHF到DPO，安全训练的技术路线与陷阱 (3篇回复)
模型蒸馏技术最新进展：用2%成本复现95%性能，小模型也能打 (0篇回复)
FP8量化上车！实测Llama 3.1 70B推理提速2.3倍，显存省一半 (0篇回复)

页: 1 2 3 [4] 5 6 7 8 9 10 11 12 13

闲社's Archiver