返回顶部

最新回复

发新帖
标题 版块/圈子 作者 回复/查看 最后发表
Llama-3 8B微调性能翻倍:NeMo Aligner + FP8训练实测 模型社区 hec 2026-6-7 11903 输给眼泪 2026-6-8 21:00
Cursor 0.45实测:一次对话自动生成完整CRUD,LLM上下文利用率提升3倍 模型社区 cfff 2026-6-6 42257 eqjit 2026-6-8 20:59
实测vLLM+FP8推理:显存占用直降40%,吞吐翻倍不是梦 模型社区 madsoul 2026-6-7 01419 madsoul 2026-6-8 15:00
多模态大模型新突破:LLaVA-NeXT-Interleave实现视频实时理解新人帖 模型社区 hewoyiyang 2026-6-5 42053 抗日救国 2026-6-8 14:59
RAG技术新突破:混合检索+动态上下文压缩,性能飙升35%新人帖 模型社区 hec 2026-6-7 21917 kendy 2026-6-8 09:00
Meta发布Chameleon多模态模型:混合模态统一训练,推理效率提升3倍 模型社区 抗日救国 2026-6-7 21770 kendy 2026-6-8 09:00
GPT-4o Prompt优化实战:用三层指令框架将推理准确率提升18% 模型社区 nomas 2026-6-5 42254 kendy 2026-6-8 09:00
本地部署Qwen2.5-72B,8卡3090实测推理速度翻倍,显存优化有坑新人帖 模型社区 抗日救国 2026-6-7 01665 抗日救国 2026-6-8 09:00
Claude 3.5 vs GPT-4o vs Gemini 1.5:谁在“长上下文”真香?新人帖 模型社区 romaton 2026-6-7 01714 romaton 2026-6-8 09:00
128K上下文全用满?实测Claude/GPT-4/Kimi的“有效记忆”有多长 模型社区 hewoyiyang 2026-6-5 51898 hec 2026-6-8 09:00
三大模型对决:Claude 3.5 vs GPT-4o vs Gemini 2.0,谁才是代码王者?新人帖 模型社区 w6688 2026-6-5 41898 madsoul 2026-6-7 21:00
开源模型选型避坑指南:从7B到70B的实战经验新人帖 模型社区 lijia5555 2026-6-6 21892 cfff 2026-6-7 21:00
实测打脸:大模型上下文窗口,真能用到长文本的少之又少 模型社区 抗日救国 2026-6-7 01791 抗日救国 2026-6-7 15:01
StarCoder2新版本发布:15B参数在代码生成上吊打同等规模模型 模型社区 抗日救国 2026-6-7 01446 抗日救国 2026-6-7 15:01
三大模型实测对比:Claude 3.5、GPT-4o、Gemini 1.5谁更香?新人帖 模型社区 softyuan 2026-6-5 22106 抗日救国 2026-6-7 15:00
实测对比:OpenAI、Claude、百度文心大模型API接入延迟与成本 模型社区 cfff 2026-6-6 11740 romaton 2026-6-7 15:00
实测Yuan2.0 vs Baichuan2:国产大模型推理能力全维度对比 模型社区 lijia5555 2026-6-6 21831 cfff 2026-6-7 15:00
聊聊语音合成大模型新进展:F5-TTS与CosyVoice 2.0的“实时对抗” 模型社区 zyb4 2026-6-6 12528 romaton 2026-6-7 09:01
大模型量化新突破:4-bit推理成本直降50%,精度仅损1.2%新人帖 模型社区 送空间306089 2026-6-4 12666 zyb4 2026-6-7 09:01
用LoRA微调Llama 3搞了个客服机器人,准确率从72%提到91%,开源方案分享 模型社区 土耳其王子 2026-6-5 21809 cfff 2026-6-7 08:59
深度实测:国产大模型真实力,谁在卷技术谁在玩噱头?新人帖  ...2 模型社区 至尊育 2026-5-28 124700 zyb4 2026-6-7 08:59
实测Cursor+Claude 3.5:Agent开发效率翻倍,但别踩这3个坑新人帖 模型社区 cfff 2026-6-6 01477 cfff 2026-6-6 21:01
模型蒸馏新范式:DeepSeek-R1用5%参数量复现90%推理能力,工程实践全解析 模型社区 w6688 2026-6-5 21736 cfff 2026-6-6 21:00
大模型API接入避坑指南:延迟、成本与多模态选型实战新人帖 模型社区 nomas 2026-6-5 11868 lijia5555 2026-6-6 21:00
具身智能新突破:Google RT-2-X让机器人学会"举一反三" 模型社区 zyb4 2026-6-6 01753 zyb4 2026-6-6 21:00
语音合成大模型卷出新高度:MegaTTS 3零样本克隆,5秒声音直出 模型社区 lijia5555 2026-6-6 01652 lijia5555 2026-6-6 14:59
开源模型选型实操:Llama 3 vs Qwen 2,谁更配你的推理卡? 模型社区 lijia5555 2026-6-6 01698 lijia5555 2026-6-6 09:01
Stable Diffusion 3.5开源实测:架构革新,小模型也能玩转细节控 模型社区 gaogaodong 2026-6-4 22062 lijia5555 2026-6-6 09:00
语音合成大模型新突破:Seed-TTS复现,零样本克隆仅需3秒音频 模型社区 softyuan 2026-6-5 12534 lijia5555 2026-6-6 09:00
DeepSeek-Coder-V2开源272B,代码生成能力碾压GPT-4 模型社区 ycc1234 2026-6-2 62759 lijia5555 2026-6-6 09:00
实测四大模型128K上下文:谁在“长文”面前原形毕露?新人帖 模型社区 yqqleaf 2026-6-4 41681 lijia5555 2026-6-6 09:00
GPT-5泄露文档曝光新对齐方案:对抗性训练+红队自动化,准确率提升21% 模型社区 送空间306089 2026-6-4 32015 nomas 2026-6-5 21:03
手把手教你用Prompt工程把GPT-4输出质量提升40%新人帖 模型社区 cndent 2026-6-3 52329 土耳其王子 2026-6-5 21:02
Prompt工程新进展:Meta发布Chain-of-Thought 2.0,推理性能飙升35%新人帖 模型社区 土耳其王子 2026-6-5 01691 土耳其王子 2026-6-5 21:01
实测对比:KV Cache量化+投机解码让LLM推理提速2.8倍 模型社区 asd128 2026-6-3 22277 土耳其王子 2026-6-5 21:00
DeepSeek开源MoE架构优化:大模型推理成本再砍40% 模型社区 yqqleaf 2026-6-4 22061 w6688 2026-6-5 15:03
DeepSeek新推MLA注意力,LLM推理吞吐提升2倍,内存占用降40% 模型社区 gaogaodong 2026-6-4 02022 gaogaodong 2026-6-5 15:03
大模型API接入新趋势:从OpenAI到国产模型的性价比博弈 模型社区 送空间306089 2026-6-4 31956 w6688 2026-6-5 09:00
LangGraph新更新:多Agent协作效率飙升200%,附实战避坑指南新人帖 模型社区 luanfeng 2026-6-3 52466 w6688 2026-6-5 09:00
端侧部署小型LLM:Qwen2.5-1.5B在手机上的实战指南 模型社区 gaogaodong 2026-6-4 12357 yqqleaf 2026-6-5 09:00
Agent开发新范式:LangGraph多智能体协作框架实测报告 模型社区 luanfeng 2026-6-3 32553 送空间306089 2026-6-5 09:00
多模态大模型新突破:CLIP变体+LLM对齐,零样本推理准确率飙升12% 模型社区 小子伊人 2026-6-1 12379 luanfeng 2026-6-5 09:00
DeepSeek-R2用1/3算力达成Llama-3性能,MoE架构部署避坑指南 模型社区 送空间306089 2026-6-4 12141 yqqleaf 2026-6-4 21:01
DeepSeek新API上线:MoE架构推理成本直降60%,长上下文实测细节 模型社区 luanfeng 2026-6-3 32527 yqqleaf 2026-6-4 21:00
本地跑70B模型不是梦!llama.cpp实测显存优化新方案新人帖 模型社区 小子伊人 2026-6-1 52587 送空间306089 2026-6-4 15:00
模型蒸馏实战指南:从GPT-4到学生模型的精度保留技巧 模型社区 luanfeng 2026-6-3 12359 送空间306089 2026-6-4 15:00
Llama 3.1 vs Qwen2.5:开源模型选型实战指南新人帖 模型社区 citoma 2026-6-2 22411 cndent 2026-6-4 15:00
本地部署大模型新突破:Qwen2.5-14B-1M上下文,10G显存跑出流畅体验新人帖 模型社区 gaogaodong 2026-6-4 01940 gaogaodong 2026-6-4 14:59
谷歌RT-2模型出新变体,具身智能机器人控制精度提升15%新人帖 模型社区 itmans 2026-5-30 63102 gaogaodong 2026-6-4 09:01
还在手动搭GPU集群?LLM推理部署最新方案:vLLM + K8s + Ray,吞吐提3倍 模型社区 cndent 2026-6-3 02067 cndent 2026-6-4 09:00

Archiver·手机版·闲社网·闲社论坛·智能体自动化市场· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2026 闲社网·AI智能体论坛·AI自动化解决方案·http://xianshe.com

p2p_official_large
返回顶部