导读-最新发表闲社

标题	版块/圈子	作者	回复/查看	最后发表

模型蒸馏技术最新进展：用2%成本复现95%性能，小模型也能打 New	模型社区	寂寞之狼 6 天前	01446	寂寞之狼 6 天前
Stable Diffusion 3.5开源实测：12B参数模型生成质量碾压闭源竞品？New	模型社区	寂寞之狼 6 天前	11083	yhylb03 5 天前
聊聊语音合成大模型的最新突破：从“像人说话”到“能驾驭情绪”New	模型社区	寂寞之狼 6 天前	01369	寂寞之狼 5 天前
FP8量化上车！实测Llama 3.1 70B推理提速2.3倍，显存省一半 New	模型社区	alin2005 6 天前	01044	alin2005 6 天前
蒸馏技术新进展：用1/10参数保留96%能力的方案来了 New	模型社区	alin2005 6 天前	11481	yhylb03 6 天前
DeepSeek实测报告：推理能力媲美GPT-4，但有两个槽点 New	模型社区	anxin 6 天前	61910	资资览何 4 天前
大模型本地部署新突破：llama.cpp实测Q4_K_M量化显存节省40%New	模型社区	anxin 6 天前	01025	anxin 6 天前
从玩具到工具：我用LangChain+通义千问搭了个真能用的客服系统 New	模型社区	zam33393 7 天前	51384	magico 5 天前
实测多家大模型上下文窗口：128K噱头多，有效长度仅一半 New	模型社区	zam33393 7 天前	11531	anxin 6 天前
LLM对齐陷入困境？从RLHF到DPO，安全训练的技术路线与陷阱 New	模型社区	zam33393 7 天前	31613	寂寞之狼 6 天前
Stable Diffusion 3.5 实测：架构升级与生图质量双飞跃，开源社区迎来新标杆 New	模型社区	zam33393 7 天前	11438	anxin 6 天前
RAG实战经验：从Naive到Advanced，如何让LLM真正“看”懂文档	模型社区	zam33393 7 天前	01398	zam33393 6 天前
实测四大模型256K上下文：Claude写小说稳，GPT-4o开头就“失忆”	模型社区	wjj123 7 天前	01172	wjj123 7 天前
Prompt工程新范式：微软开源自动提示优化框架，让LLM效果翻倍	模型社区	wjj123 7 天前	01229	wjj123 7 天前
LLM对齐新进展：ICLR 2025 spotlight论文揭示“安全遗忘”可攻击性	模型社区	wjj123 7 天前	21352	anxin 6 天前
蒸馏技术新突破：小模型也能吊打老师，四步实操指南	模型社区	AD位招租 2026-6-9	22142	如果有一天 5 天前
Meta Llama 3 实测：400B参数未开源，但8B版训练技巧已让社区沸腾	模型社区	AD位招租 2026-6-9	41298	wjb500 4 天前
Cline v3.0实测：MCP协议让AI编程助手“长出四肢”	模型社区	AD位招租 2026-6-9	41720	qwaesz 4 天前
DeepSeek开源MoE训练框架，千亿级模型部署成本直降40%	模型社区	AD位招租 2026-6-9	71569	wjb500 5 天前
Qwen2.5-72B跑分实测：指令遵循飙升40%，单卡RTX 4090就能跑	模型社区	liuyanfeng 2026-6-9	01192	liuyanfeng 7 天前
实测DeepSeek 2.5：性价比炸裂，长上下文推理完胜GPT-4 Turbo？	模型社区	liuyanfeng 2026-6-9	01200	liuyanfeng 2026-6-9 21:00
vLLM 0.6 + Triton 实测：LLM推理吞吐提升3倍，显存省一半	模型社区	11111111qq 2026-6-9	01509	11111111qq 2026-6-9 21:00
Anthropic提出“宪法分类器”：让模型在推理层面拒绝越狱，精度提升14倍	模型社区	11111111qq 2026-6-9	01789	11111111qq 2026-6-9 15:01
LoRA微调新进展：4bit量化下仅需1%显存，效果不输全量微调	模型社区	11111111qq 2026-6-9	61906	magico 4 天前
DeepSeek-V2开源MoE模型实测：推理速度飙升3倍，显存砍半	模型社区	柯南君 2026-6-9	41285	wjj123 7 天前
三强争霸：Claude 3.5、GPT-4o、Gemini 1.5 Pro实测对比	模型社区	柯南君 2026-6-9	11425	11111111qq 2026-6-9 15:00
Stable Diffusion 3.5发布：架构大改，8B模型生成质量碾压DALL-E 3？	模型社区	heno 2026-6-9	11437	11111111qq 2026-6-9 21:00
LoRA微调再进化：QLoRA+低比特量化，4bit下性能损失不到1%	模型社区	heno 2026-6-9	01194	heno 2026-6-9 09:01
DeepSeek-Coder V2开源，代码生成模型进入“卷精度”时代	模型社区	juson 2026-6-8	01518	juson 2026-6-8 21:04
三巨头大乱斗：Claude、GPT、Gemini最新实测数据流出	模型社区	juson 2026-6-8	01398	juson 2026-6-9 09:01
DeepMind最新研究：用“思维拓扑”代替Chain-of-Thought，Prompt工程进入新阶段	模型社区	输给眼泪 2026-6-8	11568	heno 7 天前
开源模型选型指南：LLaMA 3、Mistral、Qwen 2谁更香？手把手算性价比	模型社区	输给眼泪 2026-6-8	52010	magico 4 天前
实测：Ollama+DeepSeek R1 7B本地部署，推理速度提升30%的配置秘籍	模型社区	eqjit 2026-6-8	11735	输给眼泪 2026-6-8 21:00
DeepSeek-Coder-V2开源：代码生成模型新标杆，性能直逼GPT-4	模型社区	eqjit 2026-6-8	21798	柯南君 2026-6-9 14:59
DeepSeek发布新研究：动态Prompt压缩技术，生成效率暴涨37%	模型社区	eqjit 2026-6-8	01659	eqjit 2026-6-9 08:59
今天实测！OpenAI GPT-4o API降价40%，兼容性有坑要避	模型社区	eqjit 2026-6-8	01806	eqjit 2026-6-8 21:02
K8s+GPU弹性调度实战：LLM推理成本直降40%的配置详解	模型社区	kendy 2026-6-8	61584	alin2005 6 天前
聊聊最近开源模型选型：从Llama 3到Mistral，性能与成本的务实对比	模型社区	kendy 2026-6-8	21728	柯南君 2026-6-9 14:59
端侧部署小模型新突破：Qwen2.5-0.5B量化后仅80MB，跑在手机端	模型社区	kendy 2026-6-8	71945	zam33393 7 天前
多模态大模型新进展：LLaVA-NeXT-Interleave如何实现混合模态推理？	模型社区	kendy 2026-6-8	41955	magico 4 天前
Llama-3 8B微调性能翻倍：NeMo Aligner + FP8训练实测	模型社区	hec 2026-6-7	11918	输给眼泪 2026-6-8 21:00
RAG技术新突破：混合检索+动态上下文压缩，性能飙升35%	模型社区	hec 2026-6-7	21938	kendy 2026-6-8 09:00
实测vLLM+FP8推理：显存占用直降40%，吞吐翻倍不是梦	模型社区	madsoul 2026-6-7	01433	madsoul 2026-6-8 15:00
GPTQ之后，AWQ和Bitsandbytes联手了？聊聊4bit量化最新实测	模型社区	madsoul 2026-6-7	51851	11111111qq 2026-6-9 15:00
实测打脸：大模型上下文窗口，真能用到长文本的少之又少	模型社区	抗日救国 2026-6-7	01806	抗日救国 2026-6-7 15:01
Meta发布Chameleon多模态模型：混合模态统一训练，推理效率提升3倍	模型社区	抗日救国 2026-6-7	21785	kendy 2026-6-8 09:00
StarCoder2新版本发布：15B参数在代码生成上吊打同等规模模型	模型社区	抗日救国 2026-6-7	01459	抗日救国 2026-6-7 15:01
本地部署Qwen2.5-72B，8卡3090实测推理速度翻倍，显存优化有坑	模型社区	抗日救国 2026-6-7	01675	抗日救国 2026-6-8 09:00
开源模型选型避坑指南：从Llama3到Qwen2，社区实测数据说话	模型社区	romaton 2026-6-7	22061	wjj123 7 天前
多模态大模型进阶：Fuyu-8B开源，架构颠覆但效果存疑	模型社区	romaton 2026-6-7	32386	zam33393 6 天前

模型蒸馏技术最新进展：用2%成本复现95%性能，小模型也能打 New

模型社区

寂寞之狼 6 天前

01446

寂寞之狼 6 天前

Stable Diffusion 3.5开源实测：12B参数模型生成质量碾压闭源竞品？New

模型社区

寂寞之狼 6 天前

11083

yhylb03 5 天前

聊聊语音合成大模型的最新突破：从“像人说话”到“能驾驭情绪”New

模型社区