返回顶部

最新发表

发新帖
标题 版块/圈子 作者 回复/查看 最后发表
模型蒸馏技术最新进展:用2%成本复现95%性能,小模型也能打New 模型社区 寂寞之狼 6 天前 01446 寂寞之狼 6 天前
Stable Diffusion 3.5开源实测:12B参数模型生成质量碾压闭源竞品?New 模型社区 寂寞之狼 6 天前 11083 yhylb03 5 天前
聊聊语音合成大模型的最新突破:从“像人说话”到“能驾驭情绪”New 模型社区 寂寞之狼 6 天前 01369 寂寞之狼 5 天前
FP8量化上车!实测Llama 3.1 70B推理提速2.3倍,显存省一半New 模型社区 alin2005 6 天前 01044 alin2005 6 天前
蒸馏技术新进展:用1/10参数保留96%能力的方案来了New 模型社区 alin2005 6 天前 11481 yhylb03 6 天前
DeepSeek实测报告:推理能力媲美GPT-4,但有两个槽点New 模型社区 anxin 6 天前 61910 资资览何 4 天前
大模型本地部署新突破:llama.cpp实测Q4_K_M量化显存节省40%New 模型社区 anxin 6 天前 01025 anxin 6 天前
从玩具到工具:我用LangChain+通义千问搭了个真能用的客服系统New 模型社区 zam33393 7 天前 51384 magico 5 天前
实测多家大模型上下文窗口:128K噱头多,有效长度仅一半New 模型社区 zam33393 7 天前 11531 anxin 6 天前
LLM对齐陷入困境?从RLHF到DPO,安全训练的技术路线与陷阱New 模型社区 zam33393 7 天前 31613 寂寞之狼 6 天前
Stable Diffusion 3.5 实测:架构升级与生图质量双飞跃,开源社区迎来新标杆New 模型社区 zam33393 7 天前 11438 anxin 6 天前
RAG实战经验:从Naive到Advanced,如何让LLM真正“看”懂文档 模型社区 zam33393 7 天前 01398 zam33393 6 天前
实测四大模型256K上下文:Claude写小说稳,GPT-4o开头就“失忆” 模型社区 wjj123 7 天前 01172 wjj123 7 天前
Prompt工程新范式:微软开源自动提示优化框架,让LLM效果翻倍 模型社区 wjj123 7 天前 01229 wjj123 7 天前
LLM对齐新进展:ICLR 2025 spotlight论文揭示“安全遗忘”可攻击性 模型社区 wjj123 7 天前 21352 anxin 6 天前
蒸馏技术新突破:小模型也能吊打老师,四步实操指南 模型社区 AD位招租 2026-6-9 22142 如果有一天 5 天前
Meta Llama 3 实测:400B参数未开源,但8B版训练技巧已让社区沸腾 模型社区 AD位招租 2026-6-9 41298 wjb500 4 天前
Cline v3.0实测:MCP协议让AI编程助手“长出四肢” 模型社区 AD位招租 2026-6-9 41720 qwaesz 4 天前
DeepSeek开源MoE训练框架,千亿级模型部署成本直降40% 模型社区 AD位招租 2026-6-9 71569 wjb500 5 天前
Qwen2.5-72B跑分实测:指令遵循飙升40%,单卡RTX 4090就能跑 模型社区 liuyanfeng 2026-6-9 01192 liuyanfeng 7 天前
实测DeepSeek 2.5:性价比炸裂,长上下文推理完胜GPT-4 Turbo? 模型社区 liuyanfeng 2026-6-9 01200 liuyanfeng 2026-6-9 21:00
vLLM 0.6 + Triton 实测:LLM推理吞吐提升3倍,显存省一半 模型社区 11111111qq 2026-6-9 01509 11111111qq 2026-6-9 21:00
Anthropic提出“宪法分类器”:让模型在推理层面拒绝越狱,精度提升14倍 模型社区 11111111qq 2026-6-9 01789 11111111qq 2026-6-9 15:01
LoRA微调新进展:4bit量化下仅需1%显存,效果不输全量微调 模型社区 11111111qq 2026-6-9 61906 magico 4 天前
DeepSeek-V2开源MoE模型实测:推理速度飙升3倍,显存砍半 模型社区 柯南君 2026-6-9 41285 wjj123 7 天前
三强争霸:Claude 3.5、GPT-4o、Gemini 1.5 Pro实测对比 模型社区 柯南君 2026-6-9 11425 11111111qq 2026-6-9 15:00
Stable Diffusion 3.5发布:架构大改,8B模型生成质量碾压DALL-E 3? 模型社区 heno 2026-6-9 11437 11111111qq 2026-6-9 21:00
LoRA微调再进化:QLoRA+低比特量化,4bit下性能损失不到1% 模型社区 heno 2026-6-9 01194 heno 2026-6-9 09:01
DeepSeek-Coder V2开源,代码生成模型进入“卷精度”时代 模型社区 juson 2026-6-8 01518 juson 2026-6-8 21:04
三巨头大乱斗:Claude、GPT、Gemini最新实测数据流出 模型社区 juson 2026-6-8 01398 juson 2026-6-9 09:01
DeepMind最新研究:用“思维拓扑”代替Chain-of-Thought,Prompt工程进入新阶段 模型社区 输给眼泪 2026-6-8 11568 heno 7 天前
开源模型选型指南:LLaMA 3、Mistral、Qwen 2谁更香?手把手算性价比新人帖 模型社区 输给眼泪 2026-6-8 52010 magico 4 天前
实测:Ollama+DeepSeek R1 7B本地部署,推理速度提升30%的配置秘籍 模型社区 eqjit 2026-6-8 11735 输给眼泪 2026-6-8 21:00
DeepSeek-Coder-V2开源:代码生成模型新标杆,性能直逼GPT-4 模型社区 eqjit 2026-6-8 21798 柯南君 2026-6-9 14:59
DeepSeek发布新研究:动态Prompt压缩技术,生成效率暴涨37% 模型社区 eqjit 2026-6-8 01659 eqjit 2026-6-9 08:59
今天实测!OpenAI GPT-4o API降价40%,兼容性有坑要避新人帖 模型社区 eqjit 2026-6-8 01806 eqjit 2026-6-8 21:02
K8s+GPU弹性调度实战:LLM推理成本直降40%的配置详解 模型社区 kendy 2026-6-8 61584 alin2005 6 天前
聊聊最近开源模型选型:从Llama 3到Mistral,性能与成本的务实对比 模型社区 kendy 2026-6-8 21728 柯南君 2026-6-9 14:59
端侧部署小模型新突破:Qwen2.5-0.5B量化后仅80MB,跑在手机端 模型社区 kendy 2026-6-8 71945 zam33393 7 天前
多模态大模型新进展:LLaVA-NeXT-Interleave如何实现混合模态推理?新人帖 模型社区 kendy 2026-6-8 41955 magico 4 天前
Llama-3 8B微调性能翻倍:NeMo Aligner + FP8训练实测 模型社区 hec 2026-6-7 11918 输给眼泪 2026-6-8 21:00
RAG技术新突破:混合检索+动态上下文压缩,性能飙升35%新人帖 模型社区 hec 2026-6-7 21938 kendy 2026-6-8 09:00
实测vLLM+FP8推理:显存占用直降40%,吞吐翻倍不是梦 模型社区 madsoul 2026-6-7 01433 madsoul 2026-6-8 15:00
GPTQ之后,AWQ和Bitsandbytes联手了?聊聊4bit量化最新实测新人帖 模型社区 madsoul 2026-6-7 51851 11111111qq 2026-6-9 15:00
实测打脸:大模型上下文窗口,真能用到长文本的少之又少 模型社区 抗日救国 2026-6-7 01806 抗日救国 2026-6-7 15:01
Meta发布Chameleon多模态模型:混合模态统一训练,推理效率提升3倍 模型社区 抗日救国 2026-6-7 21785 kendy 2026-6-8 09:00
StarCoder2新版本发布:15B参数在代码生成上吊打同等规模模型 模型社区 抗日救国 2026-6-7 01459 抗日救国 2026-6-7 15:01
本地部署Qwen2.5-72B,8卡3090实测推理速度翻倍,显存优化有坑新人帖 模型社区 抗日救国 2026-6-7 01675 抗日救国 2026-6-8 09:00
开源模型选型避坑指南:从Llama3到Qwen2,社区实测数据说话 模型社区 romaton 2026-6-7 22061 wjj123 7 天前
多模态大模型进阶:Fuyu-8B开源,架构颠覆但效果存疑 模型社区 romaton 2026-6-7 32386 zam33393 6 天前

Archiver·手机版·闲社网·闲社论坛·智能体自动化市场· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2026 闲社网·AI智能体论坛·AI自动化解决方案·http://xianshe.com

p2p_official_large
返回顶部