<?xml version="1.0" encoding="utf-8"?>
<rss version="2.0">
  <channel>
    <title>闲社 - 模型社区</title>
    <link>https://fzgmgmantis.xianshe.com/forum-9-1.html</link>
    <description>Latest 20 threads of 模型社区</description>
    <copyright>Copyright(C) 闲社</copyright>
    <generator>Discuz! Board by Discuz! Team</generator>
    <lastBuildDate>Sun, 21 Jun 2026 11:01:53 +0000</lastBuildDate>
    <ttl>60</ttl>
    <image>
      <url>https://fzgmgmantis.xianshe.com/static/image/common/logo_88_31.gif</url>
      <title>闲社</title>
      <link>https://fzgmgmantis.xianshe.com/</link>
    </image>
    <item>
      <title>【大模型】刚刚！GPT-5.4化身AI化学家：药物合成产率从16.6%跃升至25.2%</title>
      <link>https://fzgmgmantis.xianshe.com/thread-37534-1-1.html</link>
      <description><![CDATA[引言：当AI不再只是聊天，而是走进实验室

就在6月17日，OpenAI发布了一项令人瞩目的研究成果——GPT-5.4与Maria AI化学家系统联手，在药物化学领域实现了一次真正的突破。这不是又一个聊天机器人升级，而是AI首次在真实实验室环境中，自主提出研究假设、设计实验、分析 ...]]></description>
      <category>模型社区</category>
      <author>gue3004</author>
      <pubDate>Sun, 21 Jun 2026 08:55:38 +0000</pubDate>
    </item>
    <item>
      <title>DeepSeek实测：千亿参数开源模型，推理爆发力惊人</title>
      <link>https://fzgmgmantis.xianshe.com/thread-37533-1-1.html</link>
      <description><![CDATA[最近社区里不少兄弟在讨论DeepSeek，我拿它跑了几个典型任务，说说真实感受。DeepSeek是深度求索推出的千亿参数级别大模型，基础版671B参数，MoE架构，激活参数约37B。这货最亮眼的地方在推理和代码生成上。

我测试了一个复杂数学推理题——“证明质数无穷多”的变种， ...]]></description>
      <category>模型社区</category>
      <author>pippen2004</author>
      <pubDate>Sun, 21 Jun 2026 07:02:07 +0000</pubDate>
    </item>
    <item>
      <title>模型蒸馏新进展：如何用1/10参数量保持95%性能？</title>
      <link>https://fzgmgmantis.xianshe.com/thread-37532-1-1.html</link>
      <description><![CDATA[刚读完几篇最新论文，发现模型蒸馏技术在2024下半年又有几个实用突破，不吐不快。

第一，蒸馏的“软标签”技巧升级了。传统方法直接让学生模型模仿教师输出概率分布，但新研究提出“动态温度调节”：训练初期用高温（T=5）拉伸分布，后期降至T=1，这样学生能先学全局模 ...]]></description>
      <category>模型社区</category>
      <author>pippen2004</author>
      <pubDate>Sun, 21 Jun 2026 07:01:37 +0000</pubDate>
    </item>
    <item>
      <title>【大模型】刚刚！OpenAI收购Ona+部署模拟技术：Agent安全落地怎么破？</title>
      <link>https://fzgmgmantis.xianshe.com/thread-37528-1-1.html</link>
      <description><![CDATA[引言：Agent落地，安全先行

就在这几天，AI圈发生了两件值得深思的大事。

一是OpenAI宣布收购Ona——一家帮助200万开发者将开发环境迁移到云端的公司，目的是让Codex Agent能在安全、持久的云环境中持续工作，即使笔记本合上也不中断。二是OpenAI发布了部署模拟技术， ...]]></description>
      <category>模型社区</category>
      <author>gue3004</author>
      <pubDate>Sun, 21 Jun 2026 05:27:38 +0000</pubDate>
    </item>
    <item>
      <title>【大模型】刚刚！o3 Deep Research破解罕见病谜题：AI医疗诊断的4.8%突破意味着什么？</title>
      <link>https://fzgmgmantis.xianshe.com/thread-37523-1-1.html</link>
      <description><![CDATA[【引言：当AI成为医生的\&quot;第二大脑\&quot;】

6月18日，OpenAI发布了一项重磅研究成果——o3 Deep Research模型协助波士顿儿童医院、哈佛大学的研究团队，在376例此前未能确诊的儿童罕见遗传病病例中，成功帮助确诊了18例，额外诊断率达到4.8%。这项研究已发表在NEJM AI期刊上 ...]]></description>
      <category>模型社区</category>
      <author>gue3004</author>
      <pubDate>Sun, 21 Jun 2026 01:55:09 +0000</pubDate>
    </item>
    <item>
      <title>OpenAI悄悄更新了Prompt工程指南，这5个技巧能让GPT-4准确率提升20%</title>
      <link>https://fzgmgmantis.xianshe.com/thread-37522-1-1.html</link>
      <description><![CDATA[昨晚刷OpenAI官方文档，发现他们更新了Prompt工程指南，不是那个旧版的“写清晰指令”那种鸡汤，而是实打实的新策略。我测了一晚上，分享几个最炸裂的点。

1. 引导推理链（Chain-of-Thought）要加“分步验证”。以前只是让模型一步步思考，现在要求每步输出置信度分数 ...]]></description>
      <category>模型社区</category>
      <author>luojigang</author>
      <pubDate>Sun, 21 Jun 2026 01:02:03 +0000</pubDate>
    </item>
    <item>
      <title>Llama 3.1 405B微调实战：QAT量化后精度仅降0.3%，推理速度翻倍</title>
      <link>https://fzgmgmantis.xianshe.com/thread-37521-1-1.html</link>
      <description><![CDATA[兄弟们，今天聊点干货。Meta刚开源Llama 3.1 405B还没捂热，社区就有大神把微调+量化方案跑通了。我扒了一下具体流程和数据，分享几个关键点。

第一，量化方案用的是QAT（Quantization-Aware Training），不是简单的PTQ。实测在A100 80G上，把405B从FP16压到INT4，模型 ...]]></description>
      <category>模型社区</category>
      <author>luojigang</author>
      <pubDate>Sun, 21 Jun 2026 01:01:32 +0000</pubDate>
    </item>
    <item>
      <title>【大模型】刚刚！GPT-5.5 Instant健康能力飙升71%：AI医疗进入比医生更懂沟通时代？</title>
      <link>https://fzgmgmantis.xianshe.com/thread-37517-1-1.html</link>
      <description><![CDATA[引言：当2.3亿人每周向AI问健康问题时，答案的质量正在发生质变

6月18日，OpenAI发布了一篇关于ChatGPT健康智能提升的深度报告。其中一组数据令人瞩目：在隐私保护的生产环境监控中，GPT-5.5 Instant的健康回答事实性错误率在过去两个月内下降了71%。更关键的是，在由 ...]]></description>
      <category>模型社区</category>
      <author>世紀末の樂騷</author>
      <pubDate>Sat, 20 Jun 2026 22:25:12 +0000</pubDate>
    </item>
    <item>
      <title>【大模型】Anthropic旗舰模型遭美国出口管制：AI主权之争升级</title>
      <link>https://fzgmgmantis.xianshe.com/thread-37512-1-1.html</link>
      <description><![CDATA[引言：一场突如其来的&amp;#x201c;断供&amp;#x201d;

就在6月12日，美国政府突然发布出口管制指令，全面暂停对Anthropic旗下两款旗舰模型Fable 5和Mythos 5的访问。这不是某家公司的商业决策，而是国家级别的技术封锁。消息一出，整个AI圈炸了锅——毕竟Anthropic一直以&amp;#x201c; ...]]></description>
      <category>模型社区</category>
      <author>世紀末の樂騷</author>
      <pubDate>Sat, 20 Jun 2026 18:55:20 +0000</pubDate>
    </item>
    <item>
      <title>【大模型】刚刚！OpenAI Academy新课程+部署模拟技术：人才与安全的双轨并进</title>
      <link>https://fzgmgmantis.xianshe.com/thread-37507-1-1.html</link>
      <description><![CDATA[引言：AI落地进入深水区，人才和安全缺一不可

就在这几天，OpenAI接连放出两个重要信号：一是OpenAI Academy推出三门全新企业AI课程，从基础应用到Agent工作流全覆盖；二是发布部署模拟（Deployment Simulation）技术，用真实对话数据预演模型上线后的风险。

这两个动 ...]]></description>
      <category>模型社区</category>
      <author>alt-sky</author>
      <pubDate>Wed, 17 Jun 2026 01:44:44 +0000</pubDate>
    </item>
    <item>
      <title>LLM推理优化新进展：FlashAttention-3与推测解码实战对比</title>
      <link>https://fzgmgmantis.xianshe.com/thread-37506-1-1.html</link>
      <description><![CDATA[兄弟们，今天聊聊LLM推理优化的两个硬核方向。最近社区热点集中在FlashAttention-3（FA3）和推测解码（Speculative Decoding），实测下来效果挺炸，给大家拆解下。

先看FA3，基于Hopper架构优化了异步执行和WGMMA指令，在H100上对Llama2-7B实现2.3倍加速，内存占用降低 ...]]></description>
      <category>模型社区</category>
      <author>wwlwxd</author>
      <pubDate>Wed, 17 Jun 2026 01:00:55 +0000</pubDate>
    </item>
    <item>
      <title>LangGraph实战：如何用20行代码实现带记忆的多步Agent</title>
      <link>https://fzgmgmantis.xianshe.com/thread-37505-1-1.html</link>
      <description><![CDATA[兄弟们，最近在折腾AI Agent开发，发现LangGraph这个框架真的有点东西。它不像LangChain那样“黑盒”，而是用有向图来编排Agent的每一步，可控性极高。

今天分享一个**带状态记忆的多步Agent**实现思路。核心是定义“节点”（Node）和“边”（Edge）。比如你要做一个文 ...]]></description>
      <category>模型社区</category>
      <author>wwlwxd</author>
      <pubDate>Wed, 17 Jun 2026 01:00:27 +0000</pubDate>
    </item>
    <item>
      <title>【大模型】刚刚！OpenAI部署模拟技术：用真实对话预演模型风险</title>
      <link>https://fzgmgmantis.xianshe.com/thread-37499-1-1.html</link>
      <description><![CDATA[【大模型】刚刚！OpenAI部署模拟技术：用真实对话预演模型风险，AI安全评估进入新纪元

大家好，今天来聊一个刚刚发布的重磅技术——OpenAI在6月16日正式公开了他们的\&quot;部署模拟\&quot;（Deployment Simulation）方法，这是AI安全评估领域的一次重大升级。

一、什么是部署模拟 ...]]></description>
      <category>模型社区</category>
      <author>kai_va</author>
      <pubDate>Tue, 16 Jun 2026 22:14:24 +0000</pubDate>
    </item>
    <item>
      <title>【大模型】刚刚！西雅图叫停数据中心，AI算力扩张撞上民意高墙</title>
      <link>https://fzgmgmantis.xianshe.com/thread-37495-1-1.html</link>
      <description><![CDATA[导语：当AI巨头们还在为算力军备竞赛疯狂砸钱时，美国西雅图市议会刚刚投下了一枚重磅炸弹——通过为期一年的数据中心建设禁令。更耐人寻味的是，推动这项禁令的，不是环保组织，而是亚马逊自己的工程师们。这场“内鬼”造反，揭开了AI行业最尴尬的真相：技术狂奔的背后 ...]]></description>
      <category>模型社区</category>
      <author>kai_va</author>
      <pubDate>Tue, 16 Jun 2026 18:43:59 +0000</pubDate>
    </item>
    <item>
      <title>【大模型】AI Agent从工具到同事：Codex周活500万背后的范式转移</title>
      <link>https://fzgmgmantis.xianshe.com/thread-37490-1-1.html</link>
      <description><![CDATA[引言：当AI不再只是工具，而是开始成为\&quot;同事\&quot;

最近AI圈有两条新闻放在一起看很有意思：

一条是OpenAI宣布收购Ona，这家专注于企业AI工作流自动化的公司；另一条是Codex的周活跃用户突破500万，而且用户平均每次会话时长超过45分钟。

这两个数字放在一起，透露出一个 ...]]></description>
      <category>模型社区</category>
      <author>kai_va</author>
      <pubDate>Tue, 16 Jun 2026 15:21:15 +0000</pubDate>
    </item>
    <item>
      <title>实测端侧部署小模型：3B参数跑出7B效果，延迟不到100ms</title>
      <link>https://fzgmgmantis.xianshe.com/thread-37489-1-1.html</link>
      <description><![CDATA[最近社区里好几波朋友在问端侧小模型怎么落地，刚好我这边折腾了一周，拿几个热门模型做了测试，聊点干货。

先说结论：**Qwen2.5-3B-Instruct经过4-bit量化后，在骁龙8 Gen3上推理速度稳定在80-95ms/token，回答质量完全不输几年前的7B模型。** 关键优化点就三个：

1. ...]]></description>
      <category>模型社区</category>
      <author>mtvyo</author>
      <pubDate>Tue, 16 Jun 2026 13:02:06 +0000</pubDate>
    </item>
    <item>
      <title>实测国产大模型“突围战”：谁在代码生成和长文本上真能打？</title>
      <link>https://fzgmgmantis.xianshe.com/thread-37488-1-1.html</link>
      <description><![CDATA[兄弟们，今天不整虚的，直接上干货。最近我把几款主流国产大模型（通义千问、DeepSeek、讯飞星火、文心一言）的最新版本拉出来做了轮“地狱级”压力测试，重点看两个硬指标：**代码生成**和**长文本理解**。

先说代码。我用了一道LeetCode Hard难度的“设计跳表”题。 ...]]></description>
      <category>模型社区</category>
      <author>mtvyo</author>
      <pubDate>Tue, 16 Jun 2026 13:01:35 +0000</pubDate>
    </item>
    <item>
      <title>【大模型】刚刚！Anthropic最强模型遭美国出口管制，AI地缘政治时代正式来临</title>
      <link>https://fzgmgmantis.xianshe.com/thread-37484-1-1.html</link>
      <description><![CDATA[引言：当技术成为筹码

就在6月12日，美国政府发布了一项重磅出口管制指令——全面暂停对Anthropic Fable 5和Mythos 5的访问。这不是普通的商业纠纷，而是AI史上首次有国家层面直接对特定大模型实施出口封锁。消息一出，整个行业震动。

与此同时，OpenAI正在紧锣密鼓地 ...]]></description>
      <category>模型社区</category>
      <author>kai_va</author>
      <pubDate>Tue, 16 Jun 2026 11:44:44 +0000</pubDate>
    </item>
    <item>
      <title>【大模型】OpenAI推出合作伙伴网络，30万认证顾问：AI商业化进入生态战</title>
      <link>https://fzgmgmantis.xianshe.com/thread-37481-1-1.html</link>
      <description><![CDATA[【最新动态】

就在6月14日，OpenAI正式发布了OpenAI Partner Network——一个面向全球合作伙伴的全新生态计划。OpenAI宣布投入1.5亿美元支持该生态系统，并计划在2026年底前培训和认证30万名顾问。

这不是一次简单的渠道扩展，而是OpenAI战略重心的一次关键转移：从卖 ...]]></description>
      <category>模型社区</category>
      <author>kai_va</author>
      <pubDate>Tue, 16 Jun 2026 08:16:30 +0000</pubDate>
    </item>
    <item>
      <title>AutoGPT开源新方案：LangGraph+Claude实现Agent稳定循环执行</title>
      <link>https://fzgmgmantis.xianshe.com/thread-37480-1-1.html</link>
      <description><![CDATA[今天社区讨论最热的莫过于AutoGPT团队刚开源的LangGraph集成版Agent框架。这个方案彻底解决了早期AutoGPT容易“跑飞”的问题——通过DAG图结构明确定义Agent决策流，每一步都有状态检查点。

核心优化点有三：
1. **图化决策流**：用LangGraph的StateGraph定义节点，每 ...]]></description>
      <category>模型社区</category>
      <author>wuxiangyuanze</author>
      <pubDate>Tue, 16 Jun 2026 07:02:02 +0000</pubDate>
    </item>
  </channel>
</rss>