大模型团队论文与博客解读 Content Archive

31 posts · Page 1 of 1

  1. Google 冻结 Gemini Nano 也能加速:MTP 头省下的是内存和等待
  2. OpenAI 的 GeneBench-Pro:科研 Agent 不能只会跑流程了
  3. ChatGPT Memory Dreaming:OpenAI 要解决记忆变旧这件事
  4. Anthropic 40 万次 Claude Code 会话:会提需求比会写代码更值钱
  5. LifeSciBench:OpenAI 把科研评测从答题拉回真实生命科学
  6. OpenAI 公益转型计划:AGI 的问题从能力转向分配
  7. OpenAI 的 Codex 研究:Agent 改变的不是聊天,而是派活
  8. Claude Sonnet 5:Anthropic 把 Agent 能力下放到 Sonnet 价位
  9. Anthropic Economic Index:AI 正在贴着工作节奏生长
  10. N-day 漏洞:AI 把补丁窗口压缩到小时级
  11. Gemma 4 12B:Google 把多模态编码器拿掉了
  12. DiffusionGemma:4 倍加速背后的取舍
  13. Gemini 3.5 Live Translate:翻译从轮流说变成跟着说
  14. AI 控制路线图:Google 把 Agent 当内部人来防
  15. Computer Use in Gemini 3.5 Flash:Gemini 开始直接操作屏幕
  16. From AGI to ASI:DeepMind 把超级智能拆成四条路
  17. Seed2.1:字节把模型能力押到 Agent 交付
  18. TTT-VLA:只优化潜在提示,VLA 能在部署时自我校准吗?
  19. Seedance 2.0:字节把视频生成推向可导演工作流
  20. Qwen3.7-Plus:多模态 Agent 的重点变成了执行闭环
  21. Qwen-AgentWorld:让 Agent 先学会预测世界
  22. Qwen-Robot Suite:大模型开始接管机器人的动作接口
  23. MiniMax M3:百万 Token 上下文之后,Agent 才是主线
  24. Kimi K2.7 Code:长代码任务里,少想 30% 也是能力
  25. GLM-5.1:智谱把模型能力拉到 8 小时任务里
  26. GLM-5.2:1M 上下文之后,长任务才是主战场
  27. MiMo-VL:7B 视觉语言模型,胜负手在训练配方
  28. gget virus:生物 Agent 的短板不只在模型
  29. GPT-5.6 Sol:能力进了高风险区,发布也被安全闸门卡住
  30. LongCat-2.0:美团把万亿模型押在代码 Agent 上
  31. Deployment Simulation:OpenAI 把安全评测搬进真实流量