大模型团队论文与博客解读 Content Archive
31 posts · Page 1 of 1
- Google 冻结 Gemini Nano 也能加速:MTP 头省下的是内存和等待
- OpenAI 的 GeneBench-Pro:科研 Agent 不能只会跑流程了
- ChatGPT Memory Dreaming:OpenAI 要解决记忆变旧这件事
- Anthropic 40 万次 Claude Code 会话:会提需求比会写代码更值钱
- LifeSciBench:OpenAI 把科研评测从答题拉回真实生命科学
- OpenAI 公益转型计划:AGI 的问题从能力转向分配
- OpenAI 的 Codex 研究:Agent 改变的不是聊天,而是派活
- Claude Sonnet 5:Anthropic 把 Agent 能力下放到 Sonnet 价位
- Anthropic Economic Index:AI 正在贴着工作节奏生长
- N-day 漏洞:AI 把补丁窗口压缩到小时级
- Gemma 4 12B:Google 把多模态编码器拿掉了
- DiffusionGemma:4 倍加速背后的取舍
- Gemini 3.5 Live Translate:翻译从轮流说变成跟着说
- AI 控制路线图:Google 把 Agent 当内部人来防
- Computer Use in Gemini 3.5 Flash:Gemini 开始直接操作屏幕
- From AGI to ASI:DeepMind 把超级智能拆成四条路
- Seed2.1:字节把模型能力押到 Agent 交付
- TTT-VLA:只优化潜在提示,VLA 能在部署时自我校准吗?
- Seedance 2.0:字节把视频生成推向可导演工作流
- Qwen3.7-Plus:多模态 Agent 的重点变成了执行闭环
- Qwen-AgentWorld:让 Agent 先学会预测世界
- Qwen-Robot Suite:大模型开始接管机器人的动作接口
- MiniMax M3:百万 Token 上下文之后,Agent 才是主线
- Kimi K2.7 Code:长代码任务里,少想 30% 也是能力
- GLM-5.1:智谱把模型能力拉到 8 小时任务里
- GLM-5.2:1M 上下文之后,长任务才是主战场
- MiMo-VL:7B 视觉语言模型,胜负手在训练配方
- gget virus:生物 Agent 的短板不只在模型
- GPT-5.6 Sol:能力进了高风险区,发布也被安全闸门卡住
- LongCat-2.0:美团把万亿模型押在代码 Agent 上
- Deployment Simulation:OpenAI 把安全评测搬进真实流量