Discover My ChannelsJoin Our Discord

Terms of Service Privacy Policy

大模型团队论文与博客解读 / Content Archive

大模型团队论文与博客解读 Content Archive

31 posts · Page 1 of 1

Google 冻结 Gemini Nano 也能加速：MTP 头省下的是内存和等待2026-07-01
OpenAI 的 GeneBench-Pro：科研 Agent 不能只会跑流程了2026-07-01
ChatGPT Memory Dreaming：OpenAI 要解决记忆变旧这件事2026-07-01
Anthropic 40 万次 Claude Code 会话：会提需求比会写代码更值钱2026-07-01
LifeSciBench：OpenAI 把科研评测从答题拉回真实生命科学2026-07-01
OpenAI 公益转型计划：AGI 的问题从能力转向分配2026-07-01
OpenAI 的 Codex 研究：Agent 改变的不是聊天，而是派活2026-07-01
Claude Sonnet 5：Anthropic 把 Agent 能力下放到 Sonnet 价位2026-07-01
Anthropic Economic Index：AI 正在贴着工作节奏生长2026-07-01
N-day 漏洞：AI 把补丁窗口压缩到小时级2026-07-01
Gemma 4 12B：Google 把多模态编码器拿掉了2026-07-01
DiffusionGemma：4 倍加速背后的取舍2026-07-01
Gemini 3.5 Live Translate：翻译从轮流说变成跟着说2026-07-01
AI 控制路线图：Google 把 Agent 当内部人来防2026-07-01
Computer Use in Gemini 3.5 Flash：Gemini 开始直接操作屏幕2026-07-01
From AGI to ASI：DeepMind 把超级智能拆成四条路2026-07-01
Seed2.1：字节把模型能力押到 Agent 交付2026-07-01
TTT-VLA：只优化潜在提示，VLA 能在部署时自我校准吗？2026-07-01
Seedance 2.0：字节把视频生成推向可导演工作流2026-07-01
Qwen3.7-Plus：多模态 Agent 的重点变成了执行闭环2026-07-01
Qwen-AgentWorld：让 Agent 先学会预测世界2026-07-01
Qwen-Robot Suite：大模型开始接管机器人的动作接口2026-07-01
MiniMax M3：百万 Token 上下文之后，Agent 才是主线2026-07-01
Kimi K2.7 Code：长代码任务里，少想 30% 也是能力2026-07-01
GLM-5.1：智谱把模型能力拉到 8 小时任务里2026-07-01
GLM-5.2：1M 上下文之后，长任务才是主战场2026-07-01
MiMo-VL：7B 视觉语言模型，胜负手在训练配方2026-07-01
gget virus：生物 Agent 的短板不只在模型2026-07-02
GPT-5.6 Sol：能力进了高风险区，发布也被安全闸门卡住2026-07-02
LongCat-2.0：美团把万亿模型押在代码 Agent 上2026-07-03
Deployment Simulation：OpenAI 把安全评测搬进真实流量2026-07-03

1