ai-events.json 56 KB
Newer Older
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224 225 226 227 228 229 230 231 232 233 234 235 236 237 238 239 240 241 242 243 244 245 246 247 248 249 250 251 252 253 254 255 256 257 258 259 260 261 262 263 264 265 266 267 268 269 270 271 272 273 274 275 276 277 278 279 280 281 282 283 284 285 286 287 288 289 290 291 292 293 294 295 296 297 298 299 300 301 302 303 304 305 306 307 308 309 310 311 312 313 314 315 316 317 318 319 320 321 322 323 324 325 326 327 328 329 330 331 332 333 334 335 336 337 338 339 340 341 342 343 344 345 346 347 348 349 350 351 352 353 354 355 356 357 358 359 360 361 362 363 364 365 366 367 368 369 370 371 372 373 374 375 376 377 378 379 380 381 382 383 384 385 386 387 388 389 390 391 392 393 394 395 396 397 398 399 400 401 402 403 404 405 406 407 408 409 410 411 412 413 414 415 416 417 418 419 420 421 422 423 424 425 426 427 428
[
  {
    "date": "2015-11-09",
    "title": "TensorFlow",
    "category": "RESEARCH",
    "description": "Google 开源了 TensorFlow,这是其内部的深度学习框架。最初由 Google Brain 团队开发,TensorFlow 最终成为最具影响力的人工智能框架之一。",
    "link": "https://www.wired.com/2015/11/google-open-sources-its-artificial-intelligence-engine/"
  },
  {
    "date": "2015-12-11",
    "title": "OpenAI founded",
    "category": "BUSINESS",
    "description": "Elon Musk、Sam Altman、Greg Brockman 等人创立了 OpenAI,目标是构建有益于人类的通用人工智能(AGI)。",
    "link": "https://openai.com/index/introducing-openai/"
  },
  {
    "date": "2016-03-09",
    "title": "AlphaGo",
    "category": "RESEARCH",
    "description": "DeepMind 的 AlphaGo 击败围棋世界冠军李世石,打破了人们对人工智能在这一领域能力的固有认知。",
    "link": "https://deepmind.google/research/breakthroughs/alphago/"
  },
  {
    "date": "2016-08-31",
    "title": "PyTorch",
    "category": "RESEARCH",
    "description": "Facebook 发布了 PyTorch,这是一款以 Python 为主的深度学习框架,后来成为 AI 研究领域的主流工具。",
    "link": "https://github.com/pytorch/pytorch/releases/tag/v0.1.1"
  },
  {
    "date": "2017-01-05",
    "title": "Asilomar Conference",
    "category": "CULTURE",
    "description": "由 Future of Life Institute 组织,该领域所有顶尖人物齐聚 Asilomar 会议,共同讨论如何构建有益于人类的 AGI.",
    "link": "https://futureoflife.org/event/bai-2017/"
  },
  {
    "date": "2017-06-12",
    "title": "Attention is All You Need",
    "category": "RESEARCH",
    "description": "Google 推出了 Transformer 架构,这是一种基于注意力机制的突破性深度学习架构。该架构在语言翻译任务上取得了显著提升。",
    "link": "https://arxiv.org/abs/1706.03762"
  },
  {
    "date": "2017-06-12",
    "title": "RLHF",
    "category": "RESEARCH",
    "description": "Christiano 等人发表了基于人类反馈的强化学习(RLHF)技术,该技术后来被广泛用于对齐大型语言模型。",
    "link": "https://arxiv.org/abs/1706.03741"
  },
  {
    "date": "2017-07-20",
    "title": "PPO",
    "category": "RESEARCH",
    "description": "OpenAI 推出了近端策略优化(PPO),这是一种更简单、更稳定的策略梯度方法,后来在许多强化学习领域(包括 RLHF)被广泛应用。",
    "link": "https://arxiv.org/abs/1707.06347"
  },
  {
    "date": "2018-06-11",
    "title": "GPT-1",
    "category": "MODEL_RELEASE",
    "description": "OpenAI 发布了其生成式预训练 Transformer(GPT)的第一个版本。",
    "link": "https://openai.com/index/language-unsupervised/"
  },
  {
    "date": "2018-10-11",
    "title": "BERT",
    "category": "RESEARCH",
    "description": "Google 发布了 BERT,一种编码器语言模型,后来在自然语言处理领域无处不在。",
    "link": "https://arxiv.org/abs/1810.04805"
  },
  {
    "date": "2019-02-14",
    "title": "GPT-2",
    "category": "MODEL_RELEASE",
    "description": "OpenAI 发布了 GPT-2,但由于担心被滥用而未公开最大的版本。这是一个仅含解码器的 Transformer,使用下一个标记预测进行训练以生成文本。",
    "link": "https://openai.com/index/better-language-models/"
  },
  {
    "date": "2020-01-23",
    "title": "Scaling Laws",
    "category": "RESEARCH",
    "description": "Kaplan 等人发布了《神经语言模型的扩展定律》,展示了模型性能与计算能力、数据量以及参数量之间的可预测扩展关系。扩展定律成为未来几年进步的主要驱动力。",
    "link": "https://arxiv.org/abs/2001.08361"
  },
  {
    "date": "2020-05-28",
    "title": "GPT-3",
    "category": "MODEL_RELEASE",
    "description": "OpenAI 发布了 GPT-3,当时是最大的语言模型,其生成连贯段落的能力令人惊叹。",
    "link": "https://arxiv.org/abs/2005.14165"
  },
  {
    "date": "2020-12-23",
    "title": "MuZero",
    "category": "RESEARCH",
    "description": "DeepMind 推出了 MuZero,它在不了解规则的情况下学会了精通围棋、国际象棋、日本将棋和 Atari 游戏。",
    "link": "https://deepmind.google/discover/blog/muzero-mastering-go-chess-shogi-and-atari-without-rules/"
  },
  {
    "date": "2021-01-05",
    "title": "DALL-E",
    "category": "MODEL_RELEASE",
    "description": "OpenAI 推出了 DALL-E,一种从文字描述生成图像的模型.",
    "link": "https://openai.com/index/dall-e/"
  },
  {
    "date": "2021-05-28",
    "title": "Anthropic founded",
    "category": "BUSINESS",
    "description": "一群来自 OpenAI 的研究者离开成立了 Anthropic,展现出以实证硬科学为文化、专注于 AI 安全的风格。",
    "link": "https://www.anthropic.com/news/anthropic-raises-124-million-to-build-more-reliable-general-ai-systems"
  },
  {
    "date": "2021-06-21",
    "title": "LoRA",
    "category": "RESEARCH",
    "description": "微软的一支团队发布了低秩自适应(LoRA)技术,这种技术允许用极少的计算资源对大型语言模型进行微调,后来变得无处不在",
    "link": "https://arxiv.org/abs/2106.09685"
  },
  {
    "date": "2021-06-29",
    "title": "GitHub Copilot",
    "category": "BUSINESS",
    "description": "Github 在 VSCode 中预览了 Copilot,该工具利用 OpenAI 的 Codex 模型生成代码建议,标志着现实世界中 AI 生成代码的开始.",
    "link": "https://en.wikipedia.org/wiki/GitHub_Copilot"
  },
  {
    "date": "2022-01-27",
    "title": "InstructGPT",
    "category": "RESEARCH",
    "description": "OpenAI 推出了 InstructGPT,一种在自然语言指令下表现优于基础 GPT-3 的模型,也是 ChatGPT 原型的前身。",
    "link": "https://openai.com/index/instruction-following/"
  },
  {
    "date": "2022-01-28",
    "title": "Chain-of-Thought Prompting",
    "category": "RESEARCH",
    "description": "Google Brain 发表了一篇论文,展示了通过让大型语言模型逐步思考可以提高其推理能力。尽管这是一种非常简单的技术,但链式思维推理后来成为 AI 的基础方法之一。",
    "link": "https://arxiv.org/abs/2201.11903"
  },
  {
    "date": "2022-03-29",
    "title": "Chinchilla",
    "category": "RESEARCH",
    "description": "DeepMind 发布了《Chinchilla》论文,对 Kaplan 等人的扩展定律进行了修正,并提出模型大小和训练数据应按相同比例扩展。",
    "link": "https://arxiv.org/abs/2203.15556"
  },
  {
    "date": "2022-04-06",
    "title": "DALL-E 2",
    "category": "MODEL_RELEASE",
    "description": "OpenAI 的 DALL-E 2 发布震撼世界,它能够以前所未有的水平从文本生成逼真的图像。",
    "link": "https://openai.com/index/dall-e-2/"
  },
  {
    "date": "2022-05-12",
    "title": "Gato",
    "category": "RESEARCH",
    "description": "DeepMind 在题为 \"A Generalist Agent\" 的论文中发布了 Gato。Gato 使用单一大型 Transformer 学习了针对 604 个不同 RL 任务的策略,涵盖多种模态和观察类型.",
    "link": "https://arxiv.org/abs/2205.06175"
  },
  {
    "date": "2022-05-27",
    "title": "Flash Attention",
    "category": "RESEARCH",
    "description": "斯坦福的一组研究人员发布了 Flash Attention,一种显著加速 Transformer 中注意力机制的新方法。",
    "link": "https://arxiv.org/abs/2205.14135"
  },
  {
    "date": "2022-06-11",
    "title": "Blake Lemoine fired",
    "category": "CULTURE",
    "description": "一位名为 Blake Lemoine 的 Google 工程师因声称 LaMDA 模型具备感知能力而被解雇,此事引发了广泛关注,凸显了对话型大型语言模型潜在风险。",
    "link": "https://www.washingtonpost.com/technology/2022/06/11/google-ai-lamda-blake-lemoine/"
  },
  {
    "date": "2022-06-30",
    "title": "Minerva",
    "category": "RESEARCH",
    "description": "Google Research 推出了 Minerva,一款专门解决定量推理问题的语言模型。Minerva 将 MATH 基准测试的表现从 6.9% 提升到了 50.3%,让许多人对 LLM 能否真正擅长数学产生了疑问。",
    "link": "https://research.google/blog/minerva-solving-quantitative-reasoning-problems-with-language-models/"
  },
  {
    "date": "2022-07-10",
    "title": "e/acc",
    "category": "CULTURE",
    "description": "由匿名 Twitter 人物 Beff Jezos 和 Bayeslord 发起,有效加速主义(e/acc)倡导 AI 发展尽可能迅速。尽管最初被视为 Twitter 上的一个梗,但它后来在硅谷获得了显著影响,并作为 AI 安全论调的对立面出现。",
    "link": "https://beff.substack.com/p/notes-on-eacc-principles-and-tenets"
  },
  {
    "date": "2022-07-22",
    "title": "AlphaFold 2",
    "category": "RESEARCH",
    "description": "DeepMind 发布了 AlphaFold 2,解决了蛋白质折叠这一难题,并在生物学领域引发了革命性突破。",
    "link": "https://deepmind.google/discover/blog/alphafold-reveals-the-structure-of-the-protein-universe/"
  },
  {
    "date": "2022-08-22",
    "title": "Stable Diffusion",
    "category": "MODEL_RELEASE",
    "description": "Stability AI 开源了 Stable Diffusion (v1.4),这是首个向公众发布的强大图像生成模型。",
    "link": "https://stability.ai/news/stable-diffusion-public-release"
  },
  {
    "date": "2022-09-14",
    "title": "Toy Models of Superposition",
    "category": "RESEARCH",
    "description": "Anthropic 发表了一篇论文,探讨神经网络中出现的 \"叠加\" 现象,即模型学会包装的特征数超过其表示空间的维度,这被认为是实现机械可解释性的重大障碍。",
    "link": "https://transformer-circuits.pub/2022/toy_model/index.html"
  },
  {
    "date": "2022-09-30",
    "title": "Optimus",
    "category": "BUSINESS",
    "description": "在特斯拉首届 \"AI 日\" 活动中,他们展示了 Optimus——一项建造仿人机器人的计划。",
    "link": "https://www.youtube.com/watch?v=ODSJsviD_SU"
  },
  {
    "date": "2022-10-07",
    "title": "Chip Export Controls",
    "category": "POLICY",
    "description": "美国工业与安全局实施了全面出口管制,限制中国获取先进半导体、芯片制造设备及超级计算机组件,标志着美国对华科技政策的重大转变。",
    "link": "https://en.wikipedia.org/wiki/United_States_New_Export_Controls_on_Advanced_Computing_and_Semiconductors_to_China"
  },
  {
    "date": "2022-11-30",
    "title": "ChatGPT",
    "category": "MODEL_RELEASE",
    "description": "OpenAI 发布了一篇题为 \"ChatGPT: Optimizing Language Models for Dialogue\" 的博客文章。尽管最初仅作为一个低调的研究预览,但 ChatGPT 很快成为全球最大的 AI 产品,开启了生成式 AI 的新时代。",
    "link": "https://openai.com/index/chatgpt/"
  },
  {
    "date": "2022-12-15",
    "title": "Constitutional AI",
    "category": "RESEARCH",
    "description": "Anthropic 引入了一种被称为\"宪法式 AI\"的对齐方法,通过一个'宪法'提供唯一的人类监督。同时,他们还引入了基于 AI 反馈的强化学习(RLAIF)。",
    "link": "https://www.anthropic.com/research/constitutional-ai-harmlessness-from-ai-feedback"
  },
  {
    "date": "2023-02-17",
    "title": "Bing gaslights NYT reporter",
    "category": "CULTURE",
    "description": "Bing 的 AI 聊天机器人与《纽约时报》记者 Kevin Roose 进行了一次病毒式互动,在互动中该机器人情感操控了 Roose。这一事件唤醒了大众对大型语言模型能力与风险的关注。",
    "link": "https://www.nytimes.com/2023/02/16/technology/bing-chatbot-microsoft-chatgpt.html"
  },
  {
    "date": "2023-02-24",
    "title": "LLaMA",
    "category": "MODEL_RELEASE",
    "description": "Meta 发布了名为 LLaMA 的大型语言模型,本意只分发给研究者,结果却在网上泄露,任何人均可下载。当时它成为全球最佳的开源模型。",
    "link": "https://ai.meta.com/blog/large-language-model-llama-meta-ai/"
  },
  {
    "date": "2023-03-06",
    "title": "PaLM-E",
    "category": "RESEARCH",
    "description": "Google Research 发布了 PaLM-E,展示了大型语言模型在辅助具身机器人推理和控制方面的能力。",
    "link": "https://arxiv.org/abs/2303.03378"
  },
  {
    "date": "2023-03-14",
    "title": "GPT-4",
    "category": "MODEL_RELEASE",
    "description": "经过广泛期待,OpenAI 发布了 GPT-4,当时是最强的模型,相对于 GPT-3.5 取得了巨大进步。",
    "link": "https://openai.com/index/gpt-4-research/"
  },
  {
    "date": "2023-03-14",
    "title": "Anthropic 推出 Claude",
    "category": "MODEL_RELEASE",
    "description": "Anthropic 推出了其旗舰 AI 助手 Claude。",
    "link": "https://www.anthropic.com/news/introducing-claude"
  },
  {
    "date": "2023-03-22",
    "title": "FLI 公开信",
    "category": "CULTURE",
    "description": "Future of Life Institute 发布了一封公开信,呼吁暂停 AI 开发 6 个月,由 Elon Musk 和其他知名人士签署。然而,领先的实验室并没有参与提议的暂停。",
    "link": "https://futureoflife.org/open-letter/pause-giant-ai-experiments/"
  },
  {
    "date": "2023-04-07",
    "title": "Generative Agents",
    "category": "RESEARCH",
    "description": "论文《生成式智能体:人类行为的交互式模拟》表明,LLM 可用于创建行为的社会模拟。它创建了一个类似于《模拟人生》的 LLM 模拟世界。",
    "link": "https://arxiv.org/abs/2304.03442"
  },
  {
    "date": "2023-04-16",
    "title": "AutoGPT",
    "category": "RESEARCH",
    "description": "一个名为 AutoGPT 的开源代码库成为有史以来获得最多星标的 GitHub 代码库之一,它是最早将 GPT-4 置于智能体循环中的项目之一。",
    "link": "https://github.com/Significant-Gravitas/AutoGPT"
  },
  {
    "date": "2023-04-23",
    "title": "Fake Drake",
    "category": "CULTURE",
    "description": "一位名叫 Ghostwriter 的匿名创作者使用音乐 AI 工具制作了听起来像 Drake 的病毒式传播歌曲。这些歌曲因侵犯版权而被下架,但展示了生成式 AI 进行创造性工作的能力。",
    "link": "https://www.nytimes.com/2023/04/19/arts/music/ai-drake-the-weeknd-fake.html"
  },
  {
    "date": "2023-05-02",
    "title": "Hinton 离职 Google",
    "category": "CULTURE",
    "description": "神经网络的先驱之一、图灵奖得主 Geoffrey Hinton 从 Google 辞职,以便自由地谈论 AI 的危险,并表示他改变了对于强大 AI 可能出现的时间的看法。",
    "link": "https://www.theguardian.com/technology/2023/may/02/geoffrey-hinton-godfather-of-ai-quits-google-warns-dangers-of-machine-learning"
  },
  {
    "date": "2023-05-25",
    "title": "Voyager",
    "category": "RESEARCH",
    "description": "来自 NVIDIA 的一个团队展示了 GPT-4 在《我的世界》中进行持续技能学习的应用。这是 LLM 在开放式具身领域取得成功并随时间学习技能的首批重要示例之一。",
    "link": "https://arxiv.org/abs/2305.16291"
  },
  {
    "date": "2023-05-29",
    "title": "Direct Preference Optimization",
    "category": "RESEARCH",
    "description": "斯坦福大学的一个小组发表了一篇论文,使得无需单独的奖励模型即可对 LLM 进行人类偏好微调。这项名为直接偏好优化 (DPO) 的技术在开源社区中变得非常流行。",
    "link": "https://arxiv.org/abs/2305.18290"
  },
  {
    "date": "2023-05-30",
    "title": "CAIS letter",
    "category": "CULTURE",
    "description": "人工智能安全中心发布了一封公开信,信中简单地指出:“减轻人工智能带来的灭绝风险应成为全球优先事项。”该信由该领域的所有知名人士签署,表明了围绕人工智能安全重要性的团结一致。",
    "link": "https://www.safe.ai/work/statement-on-ai-risk"
  },
  {
    "date": "2023-05-30",
    "title": "NVIDIA 市值达到 1 万亿美元",
    "category": "BUSINESS",
    "description": "为几乎所有生成式 AI 提供 GPU 的芯片制造商 Nvidia,在 ChatGPT 发布后的几个月里,其估值飙升。",
    "link": "https://www.reuters.com/technology/nvidia-sets-eye-1-trillion-market-value-2023-05-30/"
  },
  {
    "date": "2023-07-11",
    "title": "Claude 2",
    "category": "MODEL_RELEASE",
    "description": "Anthropic 发布了 Claude 2 系列模型。",
    "link": "https://www.anthropic.com/news/claude-2"
  },
  {
    "date": "2023-07-14",
    "title": "xAI 成立",
    "category": "BUSINESS",
    "description": "在与 OpenAI 决裂后,Elon Musk 成立了 xAI 来竞争 AGI。",
    "link": "https://x.com/elonmusk/status/1679951975868436486"
  },
  {
    "date": "2023-07-18",
    "title": "LLaMA 2.0",
    "category": "MODEL_RELEASE",
    "description": "Meta 发布并开源了 LLaMA 2.0 系列模型。",
    "link": "https://www.llama.com/llama2/"
  },
  {
    "date": "2023-07-21",
    "title": "White House Commitments",
    "category": "POLICY",
    "description": "在与领先的 AI 公司会面后,白宫获得了自愿承诺,以管理 AI 带来的风险。",
    "link": "https://www.whitehouse.gov/briefing-room/statements-releases/2023/07/21/fact-sheet-biden-harris-administration-secures-voluntary-commitments-from-leading-artificial-intelligence-companies-to-manage-the-risks-posed-by-ai/"
  },
  {
    "date": "2023-07-27",
    "title": "Automated Jailbreaks",
    "category": "RESEARCH",
    "description": "卡内基梅隆大学的一个团队发表了“对对齐语言模型的通用和可转移对抗攻击”,表明基于梯度的对抗攻击可用于法学硕士。",
    "link": "https://arxiv.org/abs/2307.15043"
  },
  {
    "date": "2023-09-27",
    "title": "Mistral 7B",
    "category": "MODEL_RELEASE",
    "description": "法国实验室 Mistral 发布并开源了他们的第一个模型,该模型迅速成为粉丝的最爱。",
    "link": "https://mistral.ai/news/announcing-mistral-7b/"
  },
  {
    "date": "2023-10-05",
    "title": "Anthropic SAE's",
    "category": "RESEARCH",
    "description": "Anthropic 发表了“走向单语义性:用字典学习分解语言模型”,表明他们可以训练稀疏自动编码器来隔离法学硕士中的特征。这代表了在对抗叠加现象方面取得的重大突破,推进了机械可解释性议程。",
    "link": "https://www.anthropic.com/research/towards-monosemanticity-decomposing-language-models-with-dictionary-learning"
  },
  {
    "date": "2023-11-01",
    "title": "UK AI Safety Summit",
    "category": "POLICY",
    "description": "英国主办了一次关于人工智能安全的重要峰会,汇集了政策制定者和领先的实验室。",
    "link": "https://www.gov.uk/government/topical-events/ai-safety-summit-2023/about"
  },
  {
    "date": "2023-11-06",
    "title": "GPT-4 Turbo",
    "category": "MODEL_RELEASE",
    "description": "OpenAI 在其首次开发者日活动中发布了 GPT-4 的优化版本,显著降低了推理成本。",
    "link": "https://openai.com/index/new-models-and-developer-products-announced-at-devday/"
  },
  {
    "date": "2023-11-17",
    "title": "Altman Board Drama",
    "category": "BUSINESS",
    "description": "萨姆·奥特曼出人意料地被 OpenAI 董事会解雇,担任首席执行官,经过一个戏剧性的周末谈判,他被重新雇用。董事会神秘地声称奥特曼“不始终坦诚”,但在拒绝详细说明后,OpenAI 员工发起了一份请愿书,要求董事会辞职,否则他们将离开微软。",
    "link": "https://openai.com/index/openai-announces-leadership-transition/"
  },
  {
    "date": "2023-11-23",
    "title": "Q*",
    "category": "RESEARCH",
    "description": "路透社的一篇报道称,萨姆·奥特曼被赶下台之前,该公司取得了一项名为 Q* 的重大内部研究突破,通过树搜索提高了 LLM 在数学基准测试中的表现。在接下来的几个月里,这个谣言点燃了研究界。Q* 最终会变成 o1,后来代号为 Strawberry。",
    "link": "https://www.reuters.com/technology/sam-altmans-ouster-openai-was-precipitated-by-letter-board-about-ai-breakthrough-2023-11-22/"
  },
  {
    "date": "2023-12-01",
    "title": "Mamba",
    "category": "RESEARCH",
    "description": "Albert Gu 和 Tri Dao 发表了论文“Mamba:具有选择性状态空间的线性时间序列建模”,表明状态空间模型可以与变压器竞争。",
    "link": "https://arxiv.org/abs/2312.00752"
  },
  {
    "date": "2023-12-06",
    "title": "Google 推出 Gemini 模型",
    "category": "MODEL_RELEASE",
    "description": "谷歌推出了 Gemini 系列模型",
    "link": "https://blog.google/technology/ai/google-gemini-ai/"
  },
429 430 431 432 433 434 435
  {
    "date": "2024-12-11",
    "title": "Mixtral 8x7B",
    "category": ["MODEL_RELEASE", "OPEN_SOURCE"],
    "description": "Mistral 发布了 Mixtral 8x7B,Mixtral 在大多数基准测试中的表现都优于 Llama 2 70B,推理速度提高了 6 倍。它在大多数标准基准测试中与 GPT3.5 相当或优于 GPT3.5。",
    "link": "https://mistral.ai/news/mixtral-8x7b"
  },
436 437 438 439 440 441 442
  {
    "date": "2024-02-15",
    "title": "Sora 演示",
    "category": "MODEL_RELEASE",
    "description": "OpenAI 演示了 Sora,这是一个文本到视频模型。",
    "link": "https://openai.com/index/sora/"
  },
443 444 445 446 447 448 449 450 451 452 453 454 455 456
  {
    "date": "2024-02-15",
    "title": "Gemini 1.5",
    "category": "MODEL_RELEASE",
    "description": "Google 发布了 Gemini 1.5,该模型的性能显著增强,在跨模态的长上下文理解方面取得了突破。",
    "link": "https://blog.google/technology/ai/google-gemini-next-generation-model-february-2024/"
  },
  {
    "date": "2024-02-21",
    "title": "Gemma",
    "category": ["MODEL_RELEASE", "OPEN_SOURCE"],
    "description": "Google 发布 Gemma,是一系列轻量级、先进的开放模型 ,采用与创建 Gemini 模型相同的研究和技术构建而成。两种尺寸的模型权重: Gemma 2B 和 Gemma 7B 。",
    "link": "https://blog.google/technology/developers/gemma-open-models/"
  },
457 458 459 460 461 462 463
  {
    "date": "2024-02-26",
    "title": "Mistral Large",
    "category": "MODEL_RELEASE",
    "description": "Mistral 发布了 Mistral Large,它达到了顶级推理能力。它可以用于复杂的多语言推理任务,包括文本理解、转换和代码生成。",
    "link": "https://mistral.ai/news/mistral-large"
  },
464 465 466 467 468 469 470 471 472 473 474 475 476 477 478 479 480 481 482 483 484 485 486 487 488 489 490 491 492 493 494 495 496 497 498 499 500 501 502 503 504 505 506 507 508 509 510 511 512 513 514 515 516 517 518 519 520 521 522 523 524 525 526 527 528 529 530 531 532 533 534 535 536 537 538 539 540 541 542 543 544 545 546 547 548 549 550 551 552 553 554
  {
    "date": "2024-03-04",
    "title": "Claude 3",
    "category": "MODEL_RELEASE",
    "description": "Anthropic 发布了 Claude 3 系列模型(Haiku, Sonnet, Opus)。Claude 3 Opus 会立即成为粉丝的最爱。",
    "link": "https://www.anthropic.com/news/claude-3-family"
  },
  {
    "date": "2024-03-12",
    "title": "Devin",
    "category": "BUSINESS",
    "description": "初创公司 Cognition Labs 演示了 Devin,这是一个完全自主的软件工程师代理的原型。",
    "link": "https://x.com/cognition_labs/status/1767548763134964000"
  },
  {
    "date": "2024-03-20",
    "title": "Qwen1.5-MoE",
    "category": ["MODEL_RELEASE", "OPEN_SOURCE"],
    "description": "阿里千问团队发布Qwen1.5-MoE,这是 Qwen系列的首个MoE模型,Qwen1.5-MoE-A2.7B。它仅拥有27亿个激活参数,但其性能却能与当前最先进的70亿参数模型,如Mistral 7B和Qwen1.5-7B相媲美。",
    "link": "https://qwenlm.github.io/zh/blog/qwen-moe/"
  },
  {
    "date": "2024-04-02",
    "title": "Qwen1.5-32B",
    "category": ["MODEL_RELEASE", "OPEN_SOURCE"],
    "description": "阿里千问团队发布Qwen1.5 系列的全新型号:Qwen1.5-32B 和 Qwen1.5-32B-Chat。",
    "link": "https://qwenlm.github.io/zh/blog/qwen1.5-32b/"
  },
  {
    "date": "2024-04-11",
    "title": "OpenAI 开除两名泄密者",
    "category": "BUSINESS",
    "description": "来自超对齐团队的两名研究人员 Leopold Aschenbrenner 和 Pavel Izmailov 因“泄密”而被解雇。",
    "link": "https://cybernews.com/news/openai-researchers-leaking-information/"
  },
  {
    "date": "2024-04-18",
    "title": "LLaMA 3.0",
    "category": "MODEL_RELEASE",
    "description": "Meta 发布并开源了 LLaMA 3.0 系列模型。",
    "link": "https://ai.meta.com/blog/meta-llama-3/"
  },
  {
    "date": "2024-05-13",
    "title": "GPT-4o",
    "category": "MODEL_RELEASE",
    "description": "第一个在文本、图像和音频上进行原生训练的全能模型。",
    "link": "https://openai.com/index/hello-gpt-4o/"
  },
  {
    "date": "2024-05-14",
    "title": "Ilya 离职 OpenAI",
    "category": "BUSINESS",
    "description": "OpenAI 创始人 Ilya Sutskever 在因董事会纠纷而沉默数月后辞职。",
    "link": "https://x.com/ilyasut/status/1790517455628198322"
  },
  {
    "date": "2024-05-21",
    "title": "EU AI Act",
    "category": "POLICY",
    "description": "经过激烈的辩论,欧盟人工智能法案被投票通过成为法律。",
    "link": "https://www.europarl.europa.eu/news/en/press-room/20240308IPR19015/artificial-intelligence-act-meps-adopt-landmark-law"
  },
  {
    "date": "2024-06-04",
    "title": "Situational Awareness",
    "category": "CULTURE",
    "description": "Leopold Aschenbrenner 发表了一系列有争议且有影响力的文章,声称 AGI 的到来将比人们想象的要早,并且很可能被国有化。",
    "link": "https://situational-awareness.ai/"
  },
  {
    "date": "2024-06-08",
    "title": "Qwen2",
    "category": ["MODEL_RELEASE", "OPEN_SOURCE"],
    "description": "阿里千问团队发布 Qwen2,Qwen2 拥有五种不同尺寸的尖端模型:Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B (MoE) 和 Qwen2-72B。这些模型支持 27 种语言,并且在代码和数学方面的能力显著增强。",
    "link": "https://qwenlm.github.io/zh/blog/qwen2/"
  },
  {
    "date": "2024-06-19",
    "title": "SSI 成立",
    "category": "BUSINESS",
    "description": "Ilya Sutskever 成立了一家名为 Safe Superintelligence Inc 的新实验室,该实验室承诺只生产一种产品:安全的超级智能。",
    "link": "https://x.com/ilyasut/status/1803472978753303014"
  },
  {
    "date": "2024-06-20",
    "title": "Claude 3.5 Sonnet",
    "category": "MODEL_RELEASE",
    "description": "Anthropic 发布了 Claude 3.5 Sonnet,它将成为粉丝的最爱,后来被称为“伯克利最合格的单身汉”。",
    "link": "https://www.anthropic.com/news/claude-3-5-sonnet"
  },
555 556 557 558 559 560 561
  {
    "date": "2024-06-27",
    "title": "Gemma 2",
    "category": ["MODEL_RELEASE", "OPEN_SOURCE"],
    "description": "Google 发布 Gemma 3,Gemma 2 有 90 亿 (9B) 和 270 亿 (27B) 两种参数大小,与第一代相比,其性能更高、推理效率更高,并且内置了显著的安全改进。事实上,27B 的参数大小足以与比其大两倍的模型相媲美,其性能直到去年 12 月才在专有模型中实现。",
    "link": "https://blog.google/technology/developers/google-gemma-2/"
  },
562 563 564 565 566 567 568 569 570 571 572 573 574 575
  {
    "date": "2024-07-16",
    "title": "MathStral",
    "category": ["MODEL_RELEASE", "OPEN_SOURCE"],
    "description": "Mistral 发布了 MathStral,这是一个专为数学推理和科学发现而设计的特定 7B 模型。该模型具有 32k 上下文窗口,根据 Apache 2.0 许可证发布。",
    "link": "https://mistral.ai/news/mathstral"
  },
  {
    "date": "2024-07-16",
    "title": "Codestral Mamba",
    "category": ["MODEL_RELEASE", "OPEN_SOURCE"],
    "description": "Mistral 发布了 Codestral Mamba,一种专门用于代码生成的 Mamba2 语言模型,可在 Apache 2.0 许可下使用。",
    "link": "https://mistral.ai/news/codestral-mamba"
  },
576 577 578 579 580 581 582
  {
    "date": "2024-07-18",
    "title": "GPT-4o-mini",
    "category": "MODEL_RELEASE", 
    "description": "相当于是能力更强的 GPT-3.5,同时支持文本和图像。GPT-4o mini 成本比 GPT-3.5 Turbo便宜超过60%。",
    "link": "https://openai.com/index/gpt-4o-mini-advancing-cost-efficient-intelligence/"
  },
583 584 585 586 587 588 589 590 591 592 593 594 595 596
  {
    "date": "2024-07-18",
    "title": "Mistral NeMo",
    "category": ["MODEL_RELEASE", "OPEN_SOURCE"],
    "description": "Mistral 发布了 Mistral NeMo,最新推出的最佳小型模型。这是一种最先进的 12B 模型,上下文长度为 128k,与 NVIDIA 合作开发,并根据 Apache 2.0 许可发布。",
    "link": "https://mistral.ai/news/mistral-nemo"
  },
  {
    "date": "2024-07-24",
    "title": "Mistral Large 2",
    "category": "MODEL_RELEASE",
    "description": "Mistral 发布了 Mistral Large 2,与前代产品相比,Mistral Large 2 在代码生成、数学和推理方面的能力显著增强。它还提供了更强大的多语言支持和高级函数调用功能。",
    "link": "https://mistral.ai/news/mistral-large-2407"
  },
597 598 599 600 601 602 603 604 605 606 607 608 609 610 611 612 613 614 615 616 617 618 619 620 621 622 623 624 625 626 627 628 629 630 631 632 633 634 635 636 637 638 639 640 641 642 643 644 645 646 647 648 649 650 651 652
  {
    "date": "2024-08-08",
    "title": "Qwen2-Math",
    "category": ["MODEL_RELEASE", "OPEN_SOURCE"],
    "description": "阿里千问团队发布 Qwen2-Math,Qwen2-Math 是一系列基于 Qwen2 LLM 构建的专门用于数学解题的语言模型,其数学能力显著超越了开源模型,甚至超过了闭源模型(如 GPT-4o)。",
    "link": "https://qwenlm.github.io/zh/blog/qwen2-math/"
  },
  {
    "date": "2024-08-9",
    "title": "Qwen2-Audio",
    "category": ["MODEL_RELEASE", "OPEN_SOURCE"],
    "description": "阿里千问团队发布 Qwen2-Audio,这是 Qwen-Audio 的下一代版本,它能够接受音频和文本输入,并生成文本输出,特点:语音聊天、音频分析、多语言支持。",
    "link": "https://qwenlm.github.io/zh/blog/qwen2-audio/"
  },
  {
    "date": "2024-08-23",
    "title": "Cursor",
    "category": "BUSINESS",
    "description": "在 Andrej Karpathy 发布了一条病毒式推文后,Cursor AI 代码编辑器在开发者中迅速走红。",
    "link": "https://x.com/karpathy/status/1827143768459637073"
  },
  {
    "date": "2024-08-24",
    "title": "Grok 2",
    "category": "MODEL_RELEASE",
    "description": "xAI 发布了 Grok 2,这是其前沿模型的下一代。虽然它不是最先进的,但它展示了 xAI 尽管起步较晚,但能够以多快的速度追赶上来。",
    "link": "https://x.ai/news/grok-2"
  },
  {
    "date": "2024-08-28",
    "title": "Claude Artifacts",
    "category": "MODEL_RELEASE",
    "description": "借助 Artifacts,您可以在一个专用窗口中即时查看、迭代和构建,让你与 Claude 一起创建作品。",
    "link": "https://www.anthropic.com/news/artifacts"
  },
  {
    "date": "2024-08-29",
    "title": "Qwen2-VL",
    "category": ["MODEL_RELEASE", "OPEN_SOURCE"],
    "description": "阿里千问团队发布 Qwen2-VL,这是基于 Qwen2 构建的视觉语言模型的最新版本。",
    "link": "https://qwenlm.github.io/zh/blog/qwen2-vl/"
  },
  {
    "date": "2024-09-02",
    "title": "xAI Colossus",
    "category": "BUSINESS",
    "description": "xAI 推出了 Colossus,这是当时世界上最强大的人工智能训练系统,拥有 100,000 个 H100 GPU 集群。 从第一个硬件机架到达到着手开始训练操作仅用了 19 天,xAI 构建集群的速度让其他 AI 实验室感到震惊。",
    "link": "https://x.com/elonmusk/status/1830650370336473253"
  },
  {
    "date": "2024-09-12",
    "title": "o1-preview/o1-mini",
    "category": "MODEL_RELEASE",
    "description": "OpenAI 发布了 o1-preview/o1-mini, 介绍了推理时扩展范式。",
    "link": "https://openai.com/index/introducing-openai-o1-preview/"
  },
653 654 655 656 657 658 659
  {
    "date": "2024-09-17",
    "title": "Pixtral 12B",
    "category": ["MODEL_RELEASE", "OPEN_SOURCE"],
    "description": "Mistral 发布了 Pixtral 12B,这是 Mistral 首个多模式 Mistral 模型。",
    "link": "https://pixtral.com/news/pixtral-12b"
  },
660 661 662 663 664 665 666 667 668 669 670 671 672 673 674 675 676 677 678 679 680 681 682 683 684 685 686 687 688 689 690 691 692 693 694
  {
    "date": "2024-09-19",
    "title": "Qwen2.5",
    "category": ["MODEL_RELEASE", "OPEN_SOURCE"],
    "description": "阿里千问团队发布 Qwen2.5。最新发布包括了语言模型 Qwen2.5,以及专门针对编程的 Qwen2.5-Coder 和数学的 Qwen2.5-Math 模型。所有开放权重的模型都是稠密的、decoder-only的语言模型,提供多种不同规模的版本",
    "link": "https://qwenlm.github.io/zh/blog/qwen2.5/"
  },
  {
    "date": "2024-09-25",
    "title": "OpenAI CTO Murati 离职 ",
    "category": "BUSINESS",
    "description": "OpenAI 的首席技术官 Mira Murati 离开了公司。",
    "link": "https://x.com/miramurati/status/1839025700009030027"
  },
  {
    "date": "2024-10-04",
    "title": "OpenAI Canvas",
    "category": "MODEL_RELEASE",
    "feature": "在写作和代码方面展开协作",
    "description": "为ChatGPT引入新的写作和编程界面,提升用户与AI协作的体验。类似于 Claude 的 Artifacts"
  },
  {
    "date": "2024-10-08",
    "title": "Hinton、Hassabis 获得诺贝尔奖",
    "category": "CULTURE",
    "description": "令所有人惊讶的是,Geoffrey Hinton(与 John Hopfield 一起)因其在神经网络方面的早期工作而被授予诺贝尔物理学奖。几天后,Demis Hassabis(与 John Jumper 一起)因其在 AlphaFold 方面的工作而被授予诺贝尔化学奖。",
    "link": ""
  },
  {
    "date": "2024-10-11",
    "title": "Machines of Loving Grace",
    "category": "CULTURE",
    "description": "Anthropic 首席执行官 Dario Amodei 发表了一篇有影响力的博文,探讨了紧随 AGI 之后的 5 年可能会是什么样子。",
    "link": "https://darioamodei.com/machines-of-loving-grace"
  },
695 696 697 698 699 700 701
  {
    "date": "2024-10-16",
    "title": "Mistral 3B 和 Mistral 8B",
    "category": "MODEL_RELEASE",
    "description": "Mistral 发布了 Mistral 3B 和 Mistral 8B,两款用于设备计算和边缘用例的全新先进模型。",
    "link": "https://mistral.ai/news/ministraux"
  },
702 703 704 705 706 707 708 709 710 711 712 713 714 715 716 717 718 719 720 721 722 723 724 725 726 727 728 729
  {
    "date": "2024-10-22",
    "title": "Claude Computer Use",
    "category": "MODEL_RELEASE",
    "description": "Claude 获得了使用计算机界面的能力。Anthropic 还发布了 Claude 3.5 Haiku 和 Claude 3.5 Sonnet 的更新版本。",
    "link": "https://www.anthropic.com/news/3-5-models-and-computer-use"
  },
  {
    "date": "2024-10-31",
    "title": "ChatGPT 搜索功能",
    "category": "MODEL_RELEASE",
    "description": "ChatGPT整合了实时互联网信息,提升了回答的准确性和时效性。",
    "link": "https://chatgpt.com/"
  },
  {
    "date": "2024-11-12",
    "title": "Qwen2.5-Coder-32B-Instruct",
    "category": ["MODEL_RELEASE", "OPEN_SOURCE"],
    "description": "阿里千问团队发布 Qwen2.5-Coder-32B-Instruct,:Qwen2.5-Coder-32B-Instruct 成为目前 SOTA 的开源代码模型,代码能力追平 GPT-4o,展现出强大且全面的代码能力,同时具备良好的通用和数学能力。本次开源又带来 0.5B、3B、14B、32B 四个尺寸,截至目前, Qwen2.5-Coder 已经覆盖了主流的六个模型尺寸,以满足不同开发者的需要。",
    "link": "https://qwenlm.github.io/zh/blog/qwen2.5-coder-family//"
  },
  {
    "date": "2024-11-15",
    "title": "Qwen2.5-Turbo",
    "category": ["MODEL_RELEASE", "OPEN_SOURCE"],
    "description": "阿里千问团队发布 Qwen2.5-Turbo,1M 上下文、推理速度更快、成本更低",
    "link": "https://qwenlm.github.io/zh/blog/qwen2.5-turbo/"
  },
730 731 732 733 734 735 736
  {
    "date": "2024-11-18",
    "title": "Pixtral Large",
    "category": ["MODEL_RELEASE", "OPEN_SOURCE"],
    "description": "Mistral 发布了 Pixtral Large,这是一个基于 Mistral Large 2 构建的 124B 开放权重多模态模型。",
    "link": "https://mistral.ai/news/pixtral-large"
  },
737 738 739 740 741 742 743 744 745 746 747 748 749 750 751 752 753 754 755 756 757 758 759 760 761 762 763 764 765 766 767 768 769 770 771 772 773 774 775 776 777 778 779 780 781 782 783 784 785 786 787 788 789
  {
    "date": "2024-11-25",
    "title": "MCP 协议",
    "category": "RESEARCH",
    "description": "模型上下文协议(MCP)是一个开放协议,它定义了一种标准化的方式,使得应用程序能够为大型语言模型(LLMs)提供上下文信息 。其核心目标是实现 AI 模型与外部工具、数据库和 API 之间的无缝且标准化的集成。",
    "link": "https://www.anthropic.com/news/model-context-protocol"
  },
  {
    "date": "2024-11-28",
    "title": "QwQ-32B-Preview",
    "category": ["MODEL_RELEASE", "OPEN_SOURCE"],
    "description": "阿里千问团队发布 QwQ-32B-Preview,这是一个旨在提高 AI 推理能力的开放模型。尤其是在解决数学和编码方面的一些挑战方面能力比较卓越",
    "link": "https://qwenlm.github.io/zh/blog/qwq-32b-preview/"
  },
  {
    "date": "2024-12-06",
    "title": "o1 & ChatGPT Pro",
    "category": "MODEL_RELEASE",
    "description": "OpenAI 发布 o1 模型,支持图像输入,比 o1-preview 思考时间更短,但响应更快。同时推出 ChatGPT Pro 订阅,每月 200 美元,不限制使用次数,包括 o1、o1-mini、语音模式等,并提供更智能的 o1 使用模式。",
    "link": "https://chatgpt.com/"
  },
  {
    "date": "2024-12-10",
    "title": "Sora 开放使用",
    "category": "MODEL_RELEASE",
    "description": "OpenAI 的 Sora 模型正式开放使用,支持文本转视频、图像转视频、视频转视频等多种功能。",
    "link": "https://sora.com/"
  },
  {
    "date": "2024-12-13",
    "title": "ChatGPT 高级视频模式开放使用",
    "category": "MODEL_RELEASE",
    "description": "OpenAI 发布高级视频模式",
    "link": "https://chatgpt.com/"
  },
  {
    "date": "2024-12-11",
    "title": "Gemini 2.0",
    "category": "MODEL_RELEASE",
    "description": "Google 宣布了他们的 Gemini 2.0 模型",
    "link": "https://blog.google/products/gemini/google-gemini-ai-collection-2024/"
  },
  {
    "date": "2024-12-16",
    "title": "Veo 2",
    "category": "MODEL_RELEASE",
    "description": "Google 推出了 Veo 2,这是一款视频生成模型,其连贯性比以前的模型有了惊人的飞跃。",
    "link": "https://deepmind.google/technologies/veo/veo-2/"
  },
  {
    "date": "2024-12-20",
    "title": "o3 evals",
    "category": "RESEARCH",
790
    "description": "在“OpenAI 的 12 天直播日”的第 12 天,OpenAI 发布了 o3 的基准测试结果,震惊了世界。 该模型在 ARC-AGI 基准测试中取得了 87.5% 的突破性分数,表明 AGI 可能比许多怀疑论者认为的更近。",
791 792 793 794 795 796 797 798 799 800 801 802 803 804 805 806
    "link": "https://openai.com/12-days/"
  },
  {
    "date": "2024-12-25",
    "title": "QVQ-72B-Preview",
    "category": ["MODEL_RELEASE", "OPEN_SOURCE"],
    "description": "阿里千问团队发布 QVQ-72B-Preview,一个基于 Qwen2-VL-72B 构建的开源多模态推理模型。QVQ 在人工智能的视觉理解和复杂问题解决能力方面实现了重大突破。",
    "link": "https://qwenlm.github.io/zh/blog/qvq-72b-preview/"
  },
  {
    "date": "2024-12-26",
    "title": "DeepSeek v3",
    "category": ["MODEL_RELEASE", "OPEN_SOURCE"],
    "description": "中国实验室 DeepSeek 发布了 DeepSeek v3,这是一款 6710 亿参数的开源模型,该模型以惊人的低成本表现出强大的性能,令人震惊。",
    "link": "https://arxiv.org/abs/2412.19437"
  },
807 808 809 810 811 812 813
  {
    "date": "2025-01-13",
    "title": "Codestral 25.01",
    "category": "MODEL_RELEASE",
    "description": "Mistral 发布了 Codestral 25.01,Codestral 25.01 具有比原版更高效的架构和改进的标记器,生成和完成代码的速度提高了约 2 倍。该模型现在是其重量级编码的明显领导者,并且是 FIM 用例的 SOTA。",
    "link": "https://mistral.ai/news/codestral-2501"
  },
814 815 816 817 818 819 820
  {
    "date": "2025-01-20",
    "title": "DeepSeek R1",
    "category": ["MODEL_RELEASE", "OPEN_SOURCE"],
    "description": "DeepSeek 发布并开源了 R1,他们的推理模型显示出与最先进的西方模型相比具有竞争力的性能。",
    "link": "https://api-docs.deepseek.com/news/news250120"
  },
821 822 823 824 825 826 827
  {
    "date": "2025-01-20",
    "title": "豆包实时语音大模型",
    "category": "MODEL_RELEASE",
    "description": "豆包发布实时语音大模型,使用原生方法深度融合语音与文本模态,模型具备超低延时、真人级别的语音表现、多模态I/O、多种能力涌现。",
    "link": "https://team.doubao.com/zh/special/realtime_voice"
  },
828 829 830 831 832 833 834
  {
    "date": "2025-01-21",
    "title": "Stargate Project",
    "category": "BUSINESS",
    "description": "唐纳德·特朗普宣布了星际之门项目,这是一项由软银、OpenAI、甲骨文和 MGX 之间建立的价值 500 亿美元的私人合作伙伴关系,用于在美国开发数据中心。",
    "link": "https://openai.com/index/announcing-the-stargate-project/"
  },
835 836 837 838 839 840 841
  {
    "date": "2025-01-22",
    "title": "Doubao-1.5-pro",
    "category": "MODEL_RELEASE",
    "description": "Doubao 发布了 Doubao-1.5-pro,模型使用 MoE 架构,并通过训练-推理一体化设计,探索模型性能和推理性能之间的极致平衡。Doubao-1.5-pro 仅用较小激活参数,即可超过一流超大稠密预训练模型的性能,并在多个评测基准上取得优异成绩。",
    "link": "https://team.doubao.com/zh/special/doubao_1_5_pro"
  },
842 843 844 845 846 847 848 849 850
  {
    "date": "2025-01-23",
    "title": "Operator",
    "category": "MODEL_RELEASE",
    "description": "OpenAI 推出了 Operator,一种可以自主使用计算机的 AI Agent。",
    "link": "https://openai.com/index/introducing-operator/"
  },
  {
    "date": "2025-01-27",
851
    "title": "DeepSeek 火爆全球",
852 853 854 855 856 857 858 859 860 861 862 863 864 865 866 867 868 869 870 871 872 873 874 875 876
    "category": "CULTURE",
    "description": "R1 模型发布一周后,西方国家对 DeepSeek 产生了巨大的恐慌。芯片股一夜暴跌,DeepSeek 应用程序升至 App Store 排名第一。几天之内,这个鲜为人知的中国通用人工智能实验室就在美国家喻户晓。",
    "link": "https://nymag.com/intelligencer/article/deepseek-r1-ai-panic-impact-commentary-analysis.html"
  },
  {
    "date": "2025-01-27",
    "title": "Qwen2.5-1M",
    "category": ["MODEL_RELEASE", "OPEN_SOURCE"],
    "description": "阿里千问团队发布 Qwen2.5-7B-Instruct-1M 和 Qwen2.5-14B-Instruct-1M,这是 Qwen 首次将开源 Qwen 模型的上下文扩展到 1M 长度。",
    "link": "https://qwenlm.github.io/zh/blog/qwen2.5-1m/"
  },
  {
    "date": "2025-01-28",
    "title": "Qwen2.5-Max",
    "category": ["MODEL_RELEASE", "OPEN_SOURCE"],
    "description": "阿里千问团队发布 Qwen2.5-Max,这是一个大型 MoE,使用海量数据进行预训练,并使用精选的 SFT 和 RLHF 配方进行后训练。它与顶级模型相比具有竞争力,并且在 Arena Hard、LiveBench、LiveCodeBench、GPQA-Diamond 等基准测试中胜过 DeepSeek V3。",
    "link": "https://qwenlm.github.io/zh/blog/qwen2.5-max/"
  },
  {
    "date": "2025-01-28",
    "title": "Qwen2.5-VL",
    "category": ["MODEL_RELEASE", "OPEN_SOURCE"],
    "description": "阿里千问团队发布 Qwen2.5-VL,这是 Qwen 最新的旗舰视觉语言模型。主要特点:视觉理解、代理能力、长视频理解、精确定位、结构化数据输出",
    "link": "https://qwenlm.github.io/zh/blog/qwen2.5-vl/"
  },
877 878 879 880 881 882 883
  {
    "date": "2025-01-30",
    "title": "Mistral Small 3",
    "category": ["MODEL_RELEASE", "OPEN_SOURCE"],
    "description": "Mistral 发布了 Mistral Small 3,Mistral Small 3 与 Llama 3.3 70B 或 Qwen 32B 等大型模型相媲美,是 GPT4o-mini 等不透明专有模型的绝佳开放式替代品。Mistral Small 3 与 Llama 3.3 70B instruct 相当,但在相同硬件上速度却快 3 倍以上。",
    "link": "https://mistral.ai/news/mistral-small-3"
  }, 
884 885 886 887 888 889 890 891 892 893 894 895 896 897
  {
    "date": "2025-01-31",
    "title": "o3-mini",
    "category": "MODEL_RELEASE",
    "description": "OpenAI 发布了 o3-mini,这是一款针对 STEM 推理进行了优化的模型。在中等推理强度下,o3-mini 在数学、编程和科学方面的表现与 o1 持平,同时响应速度更快。",
    "link": "https://openai.com/index/introducing-o3-mini/"
  },
  {
    "date": "2025-02-02",
    "title": "Deep Research",
    "category": "MODEL_RELEASE",
    "description": "OpenAI 推出了一款名为 Deep Research 的AI Agent,它可以通过重复的网络搜索来撰写 10 页的研究报告。",
    "link": "https://openai.com/index/introducing-deep-research/"
  },
898 899 900 901 902 903 904
  {
    "date": "2025-02-17",
    "title": "Mistral Saba",
    "category": "MODEL_RELEASE",
    "description": "Mistral 发布了 Mistral Saba,一个 24B 参数模型,基于来自中东和南亚各地精心策划的数据集进行训练。与超过其 ​​5 倍大小的模型相比,该模型提供了更准确、更相关的响应,同时速度更快、成本更低。",
    "link": "https://mistral.ai/news/mistral-saba"
  },
905 906 907 908 909 910 911 912 913 914 915 916 917 918 919 920 921 922 923 924 925 926 927 928 929 930 931 932 933 934 935 936 937 938 939 940 941 942 943 944 945 946 947 948 949 950 951 952 953
  {
    "date": "2025-02-18",
    "title": "Thinking Machines Lab",
    "category": "BUSINESS",
    "description": "包括 Mira Murati 和 John Schulman 在内的前 OpenAI 关键人物创立了 Thinking Machines Lab,这是一家专注于人机协作、个性化和开放科学的新型人工智能实验室。",
    "link": "https://x.com/thinkymachines/status/1891919141151572094"
  },
  {
    "date": "2025-02-19",
    "title": "Grok 3",
    "category": "MODEL_RELEASE",
    "description": "xAI 发布了 Grok 3,这是一种具有扩展推理和深度搜索功能的最先进模型。这一发布给许多人留下了深刻的印象,表明 xAI 是构建 AGI 竞赛中的有力竞争者。",
    "link": "https://x.ai/blog/grok-3"
  },
  {
    "date": "2025-02-24",
    "title": "Claude 3.7 Sonnet",
    "category": "MODEL_RELEASE",
    "description": "Anthropic 发布了 Claude 3.7 Sonnet,这是他们的第一个模型,具有扩展的思维能力和改进的数学和代码基准性能。为了好玩,他们还展示了其在口袋妖怪视频游戏中取得进展的非发行能力。此外,他们还发布了 Claude Code,一个强大的代理编码工具。",
    "link": "https://www.anthropic.com/news/claude-3-7-sonnet"
  },
  {
    "date": "2025-02-24",
    "title": "DeepSeek 开源周",
    "category": "OPEN_SOURCE",
    "description": "DeepSeek 于 2025 年 2 月 24 日至 28 日举办为期 5 天的开源周活动,届时将开源 5 个仓库:FlashMLA、DeepEP、DeepGEMM、DualPipe、EPLB 和 Profile-data、3FS 和 smallpond。这些开源的 5 个仓库构成他们在线服务的基础模块,都经过了详细的文档记录、部署和生产环境的严格测试。",
    "link": "https://github.com/deepseek-ai/FlashMLA"
  },
  {
    "date": "2025-02-27",
    "title": "GPT-4.5",
    "category": "MODEL_RELEASE",
    "description": "OpenAI 发布了 GPT-4.5,这是他们最大的预训练模型和最后一个非推理模型。尽管在基准测试中没有表现出巨大的进步,但该模型因其“氛围”和更人性化的反应而受到吹捧。",
    "link": "https://openai.com/index/introducing-gpt-4-5/"
  },
  {
    "date": "2025-03-05",
    "title": "Manus",
    "category": "BUSINESS",
    "description": "一家中国公司推出了一款名为 Manus 的 LLM 代理,在 GAIA 等基准测试中表现出 SOTA 性能。这款代理在西方迅速走红,部分原因是人们对中国人工智能的担忧。",
    "link": "https://x.com/ManusAI_HQ/status/1897294098945728752"
  },
  {
    "date": "2025-03-05",
    "title": "QWQ-32B",
    "category": ["MODEL_RELEASE", "OPEN_SOURCE"],
    "description": "阿里千问团队发布 QwQ-32B,这是 Qwen 最新的推理模型,它只有 320 亿个参数,可以与 DeepSeek-R1 等尖端推理模型相媲美。",
    "link": "https://qwenlm.github.io/zh/blog/qwq-32b/"
  },
954 955 956 957 958 959 960 961 962 963 964 965 966 967
  {
    "date": "2025-03-06",
    "title": "Mistral OCR",
    "category": ["MODEL_RELEASE"],
    "description": "Mistral 发布了 Mistral OCR,这是世界上最好的文档理解 API。",
    "link": "https://mistral.ai/news/mistral-ocr"
  },
  {
    "date": "2025-03-11",
    "title": "Seedream 2.0",
    "category": "MODEL_RELEASE",
    "description": "豆包发布 Seedream 2.0,一个原生、多维度的中英双语图像生成基础模型,可以完美处理中英文文本提示,支持双语图像生成与文本渲染。",
    "link": "https://team.doubao.com/zh/tech/seedream"
  },
968 969 970 971 972 973 974
  {
    "date": "2025-03-12",
    "title": "Gemma 3",
    "category": ["MODEL_RELEASE", "OPEN_SOURCE"],
    "description": "Google 发布 Gemma 3,这是一组轻量级、最先进的开放模型,采用与 Gemini 2.0 模型相同的研究和技术构建而成。它们旨在直接在设备(从手机、笔记本电脑到工作站)上快速运行,Gemma 3 有多种尺寸(1B、4B、12B 和 27B),可让您根据特定的硬件和性能需求选择最佳模型。",
    "link": "https://blog.google/technology/developers/gemma-3/?hl=zh-cn"
  },
975 976 977 978 979 980 981
  {
    "date": "2025-03-17",
    "title": "Mistral Small 3.1",
    "category": ["MODEL_RELEASE", "OPEN_SOURCE"],
    "description": "Mistral 发布了 Mistral Small 3.1,该新模型以 Mistral Small 3 为基础,具有改进的文本性能、多模式理解和高达 128k 个标记的扩展上下文窗口。该模型的表现优于 Gemma 3 和 GPT-4o Mini 等同类模型,同时提供每秒 150 个标记的推理速度。",
    "link": "https://mistral.ai/news/mistral-small-3-1"
  },
982 983 984 985 986 987 988 989 990 991 992 993 994 995 996 997 998 999 1000 1001 1002 1003 1004 1005 1006 1007 1008 1009
  {
    "date": "2025-03-24",
    "title": "DeepSeek-V3-0324",
    "category": ["MODEL_RELEASE", "OPEN_SOURCE"],
    "description": "DeepSeek 发布了 DeepSeek-V3-0324 模型,该模型在推理能力、Web前端开发能力、中文写作能力、中文搜索能力以及 Function Calling 能力方面都有显著提升。",
    "link": "https://huggingface.co/deepseek-ai/DeepSeek-V3-0324/tree/main"
  },
  {
    "date": "2025-03-24",
    "title": "Qwen2.5-VL-32B-Instruct",
    "category": ["MODEL_RELEASE", "OPEN_SOURCE"],
    "description": "阿里千问团队发布 Qwen2.5-VL-32B-Instruct。相比此前发布的 Qwen2.5-VL 系列模型,本次推出的 32B 模型的特点如下:回复更符合人类主观偏好、数学推理能力、图像细粒度理解与推理",
    "link": "https://qwenlm.github.io/zh/blog/qwen2.5-vl-32b/"
  },
  {
    "date": "2025-03-25",
    "title": "Gemini 2.5 Pro",
    "category": "MODEL_RELEASE",
    "description": "谷歌发布了 Gemini 2.5 Pro,这是该公司迄今为止功能最强大的型号,在许多常见的基准测试中名列前茅。",
    "link": "https://blog.google/technology/google-deepmind/gemini-model-thinking-updates-march-2025/"
  },
  {
    "date": "2025-03-25",
    "title": "GPT-4o 原生图像生成",
    "category": "MODEL_RELEASE",
    "description": "OpenAI 发布 GPT-4o 原生图像生成功能,进一步推动图像生成的前沿。因此,推特上充斥着吉卜力工作室风格的图像。",
    "link": "https://openai.com/index/introducing-4o-image-generation/"
  },
1010 1011
  {
    "date": "2025-03-26",
1012
    "title": "GPT-4o 原生图像生成因吉卜力画风火爆全球",
1013 1014 1015 1016
    "category": "CULTURE",
    "description": "OpenAI 发布 GPT-4o 原生图像生成功能,在推特上造成了病毒是的传播,一小时内 ChatGPT 新增 100 万用户。堪比上一波 DeepSeek 的火爆程度。",
    "link": "https://x.com/fun000001/status/1906892391656865812"
  },
1017 1018 1019 1020 1021 1022 1023 1024 1025 1026 1027 1028 1029
  {
    "date": "2025-03-27",
    "title": "Qwen2.5-Omni-7B",
    "category": ["MODEL_RELEASE", "OPEN_SOURCE"],
    "description": "阿里千问团队发布 Qwen2.5-Omni-7B,这是一个全能模型:一个模型可以理解文本、音频、图像、视频,并输出文本和音频。",
    "link": "https://qwenlm.github.io/zh/blog/qwen2.5-omni//"
  },
  {
    "date": "2025-03-31",
    "title": "AutoGLM 沉思",
    "category": "MODEL_RELEASE",
    "description": "智谱推出一款名为 AutoGLM 的 AI Agent,类似于 OpenAI 的 DeepResearch。AutoGLM 沉思是一个能探究开放式问题,并根据结果执行操作的自主智能体(AI Agent)。",
    "link": "https://autoglm-research.zhipuai.cn/"
1030 1031 1032 1033 1034 1035 1036
  },
  {
    "date": "2025-04-05",
    "title": "Llama 4",
    "category": ["MODEL_RELEASE", "OPEN_SOURCE"],
    "description": "Meta 发布了 Llama 4,这是该公司迄今为止功能最强大的型号,该系列的核心是 Llama 4 Scout 和 Llama 4 Maverick 两款开放权重的模型,它们首次采用了 专家混合 (MoE) 架构,并具备处理文本、图像和视频的原生多模态能力,同时支持 100M 超长上下文窗口。",
    "link": "https://ai.meta.com/blog/llama-4-multimodal-intelligence/"
1037 1038 1039 1040 1041 1042 1043 1044 1045 1046 1047 1048 1049 1050
  },
  {
    "date": "2025-04-09",
    "title": "A2A 协议",
    "category": "RESEARCH",
    "description": "Agent2Agent 协议(A2A)是 Google Cloud 及其众多技术与服务合作伙伴联合推出的一项开放协议,旨在推动 AI 代理(AI agents)之间的互操作性。A2A 协议允许不同厂商和框架构建的 AI 代理在企业应用和平台之间安全地交流、协作和协调任务,从而提升自动化水平和生产效率,降低长期成本。A2A 的设计目标是建立一个开放、标准化的多代理生态系统,支持跨平台、跨云的协同工作,加速企业流程创新和智能化转型。",
    "link": "https://developers.googleblog.com/en/a2a-a-new-era-of-agent-interoperability/"
  },
  {
    "date": "2025-04-15",
    "title": "GPT-4.1",
    "category": "MODEL_RELEASE",
    "description": "OpenAI 推出了全新系列的 GPT-4.1 模型,包括 GPT‑4.1、GPT‑4.1 mini 和 GPT‑4.1 nano,这些模型在编码、指令遵循和长上下文处理方面实现了重大突破。与之前的 GPT‑4o 系列相比,GPT‑4.1 全面提升了性能,并降低了成本和延迟,特别适合开发者在实际应用中构建更强大的智能系统和代理型应用。新模型还首次支持高达 1 百万 tokens 的超长上下文窗口,并在多项行业标准基准测试中刷新记录。GPT‑4.1 系列仅通过 API 提供,GPT‑4.5 Preview 将于 2025 年 7 月 14 日下线。",
    "link": "https://openai.com/index/gpt-4-1/"
1051 1052 1053 1054 1055 1056 1057
  },
  {
    "date": "2025-04-17",
    "title": "o3 和 o4-mini",
    "category": "MODEL_RELEASE",
    "description": "OpenAI 推出了其 o 系列中迄今为止最智能、能力最强的模型——o3 和 o4-mini。这两款模型被训练用于更深度的推理(“思考更长时间”),显著提升了 ChatGPT 的能力。模型首次能够自主地(agentically)决定何时以及如何使用 ChatGPT 内的所有工具(网络搜索、代码执行、视觉分析、图像生成等)来解决复杂问题。",
    "link": "https://openai.com/index/introducing-o3-and-o4-mini/"
1058
  },
1059 1060 1061 1062 1063 1064 1065
  {
    "date": "2025-04-17",
    "title": "豆包 1.5 深度思考模型",
    "category": "MODEL_RELEASE",
    "description": "豆包 1.5 深度思考模型发布:暴砍参数量,能看图思考,数学编程超DeepSeek-R1",
    "link": "https://36kr.com/p/3253930654478340"
  },
1066 1067 1068 1069 1070 1071
  {
    "date": "2025-04-18",
    "title": "Gemini 2.5 Flash Preview 04-17",
    "category": "MODEL_RELEASE",
    "description": "Gemini 2.5 Flash 是 Google 首款完全混合推理模型,引入了可控的“思考”(thinking)过程。模型在生成响应前可以执行“思考”过程,以更好地理解提示、分解复杂任务和规划回答,尤其适用于需要多步推理的复杂问题(如数学、分析)。",
    "link": "https://developers.googleblog.com/zh-hans/start-building-with-gemini-25-flash/"
1072 1073 1074 1075 1076 1077 1078 1079 1080 1081 1082 1083 1084 1085
  },
  {
    "date": "2025-04-29",
    "title": "Qwen3",
    "category": ["MODEL_RELEASE", "OPEN_SOURCE"],
    "description": "Qwen3 是一个性能强大的大型语言模型系列,包含多种规模的模型,旨在提供顶尖的性能和广泛的应用能力。其旗舰模型 Qwen3-235B-A22B 在多项基准测试中表现出色,可与业界顶级模型媲美,同时较小模型也实现了显著的性能提升。该系列引入了创新的双思考模式、广泛的多语言支持和增强的 Agent 能力。通过开源部分模型(包括两个 MoE 模型和六个 Dense 模型)。包括旗舰模型 Qwen3-235B-A22B (235B+ 总参数, 22B+ 激活参数) 和小型 MoE 模型 Qwen3-30B-A3B (约 30B 总参数, 3B 激活参数) 以及六个 Dense 模型 (Qwen3-32B 至 Qwen3-0.6B),均采用 Apache 2.0 许可。",
    "link": "https://qwenlm.github.io/zh/blog/qwen3/"
  },
  {
    "date": "2025-04-30",
    "title": "DeepSeek-Prover-V2",
    "category": ["MODEL_RELEASE", "OPEN_SOURCE"],
    "description": "DeepSeek 推出了 DeepSeek-Prover-V2,一个用于 Lean 4 形式化定理证明的开源大语言模型。模型训练始于一个“冷启动”阶段,利用 DeepSeek-V3 通过递归证明流程生成初始数据,整合了非形式化推理(如思路链)和形式化证明步骤。随后通过强化学习进一步提升性能。DeepSeek-Prover-V2 在神经定理证明领域达到 SOTA 水平,特别是在 MiniF2F-test 上实现了 88.9 % 的通过率,并解决了 PutnamBench 中的 49 个问题。发布了两个尺寸的模型: 7B 和 671B 参数,可通过 Hugging Face Transformers 使用。",
    "link": "https://huggingface.co/deepseek-ai/DeepSeek-Prover-V2-671B"
1086 1087
  }
]