Commit 2951571d authored by fisherdaddy's avatar fisherdaddy

feat: add new AI model releases for Qwen3 and DeepSeek-Prover-V2, and update...

feat: add new AI model releases for Qwen3 and DeepSeek-Prover-V2, and update Claude features in release notes
parent 30bab8d2
......@@ -1069,5 +1069,19 @@
"category": "MODEL_RELEASE",
"description": "Gemini 2.5 Flash 是 Google 首款完全混合推理模型,引入了可控的“思考”(thinking)过程。模型在生成响应前可以执行“思考”过程,以更好地理解提示、分解复杂任务和规划回答,尤其适用于需要多步推理的复杂问题(如数学、分析)。",
"link": "https://developers.googleblog.com/zh-hans/start-building-with-gemini-25-flash/"
},
{
"date": "2025-04-29",
"title": "Qwen3",
"category": ["MODEL_RELEASE", "OPEN_SOURCE"],
"description": "Qwen3 是一个性能强大的大型语言模型系列,包含多种规模的模型,旨在提供顶尖的性能和广泛的应用能力。其旗舰模型 Qwen3-235B-A22B 在多项基准测试中表现出色,可与业界顶级模型媲美,同时较小模型也实现了显著的性能提升。该系列引入了创新的双思考模式、广泛的多语言支持和增强的 Agent 能力。通过开源部分模型(包括两个 MoE 模型和六个 Dense 模型)。包括旗舰模型 Qwen3-235B-A22B (235B+ 总参数, 22B+ 激活参数) 和小型 MoE 模型 Qwen3-30B-A3B (约 30B 总参数, 3B 激活参数) 以及六个 Dense 模型 (Qwen3-32B 至 Qwen3-0.6B),均采用 Apache 2.0 许可。",
"link": "https://qwenlm.github.io/zh/blog/qwen3/"
},
{
"date": "2025-04-30",
"title": "DeepSeek-Prover-V2",
"category": ["MODEL_RELEASE", "OPEN_SOURCE"],
"description": "DeepSeek 推出了 DeepSeek-Prover-V2,一个用于 Lean 4 形式化定理证明的开源大语言模型。模型训练始于一个“冷启动”阶段,利用 DeepSeek-V3 通过递归证明流程生成初始数据,整合了非形式化推理(如思路链)和形式化证明步骤。随后通过强化学习进一步提升性能。DeepSeek-Prover-V2 在神经定理证明领域达到 SOTA 水平,特别是在 MiniF2F-test 上实现了 88.9 % 的通过率,并解决了 PutnamBench 中的 49 个问题。发布了两个尺寸的模型: 7B 和 671B 参数,可通过 Hugging Face Transformers 使用。",
"link": "https://huggingface.co/deepseek-ai/DeepSeek-Prover-V2-671B"
}
]
\ No newline at end of file
......@@ -85,8 +85,14 @@
},
{
"date": "2025年2月25日",
"title": "Cloud 3.7 sonnet 和 Claude Code 发布",
"title": "Claude 3.7 sonnet 和 Claude Code 发布",
"feature": "Claude 3.7 Sonnet 既是普通 LLM 又是推理模型。在标准模式下,它是 Claude 3.5 Sonnet 的升级版;在扩展思考模式下,它会在回答前进行自我反思,从而提高其在数学、物理、指令跟随、编码和许多其他任务上的性能。",
"description": "与 Claude 3.7 Sonnet 模型一同发布的还有 Claude Code ,这是一个用于 agentic coding 的命令行工具,目前以有限的研究预览版形式提供。 Claude Code 旨在让开发者能够直接从终端将大量的工程任务委托给 Claude 完成。"
},
{
"date": "2025年5月2日",
"title": "Claude 发布 Integrations 功能以连接外部应用和工具,以及 Research 功能以提供更深入的调查能力。",
"feature": "Claude 可以通过名为 Integrations 的新功能连接到用户的应用程序和工具,使其能够理解更广泛的工作背景并跨平台执行任务。推出了高级研究模式,可以进行更长时间(最长 45 分钟)、更深入的调查,并能搜索网页、 Google Workspace 以及新连接的 Integrations 。",
"description": "更新地址:https://www.anthropic.com/news/integrations"
}
]
\ No newline at end of file
......@@ -112,5 +112,11 @@
"title": "DeepSeek-V3-0324 模型发布",
"feature": "推理能力增强、Web前端开发能力优化、中文写作能力升级、中文搜索能力优化、Function Calling 能力改进",
"description": "HuggingFace地址:https://huggingface.co/deepseek-ai/DeepSeek-V3-0324/tree/main"
},
{
"date": "2025-04-30",
"title": "DeepSeek-Prover-V2",
"feature": "DeepSeek 推出了 DeepSeek-Prover-V2,一个用于 Lean 4 形式化定理证明的开源大语言模型。模型训练始于一个“冷启动”阶段,利用 DeepSeek-V3 通过递归证明流程生成初始数据,整合了非形式化推理(如思路链)和形式化证明步骤。随后通过强化学习进一步提升性能。DeepSeek-Prover-V2 在神经定理证明领域达到 SOTA 水平,特别是在 MiniF2F-test 上实现了 88.9 % 的通过率,并解决了 PutnamBench 中的 49 个问题。发布了两个尺寸的模型: 7B 和 671B 参数,可通过 Hugging Face Transformers 使用。",
"description": "HuggingFace地址:https://huggingface.co/deepseek-ai/DeepSeek-Prover-V2-671B"
}
]
\ No newline at end of file
......@@ -206,6 +206,12 @@
"inputPrice": 26.3,
"outputPrice": 105
},
{
"name": "GPT Image 1",
"logo": "/assets/icon/openai_small.svg",
"inputPrice": 35,
"outputPrice": 280
},
{
"name": "o3",
"logo": "/assets/icon/openai_small.svg",
......
......@@ -98,6 +98,12 @@
"inputPrice": 10,
"outputPrice": 30
},
{
"name": "GPT Image 1",
"logo": "/assets/icon/openai_small.svg",
"inputPrice": 5,
"outputPrice": 40
},
{
"name": "o3",
"logo": "/assets/icon/openai_small.svg",
......
Markdown is supported
0% or
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment