AI快讯相关文章列表 - openAI维基百科

阿里云Qwen团队正式发布推理模型QwQ，基于Qwen2.5-Max架构实现数学解析与代码生成能力跃升。该模型集成联网搜索、图像生成等10+工具链，支持跨模态内容创作，同步公布移动端适配计划及Apache 2.0开源协议，为开发者提供全栈式AI解决方案。

AI快讯 2025-02-25

0002.3K

DeepSeek开源周重磅推出通信库DeepEP，针对混合专家系统（MoE）实现GPU资源动态调控与跨域带宽优化。通过FP8压缩传输、非对称域转发等核心技术，训练等待时间缩减80%，推理延迟降低35%，为大规模语言模型及推荐系统提供行业级降本增效方案。

AI快讯 2025-02-25

0002.1K

字节跳动旗下AI助手豆包近期启动深度思考模型灰度测试，官方确认该功能采用自主研发技术架构。测试显示模型具备上下文记忆解析能力，通过特定语句可激活思维链展示，目前网页端已实现功能触发，移动端适配仍在推进中。本文解析测试细节与技术特性。

AI快讯 2025-02-25

0002.9K

月之暗面团队发布改进版Muon优化器，算力需求较传统AdamW降低48%，并在Llama及DeepSeek架构中验证其高效性。升级后的Muon不仅支持大规模分布式训练，还开源了16B参数的MoE模型Moonlight，显著提升多任务性能。技术突破为AI训练成本优化和模型泛化能力提供新路径。

AI快讯 2025-02-24

0002.3K

最新报告显示，美国超过三分之一大学生使用ChatGPT辅助学习，OpenAI用户数突破4亿。AI技能成为企业新宠，推动教育与职场迎来深刻变革，开创未来竞争新格局。

AI快讯 2025-02-24

0001.7K

Grok 3利用暴力计算和AI辅助验证，瞄准数学界最难题——黎曼猜想。顶尖科学家与人工智能联手攻关，或将迎来诺奖级别的突破，推动数学及密码学新发展。

AI快讯 2025-02-24

0002.0K

月之暗面最新论文提出MoBA注意力机制，通过动态块稀疏注意力与混合专家技术结合，显著提升长文本处理效率。实验显示，该架构在保持性能的同时，计算速度提升6.5倍，支持百万级上下文处理。本文深度解析其技术原理、实验表现及行业影响，为AI模型优化提供新思路。

AI快讯 2025-02-23

0002.0K

智诊科技推出医疗AI应用好伴AI，实测解读体检报告准确率100%，复刻三甲专家诊疗逻辑。730亿参数模型WiseDiag-Z1支持多模态推理，实现症状分析、用药咨询与健康追踪，破解医疗资源分布不均难题。

AI快讯 2025-02-22

0002.1K

港中文MMLab推出MME-CoT基准，全面测评DeepSeek-R1、GPT-4o、Kimi k1.5等模型的视觉推理能力。研究显示，Kimi在推理质量领先，o3-mini鲁棒性最佳，DeepSeek文本推理优势显著。揭秘评测指标与关键发现。

AI快讯 2025-02-22

0002.0K

阶跃星辰与清华联合发布Open Reasoner Zero（ORZ），仅用1/30训练步骤复现DeepSeek-R1-Zero性能，680步现“顿悟时刻”。研究团队开源完整训练代码与数据，验证极简PPO+规则奖励方案有效性，MMLU基准超越Qwen2.5 Instruct。

AI快讯 2025-02-22

0002.0K