AI快讯-openAI维基百科

月之暗面发布MoBA注意力机制技术解析：长文本处理效率革新

月之暗面最新论文提出MoBA注意力机制，通过动态块稀疏注意力与混合专家技术结合，显著提升长文本处理效率。实验显示，该架构在保持性能的同时，计算速度提升6.5倍，支持百万级上下文处理。本文深度解析其技术原理、实验表现及行业影响，为AI模型优化提供新思路。

PhiltreX

AI快讯 13小时前

00012

医疗AI好伴AI实测报告发布

智诊科技推出医疗AI应用好伴AI，实测解读体检报告准确率100%，复刻三甲专家诊疗逻辑。730亿参数模型WiseDiag-Z1支持多模态推理，实现症状分析、用药咨询与健康追踪，破解医疗资源分布不均难题。

PhiltreX

AI快讯 18小时前

00011

视觉推理能力评测新基准发布

港中文MMLab推出MME-CoT基准，全面测评DeepSeek-R1、GPT-4o、Kimi k1.5等模型的视觉推理能力。研究显示，Kimi在推理质量领先，o3-mini鲁棒性最佳，DeepSeek文本推理优势显著。揭秘评测指标与关键发现。

PhiltreX

AI快讯 18小时前

0009

开源RL训练方法复刻DeepSeek性能

阶跃星辰与清华联合发布Open Reasoner Zero（ORZ），仅用1/30训练步骤复现DeepSeek-R1-Zero性能，680步现“顿悟时刻”。研究团队开源完整训练代码与数据，验证极简PPO+规则奖励方案有效性，MMLU基准超越Qwen2.5 Instruct。

PhiltreX

AI快讯 19小时前

00016

商汤AI工具革新办公与开发流程

商汤科技在GDC大会推出办公小浣熊2.0，支持截图生成HTML代码，代码小浣熊2.0实现多维数据融合。全新LazyLLM框架降低多Agent开发门槛，万象平台整合模型管理，推动AI办公效率跃升。

PhiltreX

AI快讯 19小时前

00013

低精度计算驱动AI效率革命

谷歌首席科学家Jeff Dean与Transformer作者Noam Shazeer深度探讨AI技术演进，揭秘低精度量化如何实现模型速度提升三倍，并预言未来AI可处理万亿级Token数据、创造“1000万倍工程师”生产力。

PhiltreX

AI快讯 21小时前

00011

低成本AI训练突破：3B模型推理能力跃升

荷兰开发者以不到10美元成本，通过轻量级强化学习算法Reinforce-Lite在3B模型上复现DeepSeek的推理突破。微软亚研院最新研究则表明，7B模型通过RL训练可自主发展反思、验证等高级技能，但“顿悟时刻”或为伪命题。本文解析技术细节与行业启示。

PhiltreX

AI快讯 21小时前

00012

阿里全面转型AI公司：云业务三位数增长重构估值逻辑

阿里巴巴2025财年第三季度财报显示，云智能业务收入同比增长13%，AI产品连续六季三位数增长，推动美股、港股股价单日最高涨超14%。管理层宣布未来三年将加码AI基建与模型研发，目标通过AGI技术重构全球50%的GDP价值链。本文深度解析阿里AI战略布局及电商、国际业务等板块表现，揭示其从零售巨头向AI领军者的转型路径。

PhiltreX

AI快讯 1天前

00015

【开源核弹】DeepSeek祭出五大杀器直指OpenAI

中国AI黑马DeepSeek官宣5天连发顶级代码库！直面OpenAI的GPT-4.5终极对决，揭秘全球首个经千万级用户验证的开源架构如何重构AI技术版图。

PhiltreX

AI快讯 1天前

00014

【AI测评惊天黑幕】Grok-3陷64次试错争议

OpenAI实名举报Grok-3基准测试作弊！64次试错VS单次作答，马斯克团队被指误导性对比。深度解析AI测评潜规则，揭秘大模型竞技场不为人知的”数据化妆术”。

PhiltreX

AI快讯 1天前

00012