

PhiltreX
-
月之暗面发布MoBA注意力机制技术解析:长文本处理效率革新
月之暗面最新论文提出MoBA注意力机制,通过动态块稀疏注意力与混合专家技术结合,显著提升长文本处理效率。实验显示,该架构在保持性能的同时,计算速度提升6.5倍,支持百万级上下文处理。本文深度解析其技术原理、实验表现及行业影响,为AI模型优化提供新思路。
-
浏览器自动化|browser-use|Web-UI
探索browser-use全新Web-UI界面,支持OpenAI、Anthropic等多模型API集成,简化浏览器自动化任务配置。附详细安装教程与配置文件说明,轻松实现跨平台操作!
-
浏览器自动化|browser-use
本文详细介绍开源Python库browser-use的功能与使用方法,涵盖跨浏览器支持、任务自动化、API设计及安装部署教程。通过实际代码示例,指导用户实现表单填写、数据抓取、自动化测试等场景,并集成Web-UI界面,提升浏览器操作效率。
-
医疗AI好伴AI实测报告发布
智诊科技推出医疗AI应用好伴AI,实测解读体检报告准确率100%,复刻三甲专家诊疗逻辑。730亿参数模型WiseDiag-Z1支持多模态推理,实现症状分析、用药咨询与健康追踪,破解医疗资源分布不均难题。
-
视觉推理能力评测新基准发布
港中文MMLab推出MME-CoT基准,全面测评DeepSeek-R1、GPT-4o、Kimi k1.5等模型的视觉推理能力。研究显示,Kimi在推理质量领先,o3-mini鲁棒性最佳,DeepSeek文本推理优势显著。揭秘评测指标与关键发现。
-
开源RL训练方法复刻DeepSeek性能
阶跃星辰与清华联合发布Open Reasoner Zero(ORZ),仅用1/30训练步骤复现DeepSeek-R1-Zero性能,680步现“顿悟时刻”。研究团队开源完整训练代码与数据,验证极简PPO+规则奖励方案有效性,MMLU基准超越Qwen2.5 Instruct。
-
商汤AI工具革新办公与开发流程
商汤科技在GDC大会推出办公小浣熊2.0,支持截图生成HTML代码,代码小浣熊2.0实现多维数据融合。全新LazyLLM框架降低多Agent开发门槛,万象平台整合模型管理,推动AI办公效率跃升。
-
IMA|零成本快速构建知识库
零成本构建知识库,集成DeepSeek与腾讯IMA智能笔记。
-
低精度计算驱动AI效率革命
谷歌首席科学家Jeff Dean与Transformer作者Noam Shazeer深度探讨AI技术演进,揭秘低精度量化如何实现模型速度提升三倍,并预言未来AI可处理万亿级Token数据、创造“1000万倍工程师”生产力。
-
低成本AI训练突破:3B模型推理能力跃升
荷兰开发者以不到10美元成本,通过轻量级强化学习算法Reinforce-Lite在3B模型上复现DeepSeek的推理突破。微软亚研院最新研究则表明,7B模型通过RL训练可自主发展反思、验证等高级技能,但“顿悟时刻”或为伪命题。本文解析技术细节与行业启示。