10月21日,中文精确指令遵循测评基准superclue-cpif正式上线,文心x1.1以75.51分位列国产大模型榜首,在任务类型与指令数量两大维度的评估中均居国内首位,展现出其在真实生产场景中的突出应用潜力。
此次测评共纳入包括GPT-5(high)、DeepSeek-V3.2-Exp-Thinking、Claude-Sonnet-4.5-Reasoning、Gemini-2.5-Pro在内的10款国内外主流大模型。SuperCLUE-CPIF聚焦于大型语言模型(L...
微软正通过 Edge 浏览器推行一项新举措,旨在推动用户更多地使用其自主研发的 AI 工具 Copilot。当用户在 Edge 中浏览诸如 ChatGPT、DeepSeek 或 Perplexity 等主流 AI 平台时,浏览器地址栏右侧会自动出现一个提示标签,建议用户切换至微软的 Copilot 服务。
只需轻点该提示,Copilot 即可在当前页面以侧边栏的形式展开,支持用户直接提问或上传文档进行交互。值得注意的是,这项提示功能目前仅针对特定竞品平台启用——例如...
美国初创企业Vercel的CEO吉列尔莫近日发布动态称,在公司内部智能体开展的真实环境基准测试中,中国开源模型Kimi K2展现出惊人性能,相较GPT-5、Claude Sonnet4.5等顶尖闭源模型,运行速度快达5倍,准确率提升超过50%。更关键的是,依托其运行平台,用户可实现零成本的模型切换。
根据吉列尔莫公布的测试数据,Kimi K2完成指定任务仅需2分钟,而GPT-5与Sonnet4.5则耗时8至10分钟,效率差距显著。
在准确性方面,Kimi K2的表...
阿里通义 qwen 团队最新宣布,qwen3-vl 系列迎来重磅升级,新增 2b 与 32b 两款密集型(dense)模型,实现从轻量级到高性能级的全面布局,全方位覆盖各类视觉语言理解应用场景。
此次发布的两个版本各具特色,满足多样化需求:
Instruct 版本:响应迅捷、运行稳定,专为高效对话交互与工具调用场景优化;
Thinking 版本:强化复杂推理与深度视觉理解能力,具备“看图思考”特性,轻松应对高难度任务挑战。
官方指出,Qwen3-VL-32B...
anthropic 宣布 claude 桌面客户端正式发布稳定版(此前为预览版本),现已面向 windows 与 mac 用户全面上线。
Mac 版本此次带来了多项实用新特性:
全局快捷唤起:双击 Option 键即可在任意应用界面快速唤醒 Claude,无论是编写代码还是浏览文档都能即时互动;
屏幕内容共享:支持直接截图或共享当前应用窗口内容给 Claude,免去频繁拖拽文件的麻烦;
语音输入支持:按下 Caps Lock 键即可开始语音输入,边说边思考...
智谱正式发布 glm coding plan 企业版,依托行业领先的 glm-4.6 模型,致力于以更安全、高效且低成本的方式,为全球企业提供全方位的智能编程支持,助力企业加速迈向智能化升级。
据悉,GLM Coding Plan 企业版集成了多模态理解(图像/视频)、联网搜索(MCP)以及智能流程编排等核心能力,为企业开发团队打造从代码生成到全流程协作的一体化解决方案。
该版本以卓越性能与安全保障为核心亮点,具备三大核心优势:
高配额、低投入:相比 Claud...
据公开报道,国内大模型初创企业月之暗面(moonshot ai)或将迎来新一轮数亿美元级别的融资,引发业界广泛关注。截至目前,该公司尚未对此消息作出回应。
这家曾被誉为“中国最值得期待的大模型创业公司”之一的企业,在过去一段时间内相对低调。回顾此前融资记录,月之暗面最近一次公开融资发生在2024年8月,融资额约为3亿美元。随着今年年初 DeepSeek 的迅速崛起,Kimi 一度淡出大众视野。然而今年7月,其推出全新升级的 Kimi k2 模型,迅速重返舆论焦点。...
anthropic 宣布推出 claude for excel,旨在进一步拓展其在金融服务领域的应用。此更新使得 claude 能够作为金融专业人士的 ai 助手,尤其是那些使用 microsoft 工具的用户。claude for excel 目前处于研究预览的测试阶段,用户可以通过 excel 侧边栏直接与 claude 进行互动。
通过这项新功能,Claude 能够读取、分析并修改工作簿,且每一次的更改都能得到清晰的追踪和解释。这项功能尤其适合帮助用户调试公式、生...
在chatgpt atlas震撼全球之际,anthropic也低调推出了全新的桌面应用程式——claude desktop,正式支援mac与windows双平台,并引入三大创新功能:截图撷取、视窗分享以及caps lock键语音控制。这项升级使用户得以透过更直觉、自然的方式与人工智慧互动,实现无需手动输入的语音操作与即时画面解析,进一步深化ai在日常工作效率中的整合能力。
透过崭新的截图与视窗分享机制,使用者现在可直接将当前萤幕画面或正在开启的应用程式视窗传送至Cl...
11月1日,在gotc 全球开源技术峰会(gotc 2025)上,零一万物ceo李开复博士发表了题为《拥抱开源生态,共创ai agent颠覆式创新》的主题演讲,深入探讨了智能体经济时代背后的变革动力。他指出,ai agent将引领企业迈向以结果为核心的全新商业模式,而开源模型正是构建ai agent的最佳路径,同时也为全球开发者社区带来了前所未有的技术创新机遇。
零一万物CEO李开复博士
峰会上,零一万物携手开源中国共同推出专为开发者打造的AI Agent一站式开...