影视大全站

展开菜单

大模型谁最“可靠”?SuperCLUE-CPIF测评出炉,文心X1.1国内第一

大模型谁最“可靠”?SuperCLUE-CPIF测评出炉,文心X1.1国内第一
10月21日,中文精确指令遵循测评基准superclue-cpif正式上线,文心x1.1以75.51分位列国产大模型榜首,在任务类型与指令数量两大维度的评估中均居国内首位,展现出其在真实生产场景中的突出应用潜力。 此次测评共纳入包括GPT-5(high)、DeepSeek-V3.2-Exp-Thinking、Claude-Sonnet-4.5-Reasoning、Gemini-2.5-Pro在内的10款国内外主流大模型。SuperCLUE-CPIF聚焦于大型语言模型(L...

微软 Edge 新策略:在访问 AI 应用时推介 Copilot

微软 Edge 新策略:在访问 AI 应用时推介 Copilot
微软正通过 Edge 浏览器推行一项新举措,旨在推动用户更多地使用其自主研发的 AI 工具 Copilot。当用户在 Edge 中浏览诸如 ChatGPT、DeepSeek 或 Perplexity 等主流 AI 平台时,浏览器地址栏右侧会自动出现一个提示标签,建议用户切换至微软的 Copilot 服务。 只需轻点该提示,Copilot 即可在当前页面以侧边栏的形式展开,支持用户直接提问或上传文档进行交互。值得注意的是,这项提示功能目前仅针对特定竞品平台启用——例如...

Vercel CEO:Kimi K2 在智能体场景比 GPT-5 准确率高 50%

Vercel CEO:Kimi K2 在智能体场景比 GPT-5 准确率高 50%
美国初创企业Vercel的CEO吉列尔莫近日发布动态称,在公司内部智能体开展的真实环境基准测试中,中国开源模型Kimi K2展现出惊人性能,相较GPT-5、Claude Sonnet4.5等顶尖闭源模型,运行速度快达5倍,准确率提升超过50%。更关键的是,依托其运行平台,用户可实现零成本的模型切换。 根据吉列尔莫公布的测试数据,Kimi K2完成指定任务仅需2分钟,而GPT-5与Sonnet4.5则耗时8至10分钟,效率差距显著。 在准确性方面,Kimi K2的表...

Qwen3-VL 家族新增 2B 与 32B 模型

Qwen3-VL 家族新增 2B 与 32B 模型
阿里通义 qwen 团队最新宣布,qwen3-vl 系列迎来重磅升级,新增 2b 与 32b 两款密集型(dense)模型,实现从轻量级到高性能级的全面布局,全方位覆盖各类视觉语言理解应用场景。 此次发布的两个版本各具特色,满足多样化需求: Instruct 版本:响应迅捷、运行稳定,专为高效对话交互与工具调用场景优化; Thinking 版本:强化复杂推理与深度视觉理解能力,具备“看图思考”特性,轻松应对高难度任务挑战。 官方指出,Qwen3-VL-32B...

Anthropic 正式发布 Claude 桌面客户端,支持 macOS 和 Windows

Anthropic 正式发布 Claude 桌面客户端,支持 macOS 和 Windows
anthropic 宣布 claude 桌面客户端正式发布稳定版(此前为预览版本),现已面向 windows 与 mac 用户全面上线。 Mac 版本此次带来了多项实用新特性: 全局快捷唤起:双击 Option 键即可在任意应用界面快速唤醒 Claude,无论是编写代码还是浏览文档都能即时互动; 屏幕内容共享:支持直接截图或共享当前应用窗口内容给 Claude,免去频繁拖拽文件的麻烦; 语音输入支持:按下 Caps Lock 键即可开始语音输入,边说边思考...

智谱发布 GLM Coding Plan 企业版

智谱发布 GLM Coding Plan 企业版
智谱正式发布 glm coding plan 企业版,依托行业领先的 glm-4.6 模型,致力于以更安全、高效且低成本的方式,为全球企业提供全方位的智能编程支持,助力企业加速迈向智能化升级。 据悉,GLM Coding Plan 企业版集成了多模态理解(图像/视频)、联网搜索(MCP)以及智能流程编排等核心能力,为企业开发团队打造从代码生成到全流程协作的一体化解决方案。 该版本以卓越性能与安全保障为核心亮点,具备三大核心优势: 高配额、低投入:相比 Claud...

月之暗面(Moonshot AI)将完成数亿美元融资

月之暗面(Moonshot AI)将完成数亿美元融资
据公开报道,国内大模型初创企业月之暗面(moonshot ai)或将迎来新一轮数亿美元级别的融资,引发业界广泛关注。截至目前,该公司尚未对此消息作出回应。 这家曾被誉为“中国最值得期待的大模型创业公司”之一的企业,在过去一段时间内相对低调。回顾此前融资记录,月之暗面最近一次公开融资发生在2024年8月,融资额约为3亿美元。随着今年年初 DeepSeek 的迅速崛起,Kimi 一度淡出大众视野。然而今年7月,其推出全新升级的 Kimi k2 模型,迅速重返舆论焦点。...

Anthropic 推出 Claude for Excel

Anthropic 推出 Claude for Excel
anthropic 宣布推出 claude for excel,旨在进一步拓展其在金融服务领域的应用。此更新使得 claude 能够作为金融专业人士的 ai 助手,尤其是那些使用 microsoft 工具的用户。claude for excel 目前处于研究预览的测试阶段,用户可以通过 excel 侧边栏直接与 claude 进行互动。 通过这项新功能,Claude 能够读取、分析并修改工作簿,且每一次的更改都能得到清晰的追踪和解释。这项功能尤其适合帮助用户调试公式、生...

当大家都在看ChatGPT Claude桌机版偷推萤幕截图、视窗共享等功能

当大家都在看ChatGPT Claude桌机版偷推萤幕截图、视窗共享等功能
在chatgpt atlas震撼全球之际,anthropic也低调推出了全新的桌面应用程式——claude desktop,正式支援mac与windows双平台,并引入三大创新功能:截图撷取、视窗分享以及caps lock键语音控制。这项升级使用户得以透过更直觉、自然的方式与人工智慧互动,实现无需手动输入的语音操作与即时画面解析,进一步深化ai在日常工作效率中的整合能力。 透过崭新的截图与视窗分享机制,使用者现在可直接将当前萤幕画面或正在开启的应用程式视窗传送至Cl...

零一万物联合开源中国推出 OAK 平台,目标打造 Agent 世界的“生态适配器”

零一万物联合开源中国推出 OAK 平台,目标打造 Agent 世界的“生态适配器”
11月1日,在gotc 全球开源技术峰会(gotc 2025)上,零一万物ceo李开复博士发表了题为《拥抱开源生态,共创ai agent颠覆式创新》的主题演讲,深入探讨了智能体经济时代背后的变革动力。他指出,ai agent将引领企业迈向以结果为核心的全新商业模式,而开源模型正是构建ai agent的最佳路径,同时也为全球开发者社区带来了前所未有的技术创新机遇。 零一万物CEO李开复博士 峰会上,零一万物携手开源中国共同推出专为开发者打造的AI Agent一站式开...