月之暗面kimi团队近期发布了全新视觉思考模型k1,这款基于强化学习的模型原生支持端到端图像理解和思维链技术,其能力已扩展至数学及其他基础科学领域。
官方基准测试结果显示,k1在数学、物理、化学等基础科学学科的测试中,表现超越了OpenAI的o1、GPT-4o以及Claude 3.5 Sonnet。
k1模型已集成至最新版Kimi智能助手Android和iOS应用以及网页版kimi.com。用户可在“Kimi视觉思考版”中上传图片或拍照进行体验,并完整查看模型...
阿里通义千问开源模型qwen2.5-72b-instruct在司南opencompass大模型评测榜9月榜单中力压群雄,荣登榜首,成为首个夺冠的开源模型,超越了claude 3.5和gpt-4o等闭源模型。这一突破标志着中国开源大模型技术取得了显著进展。
据悉,司南OpenCompass是由上海人工智能实验室打造的权威大模型评测平台,涵盖OpenAI、阿里巴巴等众多国际知名厂商的模型,其评测结果备受关注。该平台从七大维度,十余项细分任务对主流大模型进行全面评估。...
商汤日日新sensenova多模态大模型在opencompass权威多模态评测中夺冠!其平均得分高达77.4分,超越gpt-4o、claude 3.5 sonnet以及国内所有同类模型,展现出卓越的性能。
尤其在MathVista数据集(涵盖算术、统计等数学领域)中,日日新SenseNova取得78.4分的最高分,其强大的数理能力令人瞩目。
OpenCompass评测涵盖八个核心数据集,对大模型能力进行多维度评估。商汤日日新在多数维度上达到或超过GPT-4o水...
字节跳动旗下豆包大模型迎来重大升级!全新doubao-1.5-pro模型已正式发布,在知识、代码、推理和中文理解等多个方面全面提升,综合性能超越gpt-4o和claude 3.5 sonnet等竞品。
目前,该模型已在豆包App灰度上线,开发者亦可通过火山引擎API直接调用。
官方表示,Doubao-1.5-pro在预训练阶段采用更少的激活参数,并运用大规模稀疏MoE架构,性能等效于参数量7倍的密集模型,效率远超业界同类模型。
立即进入“豆包AI人工智官网入...
keep十年磨一剑,all in ai开启下一个十年!keep创始人王宁近日发布全员信,宣布公司未来十年将全力投入人工智能(ai)领域,并明确了四大战略方向:
聚焦四大方向,打造AI赋能的运动健康生态:
All in AI: 充分利用十年积累的运动数据,将在线健身从简单的推荐升级为AI生成的个性化方案,引领运动科技行业发展。
数据驱动硬件生态: 发展以数据为核心的硬件产品线,为用户提供更全面的运动健康解决方案。
多场景品牌拓展: 将Keep品牌延...
被誉为“欧洲ai希望之星”的mistral公司对其ai助手le chat进行了重大更新。除了网页端显著改进外,mistral还推出了ios和android移动应用。
值得注意的是,Mistral拥有自主研发的大型语言模型。其旗舰模型,如Mistral Large和多模态模型Pixtral Large,可通过API或云平台(Azure AI Studio、Amazon Bedrock、Google Vertex AI)进行商业应用。此外,Mistral还开源了许多模型...
deepseek官方app强势登陆app store,带来革命性搜索体验!这款基于deepseek v3模型的应用,功能强大且完全免费,为用户提供一站式智能服务。
DeepSeek官方App集深度思考与联网搜索于一体,轻松应对日常对话、语言翻译、创意写作、编程解题、文献解读和旅行规划等多种需求,全面覆盖网页版功能。
这款备受好评的免费应用,被誉为ChatGPT的最佳免费替代方案之一,其卓越性能和免费特性赢得了广泛赞誉。目前仅提供iOS版本,安卓和iPad版本也...
openai 最新研究表明:ai 编程能力仍逊于人类程序员,即使是最先进的模型也无法胜任大多数编程任务。
OpenAI CEO 萨姆·奥尔特曼曾预测,AI 模型将在年底超越“低级别”软件工程师。然而,OpenAI 研究人员近期发表的论文却挑战了这一说法。研究人员使用名为 SWE-Lancer 的新基准测试工具(基于 Upwork 上 1400 多个软件工程任务)对 o1、GPT-4o 和 Claude 3.5 Sonnet 三款大型语言模型 (LLMs) 进行了评估。...
deepseek-v3模型迎来小幅升级,现已开放体验!deepseek官方近日宣布,其deepseek-v3模型已完成小版本更新,用户可通过官方网站、app和小程序体验升级后的模型(深度思考功能已关闭)。api接口及使用方法保持不变。
虽然官方未公布具体更新内容,但DeepSeek-V3模型自去年12月发布开源以来,便凭借其671B参数的MoE架构,在多项评测中超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型,性能与GPT-4o和Claude...
从去年吴恩达提出agent(智能体)将有广阔前景,到dify等开源智能体以及manus(多智能体应用)的迅速走红,ai智能体已经步入多智能体时代,其应用也日趋成熟。最近,我对两个ai方向产生了浓厚兴趣,一个是gui agent,比如glm pc和字节开源的ui-tars等,不过这些还处于初级阶段。我关注这个领域是因为希望能将一些相对简单的日常工作交由ai处理。
另一个方向与前者有一定的交叉,就是生信分析的智能体。我希望生信分析能惠及每个人,只要有足够的硬件支持,AI就能...