claude_影视大全站

Kimi 发布视觉思考模型 k1：试题拍照给出答题思考全过程

月之暗面kimi团队近期发布了全新视觉思考模型k1，这款基于强化学习的模型原生支持端到端图像理解和思维链技术，其能力已扩展至数学及其他基础科学领域。官方基准测试结果显示，k1在数学、物理、化学等基础科学学科的测试中，表现超越了OpenAI的o1、GPT-4o以及Claude 3.5 Sonnet。 k1模型已集成至最新版Kimi智能助手Android和iOS应用以及网页版kimi.com。用户可在“Kimi视觉思考版”中上传图片或拍照进行体验，并完整查看模型...

2026-01-10/ 31 次浏览/ 资讯

超越Claude 3.5、GPT-4o等顶尖闭源模型，阿里通义开源模型Qwen2.5斩获OpenCompass评测榜冠军

阿里通义千问开源模型qwen2.5-72b-instruct在司南opencompass大模型评测榜9月榜单中力压群雄，荣登榜首，成为首个夺冠的开源模型，超越了claude 3.5和gpt-4o等闭源模型。这一突破标志着中国开源大模型技术取得了显著进展。据悉，司南OpenCompass是由上海人工智能实验室打造的权威大模型评测平台，涵盖OpenAI、阿里巴巴等众多国际知名厂商的模型，其评测结果备受关注。该平台从七大维度，十余项细分任务对主流大模型进行全面评估。...

2026-01-10/ 28 次浏览/ 资讯

挑战高考数学完胜！商汤日日新多模态大模型权威评测第一

商汤日日新sensenova多模态大模型在opencompass权威多模态评测中夺冠！其平均得分高达77.4分，超越gpt-4o、claude 3.5 sonnet以及国内所有同类模型，展现出卓越的性能。尤其在MathVista数据集（涵盖算术、统计等数学领域）中，日日新SenseNova取得78.4分的最高分，其强大的数理能力令人瞩目。 OpenCompass评测涵盖八个核心数据集，对大模型能力进行多维度评估。商汤日日新在多数维度上达到或超过GPT-4o水...

2026-01-10/ 48 次浏览/ 资讯

字节跳动发布豆包大模型1.5Pro版本，综合性能大幅提升

字节跳动旗下豆包大模型迎来重大升级！全新doubao-1.5-pro模型已正式发布，在知识、代码、推理和中文理解等多个方面全面提升，综合性能超越gpt-4o和claude 3.5 sonnet等竞品。目前，该模型已在豆包App灰度上线，开发者亦可通过火山引擎API直接调用。官方表示，Doubao-1.5-pro在预训练阶段采用更少的激活参数，并运用大规模稀疏MoE架构，性能等效于参数量7倍的密集模型，效率远超业界同类模型。立即进入“豆包AI人工智官网入...

2026-01-10/ 30 次浏览/ 资讯

Keep宣布All in AI，已悄然在海外上线多款AI应用

keep十年磨一剑，all in ai开启下一个十年！keep创始人王宁近日发布全员信，宣布公司未来十年将全力投入人工智能(ai)领域，并明确了四大战略方向：聚焦四大方向，打造AI赋能的运动健康生态： All in AI：充分利用十年积累的运动数据，将在线健身从简单的推荐升级为AI生成的个性化方案，引领运动科技行业发展。数据驱动硬件生态：发展以数据为核心的硬件产品线，为用户提供更全面的运动健康解决方案。多场景品牌拓展：将Keep品牌延...

2026-01-10/ 28 次浏览/ 资讯

Mistral在iOS和Android上发布AI助手应用

被誉为“欧洲ai希望之星”的mistral公司对其ai助手le chat进行了重大更新。除了网页端显著改进外，mistral还推出了ios和android移动应用。值得注意的是，Mistral拥有自主研发的大型语言模型。其旗舰模型，如Mistral Large和多模态模型Pixtral Large，可通过API或云平台（Azure AI Studio、Amazon Bedrock、Google Vertex AI）进行商业应用。此外，Mistral还开源了许多模型...

2026-01-10/ 33 次浏览/ 资讯

DeepSeek官方App全新上线，功能多样且免费使用

deepseek官方app强势登陆app store，带来革命性搜索体验！这款基于deepseek v3模型的应用，功能强大且完全免费，为用户提供一站式智能服务。 DeepSeek官方App集深度思考与联网搜索于一体，轻松应对日常对话、语言翻译、创意写作、编程解题、文献解读和旅行规划等多种需求，全面覆盖网页版功能。这款备受好评的免费应用，被誉为ChatGPT的最佳免费替代方案之一，其卓越性能和免费特性赢得了广泛赞誉。目前仅提供iOS版本，安卓和iPad版本也...

2026-01-10/ 30 次浏览/ 资讯

OpenAI最新研究表明当前AI模型仍无法媲美人类程序员

openai 最新研究表明：ai 编程能力仍逊于人类程序员，即使是最先进的模型也无法胜任大多数编程任务。 OpenAI CEO 萨姆·奥尔特曼曾预测，AI 模型将在年底超越“低级别”软件工程师。然而，OpenAI 研究人员近期发表的论文却挑战了这一说法。研究人员使用名为 SWE-Lancer 的新基准测试工具（基于 Upwork 上 1400 多个软件工程任务）对 o1、GPT-4o 和 Claude 3.5 Sonnet 三款大型语言模型 (LLMs) 进行了评估。...

2026-01-10/ 27 次浏览/ 资讯

DeepSeek-V3 模型完成小版本升级，已可试用体验

deepseek-v3模型迎来小幅升级，现已开放体验！deepseek官方近日宣布，其deepseek-v3模型已完成小版本更新，用户可通过官方网站、app和小程序体验升级后的模型（深度思考功能已关闭）。api接口及使用方法保持不变。虽然官方未公布具体更新内容，但DeepSeek-V3模型自去年12月发布开源以来，便凭借其671B参数的MoE架构，在多项评测中超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型，性能与GPT-4o和Claude...

2026-01-10/ 33 次浏览/ 资讯

测试BioMaster: AI生信分析的demo测试

从去年吴恩达提出agent（智能体）将有广阔前景，到dify等开源智能体以及manus（多智能体应用）的迅速走红，ai智能体已经步入多智能体时代，其应用也日趋成熟。最近，我对两个ai方向产生了浓厚兴趣，一个是gui agent，比如glm pc和字节开源的ui-tars等，不过这些还处于初级阶段。我关注这个领域是因为希望能将一些相对简单的日常工作交由ai处理。另一个方向与前者有一定的交叉，就是生信分析的智能体。我希望生信分析能惠及每个人，只要有足够的硬件支持，AI就能...

2026-01-09/ 36 次浏览/ 资讯

‹‹ 1 2 3 4 5 6 7 8 9 10 › ››