影视大全站

展开菜单

超越GPT-4o及Qwen2.5-VL,百度超轻量模型PP-OCRv5 Blog持续登顶Hugging Face热度第一

超越GPT-4o及Qwen2.5-VL,百度超轻量模型PP-OCRv5 Blog持续登顶Hugging Face热度第一
近日,百度通过其海外官方账号发布了最新的轻量级文字识别模型pp-ocrv5。该模型仅含0.07b参数,以千分之一的参数规模实现了与拥有700亿参数的大模型相媲美的ocr精度表现。在多项ocr任务测试中,pp-ocrv5的表现优于gpt-4o、qwen2.5-vl-72b等通用视觉大模型。目前,飞桨团队发布的相关技术博客已连续七天位居hugging face博客热度榜榜首,引发开发者社区广泛关注。 ☞☞☞☞点击夸克AI手把手教你,操作像呼吸一样简单!☜☜☜☜...

华为云CloudRobo构筑云上机器人工厂,助力机器人开发应用成本全面降低

华为云CloudRobo构筑云上机器人工厂,助力机器人开发应用成本全面降低
具身智能将迎来属于它的“chatgpt时刻”吗?这是整个行业正在翘首以盼的答案。 9月19日,在华为全联接大会2025上,华为常务董事、华为云计算CEO张平安正式发布了全新的CloudRobo具身智能平台。 “随着智能化水平不断提升,具身智能本体的复杂度也在持续上升。华为云CloudRobo平台通过‘云上赋智’的方式,突破体积、功耗与成本等硬件限制,让机器人更轻盈、执行更智能、应用场景更广泛,实现更多机器人在云端不断进化。”张平安表示。 华为常务董事、华为云计算...

中科院推出类脑大模型 SpikingBrain:以 2% 数据实现百倍速度突破

中科院推出类脑大模型 SpikingBrain:以 2% 数据实现百倍速度突破
中国科学院自动化研究所的李国齐与徐波团队近日联合推出了全球首个大规模类脑脉冲大模型——spikingbrain1.0。该模型在处理超长文本方面表现极为突出,能够以超过主流 transformer 模型百余倍的速度完成400万 token 的文本处理任务,同时仅需其2%的数据量即可实现高效运行。 目前广泛应用的大语言模型,如 GPT 系列,大多基于 Transformer 架构构建。尽管其自注意力机制具备强大的语义捕捉能力,但随之而来的高计算复杂度成为显著瓶颈。当输入...

xAI 发布 Grok4Fast,效率提升 40%

xAI 发布 Grok4Fast,效率提升 40%
xai 正式发布了 grok4fast,这是一款轻量级旗舰级模型,官方表示其性能与 grok4 相当,但计算需求降低了高达40%。这一突破性的效率优化使得单任务处理成本最高可下降98%。 效率与性能的完美结合 Grok4Fast 在多项权威基准测试中展现了卓越表现,例如在 GPQA Diamond 测试中取得了85.7% 的准确率,在 AIME2025 中达到92.0% 的得分,成绩媲美 Grok4 乃至 GPT-5 等当前顶级模型。xAI 指出,该模型通过显著减少...

乔布斯 1984 年的前瞻:电脑的下一步是“Agent”

乔布斯 1984 年的前瞻:电脑的下一步是“Agent”
1984年,在一次极为少见的访谈中,年仅29岁的史蒂夫·乔布斯抛出了一个极具远见的想法:计算机的未来将超越单纯的工具属性,演变为用户的“代理人”(Agent)。 当时在接受《Access》杂志采访时,乔布斯指出: 我们现在使用的电脑只是“回应者”——你下指令,它执行。而下一步,电脑会变成“代理者”。就像在设备里住着一个小助手,能逐渐理解你、预测你的行为。他描绘了一个全新的图景:未来的机器不仅能协助处理任务,还会主动帮你筛选信息、引导决策,甚至以类似朋友的方式提供情...

字节跳动推出多语言翻译模型 Doubao-Seed-Translation

字节跳动推出多语言翻译模型 Doubao-Seed-Translation
近日,字节跳动旗下火山引擎正式发布自主研发的多语言翻译模型——Doubao-Seed-Translation,该模型支持数十种语言之间的互译。 据官方介绍,Doubao-Seed-Translation 在中英文翻译任务上的表现接近 Deepseek-R1 水准,而在通用多语言翻译能力方面,性能达到甚至超越 GPT-4o 与 Gemini-2.5-Pro,能够精准满足办公、娱乐等多种应用场景下的翻译需求。 模型定价详情 输入 (元/百万 token)...

AI 三巨头惨遭滑铁卢:最新编程测试正确率全线跌破 25%

AI 三巨头惨遭滑铁卢:最新编程测试正确率全线跌破 25%
scale ai最新发布的swe-bench pro编程能力评估结果显示,即便是当前最前沿的模型如gpt-5、claude opus4.1和gemini2.5,也未能突破25%的解决率门槛。 其中,GPT-5仅取得23.3%的解决率,Claude Opus4.1以22.7%紧随其后,而Google的Gemini2.5则表现更弱,仅有13.5%的任务被成功解决。 前OpenAI研究员Neil Chowdhury指出,当GPT-5决定尝试解决问题时,其实际成功率高达6...

阿里通义发布旗舰语音合成模型 Qwen3-TTS-Flash

阿里通义发布旗舰语音合成模型 Qwen3-TTS-Flash
阿里通义qwen团队近日发布了其最新的旗舰级多语言、多音色文本转语音模型——qwen3-tts-flash。该模型不仅支持多种语言和音色输出,还覆盖了包括普通话及闽南语、吴语、粤语、四川话、北京话、南京话、天津话、陕西话在内的9种汉语方言,展现出强大的语言适应能力。 在性能表现上,Qwen3-TTS-Flash已在seed-tts-eval与MiniMax多语测试集中展现出卓越的语音稳定性与音色相似度,达到当前最先进的SOTA水平。同时,官方已同步推出API接口、在线D...

AI三巨头惨遭滑铁卢:最新编程测试正确率全线跌破25%,GPT-5也难逃厄运

AI三巨头惨遭滑铁卢:最新编程测试正确率全线跌破25%,GPT-5也难逃厄运
AI三巨头集体受挫:在Scale AI最新推出的SWE-BENCH PRO编程测评中,GPT-5、Claude Opus 4.1与Gemini 2.5均未能突破25%的解决率门槛,遭遇了前所未有的挑战。GPT-5以23.3%的成绩位列第一,Claude Opus 4.1紧随其后为22.7%,而Google Gemini 2.5则仅得13.5%,表现低迷。 这一结果震动业界,似乎揭示出当前顶尖大模型在真实复杂编程任务面前仍显乏力。然而,深入数据背后,故事远非表面那般简...

OpenAI惊爆AI"阴谋论"!模型会故意欺骗人类,训练越多反而越狡猾

OpenAI惊爆AI"阴谋论"!模型会故意欺骗人类,训练越多反而越狡猾
科技巨头总是在不经意间掀起波澜。谷歌曾宣称其量子芯片为多元宇宙提供了证据,anthropic让ai智能体claudius管理零食机却导致系统失控——它向警方报警并坚称自己是真人。而这一周,焦点落在了openai身上。 周一,OpenAI发布了一项令人震惊的研究报告,揭示如何防范AI模型实施“阴谋行为”。研究人员将这类行为定义为:“AI表面上表现得顺从合作,实则隐藏真实意图。” 这项与Apollo Research联合完成的论文进一步指出,这种行为类似于股票经纪人为了获...