蚂蚁集团近日正式开源了业界首个高性能扩散语言模型推理框架dinfer。
在多项基准测试中,dInfer展现出卓越的性能表现:其推理速度相较英伟达推出的扩散模型推理框架Fast-dLLM提升了10.7倍;在代码生成任务HumanEval中,单批次推理速度达到惊人的1011 Tokens/秒,首次在开源社区实现扩散语言模型的推理效率超越主流自回归模型。这一成果表明,扩散语言模型具备巨大的效率潜力,通过系统性工程创新可充分释放,为通往AGI的技术路径提供了极具竞争力的新选择。...
ai 研究组织 radical numerics 推出了 rnd1-base,这是目前规模最大的开源扩散语言模型,总参数量高达30b,其中每次推理仅激活3b参数,依托稀疏专家混合(moe)架构实现高效计算。该模型不仅在多项基准测试中表现优异,还全面公开了模型权重、训练细节与推理代码,致力于推动扩散语言模型在后训练和推理优化方向的研究进程。
RND1-Base 的构建基于 Qwen3-30BA3B 这一自回归基础模型,通过连续的预训练过程顺利迁移到扩散式生成范式。迁移过程...
阿里通义 qwen 团队近日正式推出了 qwen3-vl 系列的新成员 —— 4b 与 8b 参数规模的视觉语言模型。该系列于上月首次发布,是目前 qwen 系列中性能最强的多模态模型。
此次更新新增了 4B 和 8B 两种尺寸,每种均提供 Instruct 与 Thinking 两个版本,满足不同应用场景的需求。
本次发布的模型达成了三大核心目标:
更低的部署门槛:通过减小模型体积,大幅降低了显存(VRAM)占用,使得更多开发者能够在普通硬件设备上高效运行...
阿里旗下通义千问(Qwen)正式上线全新 Qwen Chat Memory 功能,用户现已可通过 chat.qwen.ai 直接使用并体验这一升级服务。
这标志着 Qwen 正式迈入具备“长期记忆”能力的新阶段——模型不仅能够理解当前对话上下文,还可主动识别并存储关键信息,在后续交流中实现跨会话的关联与回忆,使对话更加连贯、自然,更接近人类的沟通方式。
据悉,Qwen Chat Memory 能在多次互动过程中持续记录用户的个人偏好、行为习惯以及历史对话内容,从而...
百度正式发布并开源自研多模态文档解析模型paddleocr-vl。在全球权威文档解析评测榜单omnibenchdoc v1.5中,paddleocr-vl以92.6分取得综合性能全球第一成绩,四大核心能力(文本、表格、公式、阅读顺序)全线sota,超越 gpt-4o、gemini-2.5 pro、qwen2.5-vl-72b等主流多模态大模型,以及monkeyocr-pro-3b、mineru2.5、dots.ocr等ocr专业模型,刷新全球ocr vl模型性能天花板。...
爱彼迎airbnb首席执行官布莱恩·切斯基在近期的一次媒体访谈中透露,公司目前正“大规模采用阿里巴巴旗下的通义千问模型”,并直言该模型“相较openai的方案更高效且成本更低”。
他还补充道:“我们确实会接入OpenAI的最新模型,但在实际生产环境中并不会广泛部署,毕竟市场上已有速度更快、价格更优的替代选择。”
此番言论在硅谷掀起广泛讨论,甚至有知名AI领域研究者以调侃口吻发问:“如今硅谷的根基是通义千问?”(The valley is built on Qwen...
阿里通义 qwen 团队最新宣布,qwen3-vl 系列迎来重磅升级,新增 2b 与 32b 两款密集型(dense)模型,实现从轻量级到高性能级的全面布局,全方位覆盖各类视觉语言理解应用场景。
此次发布的两个版本各具特色,满足多样化需求:
Instruct 版本:响应迅捷、运行稳定,专为高效对话交互与工具调用场景优化;
Thinking 版本:强化复杂推理与深度视觉理解能力,具备“看图思考”特性,轻松应对高难度任务挑战。
官方指出,Qwen3-VL-32B...
10月22日,爱彼迎airbnb首席执行官布莱恩·切斯基在接受媒体采访时透露,公司目前“正在大规模采用阿里巴巴的通义千问模型”,并明确指出其“比openai的方案更优且成本更低”。他还补充道:“我们确实会使用openai的最新模型,但在实际生产环境中并不会广泛部署,因为市场上已有更快、更具性价比的替代选择。”
这番言论在硅谷掀起广泛讨论,一位知名AI研究人员甚至带着调侃语气发问:“难道硅谷是建立在通义千问之上的?”(The valley is built on Qw...
阿里巴巴“c计划”的首款成果近日正式亮相,即夸克app推出的全新对话助手功能。
据《科创板日报》消息,该对话助手基于Qwen(通义千问)最新闭源大模型打造。用户可通过点击夸克App首页的助手入口或右滑操作便捷进入该模式。
从形态与功能来看,这款对话助手与字节跳动旗下的“豆包”等产品类似,具备通用问答、深度搜索、拍照搜题、AI写作等多项核心能力,并可联动扫描、图像编辑等实用工具。
依托在拍照搜题和信息检索领域的长期布局和技术沉淀,夸克成功将传统搜索优势与新一代对话...
中国科学院软件研究所天基综合信息系统全国重点实验室的研究团队围绕大语言模型(llms)在复杂推理任务中的性能优化问题,提出了一种创新的强化微调框架——learning to think (l2t)。该框架基于信息论原理,致力于在提升模型推理能力的同时优化计算效率,为大语言模型在实际场景中的高效推理提供了全新的技术思路。
相关研究成果论文 Learning to Think: Information-Theoretic Reinforcement Fine-Tuning...