影视大全站

展开菜单

OpenAI GPT-5 被指数学成就夸大

OpenAI GPT-5 被指数学成就夸大
据 The Decoder 报道,OpenAI 副总裁 Kevin Weil 曾发布一条推文(后已删除),声称 GPT-5 成功解决了 10 个此前未解的 Erdős 问题,并在另外 11 个问题上取得了实质性进展。Erdős 问题源自著名数学家保罗・厄尔德什提出的一系列著名猜想,长期被视为数学领域的挑战性难题。 然而,负责管理 Erdős 问题专题网站的数学家 Thomas Bloom 对此提出质疑,称 Weil 的说法是“严重的歪曲”。他解释说,尽管这些问题在其...

OpenAI 预测其 AI 销售额将跃升至 1000 亿美元

OpenAI 预测其 AI 销售额将跃升至 1000 亿美元
OpenAI 预计其人工智能相关收入将从2025年的约130亿美元,在未来三至四年内迅猛增长,到2028年或2029年达到1000亿美元。 这一增长速度令人震惊。根据 Epoch AI 的统计,在过去半个世纪中,全美仅有七家公司(在可查数据范围内)能在十年内完成从100亿到1000亿美元销售额的跨越。而 OpenAI 所预测的增长轨迹,意味着这一过程将被压缩至短短三年,远超历史平均水平。 目前,美国企业中最快达成该里程碑的是特斯拉(Tesla)和 Meta,均耗时...

AI模型也能被“洗脑”!仅需250份文件就能控制ChatGPT回应

AI模型也能被“洗脑”!仅需250份文件就能控制ChatGPT回应
10月19日,anthropic、英国ai安全研究所与艾伦·图灵研究所联合发布一项最新研究成果:当前主流大语言模型(包括claude、chatgpt和gemini等)对数据中毒攻击的防御能力远不如预期,攻击者仅需极少量恶意样本即可成功植入“后门”。 研究团队在参数量从600万到130亿不等的多个AI模型上进行了系统性训练实验。结果表明,无论模型体量如何,只要在训练数据中混入约250份被篡改的文件,就能有效操控模型的行为输出。这一发现挑战了过去普遍认为“模型规模越大越难被...

谷歌计划 12 月发布下一代旗舰 AI 模型 Gemini 3.0

谷歌计划 12 月发布下一代旗舰 AI 模型 Gemini 3.0
根据最新消息,谷歌正筹备其旗舰AI模型Gemini的升级版本——Gemini 3.0,并计划于今年12月正式推出。此举延续了该公司近两年来在年末发布新一代Gemini系列产品的惯例。尽管近期有传言称该模型可能提前在“下周”亮相,但知情人士透露,这并非谷歌的官方安排,公众仍需等待正式公告。 作为谷歌在大语言模型赛道上的重要布局,Gemini 3.0被视为其应对激烈竞争的关键一步。业界普遍期待该模型在推理能力、多模态处理以及与谷歌搜索生态的深度融合方面实现突破。随着AI...

MoonBit 开发者激励计划开启|赢取价值 $20 Copilot 月卡权益!

MoonBit 开发者激励计划开启|赢取价值 $20 Copilot 月卡权益!
? 从智能体到生态共建:MoonBit Meetup 与开发者激励计划同步启动 ai 正在重塑编程的未来。为了让开发者更深入地感受 ai 辅助编程带来的效率跃迁,并加速 moonbit 生态由「探索阶段」迈向「生产就绪(production-ready)」新纪元,我们正式上线 moonbit 开发者激励计划 ? ?为何推出这项支持? 我们将每月从社区中甄选 5 个高质量的生态项目,获奖者将获得 价值 $20 的 GitHub Copilot 月度会员权益!随着 Moon...

上海 AI 实验室发布首个视频转网页评测基准 IWR-Bench

上海 AI 实验室发布首个视频转网页评测基准 IWR-Bench
上海人工智能实验室联合浙江大学等单位近日发布了iwr-bench,这是全球首个专注于评估大语言模型将视频内容转化为可交互网页代码能力的基准测试。该评测体系旨在更真实地衡量多模态大语言模型(lvlm)在动态网页重建任务中的表现,填补了ai前端开发领域在动态交互能力评估方面的空白。 与传统的图像到代码(Image-to-Code)任务不同,IWR-Bench要求模型通过观看记录完整用户操作流程的视频,并结合网页所需的全部静态资源,复现网页的动态交互行为。其任务范围广泛,涵盖...

大模型谁最“可靠”?SuperCLUE-CPIF测评出炉,文心X1.1国内第一

大模型谁最“可靠”?SuperCLUE-CPIF测评出炉,文心X1.1国内第一
10月21日,中文精确指令遵循测评基准superclue-cpif正式上线,文心x1.1以75.51分位列国产大模型榜首,在任务类型与指令数量两大维度的评估中均居国内首位,展现出其在真实生产场景中的突出应用潜力。 此次测评共纳入包括GPT-5(high)、DeepSeek-V3.2-Exp-Thinking、Claude-Sonnet-4.5-Reasoning、Gemini-2.5-Pro在内的10款国内外主流大模型。SuperCLUE-CPIF聚焦于大型语言模型(L...

全球开源技术峰会 GOTC 2025 —— 开源驱动下一个智能时代的技术与生态对话

全球开源技术峰会 GOTC 2025 —— 开源驱动下一个智能时代的技术与生态对话
全球开源技术峰会 gotc 2025,为期 2 天的开源技术与行业盛会,将通过行业展览、主题发言、圆桌讨论等形式来诠释此次大会主题 ——“万源共振,智构未来”。会议聚焦 agentic ai、大模型时代的“开源”、ai+软件工程、软件基础设施智能化、ai coding、具身智能等热门话题,探讨开源未来,助力开源发展。 https://gotc.oschina.net   GOTC 2025 论坛介绍 大模型应用技术论坛 本论坛将深入探索基于大模型进行开发所需...

微软 Edge 新策略:在访问 AI 应用时推介 Copilot

微软 Edge 新策略:在访问 AI 应用时推介 Copilot
微软正通过 Edge 浏览器推行一项新举措,旨在推动用户更多地使用其自主研发的 AI 工具 Copilot。当用户在 Edge 中浏览诸如 ChatGPT、DeepSeek 或 Perplexity 等主流 AI 平台时,浏览器地址栏右侧会自动出现一个提示标签,建议用户切换至微软的 Copilot 服务。 只需轻点该提示,Copilot 即可在当前页面以侧边栏的形式展开,支持用户直接提问或上传文档进行交互。值得注意的是,这项提示功能目前仅针对特定竞品平台启用——例如...

AI 生成代码浪潮下,还需要开源代码吗?

AI 生成代码浪潮下,还需要开源代码吗?
当 github copilot、codellama 等 ai 编程助手能在几秒内输出完整功能模块,当程序员的日常操作从“搜索开源项目”转变为“撰写 prompt 请求生成”,一种全新的开发范式正在快速兴起。这种由人工智能驱动的编码方式,正悄然重塑传统开源生态的底层逻辑。 开源体系,这个曾以“共享与协作”为核心支撑全球软件发展的基石,如今正面临两大根本性挑战:开发者是否依然需要依赖传统开源项目?而开源所依赖的协作机制、治理结构、安全审查与许可证体系,又能否适应大模型主导...