六年来首次!OpenAI新模型开放权重,Altman称为“全球最佳开放模型”

频道:社交专题 日期: 浏览:47

这是六年来第一次,OpenAI的新版本模型放行了其权重参数,Altman称其为“全球范围内首屈一指的开放型人工智能系统”

李丹

08/06 02:43

Altman评价gpt-oss是当前顶尖的开放权重推理架构。OpenAI指出,gpt-oss-120b在关键推理测试上表现媲美o4-mini,在医疗相关问题和竞赛数学任务中甚至更胜一筹;gpt-oss-20b这类轻量级模型在评估中也能达到或超越o3-mini水准;这类小型模型适合安装在搭载苹果处理器的Mac设备上。亚马逊公布旗下平台Bedrock和SageMaker将支持这两种模型,这是该企业首次向客户供应OpenAI模型。

OpenAI在开源模型领域达成关键进展,时隔六载再度释出可公开获取的模型参数。

美东地区8月5日星期二,OpenAI推出了两款可免费体验的开放权重语言模型,分别是gpt-oss-120b和gpt-oss-20b。这是OpenAI自2019年推出GPT-2之后,首次发布开放权重模型。同时,这也是OpenAI与微软达成独家云服务协议六年来,首次出现的此类模型。

这两款新式产品能够依据客户要求创造文字材料开元ky888棋牌官网版,容许技术人员进行个性化设计,不过OpenAI方面并未公布用于培养这些模型的资料。业界人士指出,OpenAI推出的最新产品直接应对了由Meta与微软扶持的Mistral AI,还有中国新兴的DeepSeek等对手在公开参数模型这一范畴发起的挑战。

OpenAI的CEO Sam Altman在社交媒体表示:

gpt-oss是一次技术飞跃,堪称当前顶尖的开放权重推理架构,其实际应用能力与o4-mini不相上下,支持在个人电脑(或手机轻量版)上进行本地部署。我们坚信这是全球范围内最优、最实用的开放模型之一。

gpt-oss-120b和gpt-oss-20b作为经济实惠的GPT版本被打造出来,技术人员、学术工作者和商业机构能够便捷地执行和调整它们。gpt-oss-20b能在16GB容量的便携式电脑上运作,gpt-oss-120b则需大约80GB的存储空间,这两种模型都能实现复杂的逻辑分析、外部工具的调用以及连贯的推理过程。

Altman表示,这两种设备能够直接在个人计算机或者移动终端上执行操作,不需要接入网络,可以让使用者获得完全的操作自主性和个人隐私的保障。

此外,亚马逊公布将初次向用户开放OpenAI的模型,打算将其部署在Bedrock和SageMaker平台之上,赋予用户使用OpenAI的开放AI权重的机会,这标志着亚马逊作为云服务主要供应商,首次推出OpenAI的相关产品。

gpt-oss-20b与120b的推出,是OpenAI战略调整的关键时刻,该公司先前曾屡次延缓公开权重模型的发布,同时实施了全面的安全检测和评定,目的是防止模型遭受不良使用。

开放权重属于开源与闭源之间的一种过渡类型,表示企业或政府能够自行操作模型,前提是他们能够检查模型的权重并加以调整。在开源情形下,使用者可以察看模型的全部代码构成,部分情况下还涵盖训练过程和权重分配机制。

早前的观点指出,OpenAI发布通用参数模型或许会降低微软在人工智能领域独有的领先地位,本周二OpenAI透露,微软计划将gpt-oss-20b模型的GPU改进版本整合进Windows系统之中这些模型依托ONNX Runtime运行,能够实现本地运算,借助Foundry Local以及AI Toolkit for VS Code便可取得,这样Windows程序员就能更便捷地借助公开模型开展开发工作。

gpt-oss-120b部分测试性能比o4-mini好,20b部分测试性能比o3‑mini强

OpenAI推出了两款gpt-oss模型,运用了其顶尖的预训练和后续训练方法,特别强调逻辑能力、运行速度以及在不同部署场景下的适用性。这两个模型均基于专家混合(MoE)架构的Transformer设计,旨在降低处理输入信息时所需的动态参数规模。

gpt-oss-120b单个token会调动5.1亿个参数,整体参数规模达到1170亿;gpt-oss-20b单个token调动3.6亿个参数,整体参数规模为210亿。模型采用交替的密集型和局部带状稀疏型注意力机制,能够处理长达128k的上下文序列。

instapaper mac_OpenAI gpt-oss-120b gpt-oss-20b

OpenAI表示gpt-oss-20b属于中等规模的开放型人工智能,gpt-oss-120b则是一种大型开放型人工智能,它能够在多数台式电脑和笔记本电脑上顺利运作。

OpenAI透露,小规模模型要达到最优表现,至少需要配备16GB显存或统一内存,而且它们特别适配高端家用GPU以及苹果公司生产的芯片Mac电脑。至于大型完整尺寸的模型,它们至少要求60GB显存或统一内存。

性能评估显示,gpt-oss-120b在核心推理基准测试里,表现与OpenAI o4-mini相差无几。gpt-oss-20b模型体量较小,但在相同评估中,它的性能达到甚至超越了OpenAI o3-mini的水平。

gpt-oss-120b在竞赛编程(Codeforces)上表现更佳开元ky888棋牌官方版,在通用问题解决(MMLU 和 HLE)方面也更为出色,在工具使用(TauBench)测试中同样领先 OpenAI o3‑mini,并且它的能力与 OpenAI o4-mini 相当,甚至超过了后者。它在健康相关查询方面的表现,比如HealthBench,已经超越了o4-mini, 而在竞赛数学方面,包括AIME 2024和AIME 2025,它的成绩也更好。

gpt-oss-20b体型虽不大,在同类型检测里表现不输OpenAI o3‑mini,有时还更胜一筹,竞赛数学和医疗领域也强过它。

instapaper mac_OpenAI gpt-oss-120b gpt-oss-20b

instapaper mac_OpenAI gpt-oss-120b gpt-oss-20b

安全防护与恶意使用预防

OpenAI对开放权重模型的安全问题十分重视,原因是发布之后,敌人或许会恶意地调整模型参数。该公司在模型训练阶段,排除了涉及化学、生物、放射性以及核(CBRN)领域的有害信息。

为了精准判断风险,OpenAI特意用生物与网络安全信息对模型进行过针对性调整,从而生成了攻击者或许会打造的专门领域拒绝型版本,在内部与外部进行测试后,这些恶意调整过的模型没能达到预设标准里的“高水准”要求。

OpenAI还和另外三个独立专家组联手,就恶意微调评估给出意见。Altman着重表示:他们着力缓解最严峻的安全隐患开yun体育app入口登录,特别是在生物安全这一领域。gpt-oss模型在内部安全基准测试中的成绩,同他们的尖端模型不相上下。

生态系统部署与市场影响

这两个模型采用Apache 2.0授权方式开放,用户可经由Hugging Face、GitHub等渠道获取。同时,亚马逊云科技、Baseten以及微软云平台也会供应这些模型。

OpenAI和Azure、vLLM、Ollama、AWS、Fireworks等众多先进平台建立了合作关系,让开发者可以方便地运用这些模型。微软还把专门为GPU进行优化的gpt-oss-20b模型部署到了Windows设备上。

该公司正在开展红队挑战赛事,奖金总额达五十万美元,旨在吸引全球范围内研究人员、开发者及爱好者参与,共同发现潜在的安全隐患。Altman表示:"此举利大于弊,我们期待通过此次发布,能够推动新型研究的发展,并催生创新产品。"

竞争压力推动战略转变

此次OpenAI推出开放权重模型,主要受到市场环境制约,尤其面对中国DeepSeek带来的竞争压力。该公司从2019年起,一直致力于通过API形式提供独家模型服务,与此同时,众多对手纷纷推出了开放权重类的替代产品。

OpenAI的总裁Greg Brockman在周二举行的媒体沟通会上谈到,对于生态系统的进步感到非常激动,公司为其中的一部分感到自豪,能够帮助引领最新的研究进展,并期待后续的发展情况。

OpenAI联合英伟达、AMD、Cerebras和Groq等半导体厂商,致力于让模型在各类硬件上流畅运作。英伟达总裁黄仁勋发表公开讲话表示:"OpenAI向全球呈现了英伟达人工智能的无限可能——目前他们正积极推动开源软件的革新。"

风险提示及免责条款

市场存在不确定性,参与投资活动应当小心。这篇文章并非针对个人的投资指导,也没有将每个使用者的独特投资方向、经济条件或需求纳入考量。使用者需要判断文中提及的任何看法、见解或最终判断是否适合自身的具体情况。如果依照这些内容进行投资,由此产生的后果由自己承担。

网友留言(0)

评论

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。