编程革命彻底爆发,OpenAI最强智能体上线ChatGPT
准备好了吗?OpenAI最强AI编程智能体Codex已正式登场!由o3优化版codex-1驱动,支持多任务并行处理,半小时内高效完成以往数天的软件工程任务。
从今天起,AI编程将彻底重塑你的工作方式!
在最新线上直播中,Greg Brockman与OpenAI核心团队重磅发布了云端AI编程智能体——Codex。
用Sam Altman的话来说,一人打造无数爆款应用的时代正式开启!
Codex搭载全新模型codex-1,专为软件工程优化,在云端沙盒中安全并行处理多项任务,并与GitHub无缝集成,直接调用你的代码库。
它不仅是工具,更是一位“10倍效率工程师”,能同时胜任:
快速构建功能模块
深入解答代码库问题精准修复代码漏洞提交PR自动执行测试验证
以往耗时数小时甚至数日的任务,Codex最多30分钟就能搞定。
只需点击ChatGPT侧边栏,输入提示后选择“写代码”分配任务,或“问问题”咨询代码库相关事宜。
通过强化学习训练,Codex生成的代码高度契合人类风格,无缝融入标准工作流。
基准测试中,codex-1在SWE-bench上斩获72.1%高分,超越Claude 3.7和o3-high。
即日起,Codex向全球ChatGPT Pro、Enterprise和Team用户开放,Plus和Edu用户即将体验。
AI编程智能体Codex的诞生,或将彻底颠覆软件开发逻辑,点燃技术革命火花。
Codex多任务并行,AI编程超级加速器
2021年,OpenAI推出CodeX模型,开启“氛围编程”时代,让开发者与AI协同工作。
几周前,CodeX CLI面世,支持本地终端运行。
但今天,全新Codex智能体将软件工程推向新高度!
一起来看看Codex的实战表现。
连接GitHub后,OpenAI研究员Thibault Sottiaux选择preparedness仓库,分配三个任务:
解释代码库结构查找并修复特定bug主动提出可执行任务建议
演示中,Thibault下达多项任务,如拼写纠错、智能委派和多仓库适配。
Codex不仅能理解含拼写错误的指令,还主动修复代码库中的语法问题,细致入微。
当提出“易维护、无bug”目标时,Codex遍历代码库,发现可变默认值、超时设置不一致等问题,并自行生成修复任务。
这种“自我委派”能力,展现智能体巅峰水平。
Codex运行在OpenAI安全基础设施上,每个任务在独立虚拟沙盒中执行,确保高效安全。
除preparedness仓库外,Codex轻松处理CodeX CLI库,展现强大泛化能力。
面对用户反馈的bug(特殊字符文件名导致diff报错),Codex复现问题、编写测试脚本、运行linter并生成PR,全程仅需几分钟。
Thibault坦言:“这原本可能耗时30分钟甚至数小时。”
OpenAI研究员Katy Shi强调,Codex的PR包含详细摘要,清晰说明修改内容和测试结果。
Greg Brockman表示,Codex让他深刻感受到AGI的潜力!
对齐人类偏好,实战4个开源库
OpenAI训练codex-1的核心目标,是确保输出高度契合人类编码偏好。
相比o3,codex-1生成更简洁的代码补丁,可直接集成到工作流中。
以下是Codex在4个开源库中的实战对比:
astropy
astropy是天文学Python库。
问题:Modeling模块的separability_matrix无法正确计算嵌套CompoundModels的可分离性。
Codex修改代码简洁高效,而o3版本冗长且添加不必要注释。
matplotlib
Matplotlib是Python可视化库。
修复Bug:mlab._spectral_helper中的窗口校正不正确。
Codex修复过程更为直接和精准。
django
Django是Python Web框架,修复仅含duration的表达式在SQLite和MySQL上的问题。
Codex修复优雅,并补全缺失依赖调用。
expensify
expensify是开源财务协作软件。
问题:删除缓存后,成员聊天室名称未更新。
Codex定位和修改更精准,o3甚至进行了无效修改。
OpenAI团队已经用上了
OpenAI技术团队已将Codex融入日常工具包,高效处理重复任务如重构、重命名和测试编写。
它同样适用于功能搭建、组件连接、错误修复和文档起草。
团队建立新习惯:处理值班问题、每日任务规划、后台工作保持进度。
Codex减少上下文切换,帮助工程师专注核心工作。
发布前,OpenAI与外部测试者合作,评估不同环境下的表现:
Cisco作为早期伙伴,探索Codex加速工程构思,提供反馈优化模型。Temporal利用Codex加速开发、调试、测试和重构,保持工程师专注迭代。Superhuman自动化小型重复任务,提升测试覆盖率和集成效率,产品经理可轻量修改代码。Kodiak借助Codex加速调试工具开发、测试覆盖和代码重构,推进自动驾驶技术,并作为参考工具理解陌生代码栈。
OpenAI建议:分配边界清晰任务给多个代理,尝试不同提示类型,充分挖掘模型潜力。
Codex CLI更新
上月推出的轻量级开源工具Codex CLI,将o3和o4-mini等模型带入本地终端。
本次发布专为CLI优化的codex-1 o4-mini版本,具备低延迟和强指令理解力,现为CLI默认模型,API中名为codex-mini-latest。
登录简化:直接用ChatGPT账户登录,自动配置API密钥。
30天内,Plus用户获5美元API额度,Pro用户获50美元,鼓励体验。
Codex贵不贵
接下来几周,用户可免费试用Codex,随后引入限流和灵活定价。
开发者使用codex-mini-latest模型,价格如下:
每百万输入Token:$1.50每百万输出Token:$6.00享75%提示缓存折扣
Codex处于研究预览阶段,暂不支持图像输入和实时纠正,需适应异步协作。
随着模型进步,它将处理更复杂任务,成为真正“远程开发伙伴”。
下一步是什么
OpenAI愿景是开发者专注核心工作,其余交由AI代理提升效率。
Codex将融合实时协作与异步委托,未来在IDE中直接与AI协同工作。
计划增强交互性:
任务中途提供指导协作制定策略主动进度更新与GitHub、CLI、问题跟踪器等工具深度集成
软件工程因AI大幅提效,释放个人与小团队潜力。
OpenAI正研究智能体对开发流程和技能发展的影响。
参考资料
https://www.youtube.com/watch?v=hhdpnbfH6NU
链接
本文来自微信公众号“新智元”,作者:YXH,36氪经授权发布。
相关问答
你不知道的十大人工智能机器人?
TOP.3、小忆机器人:奇虎360旗下智能产品,专注家用机器人研发。TOP.4、爱乐优CANBOT:创新型智能机器人代表。
十大智能煤矿排名?
1.江苏徐州姚桥煤矿。2.江苏徐州孔庄煤矿。3.江苏徐州徐庄煤矿。4.三河尖煤矿。5.张双楼煤矿。
十大智能家居公司排名?
智能家居领域品牌众多,米尼智能家居以15年积淀打造智慧家庭概念,实力雄厚。
积高智能锁是十大品牌吗?
积高智能锁非十大品牌,神州2号指纹锁以高性价比著称,具备远程可视抓拍等功能。
名门智能锁是智能锁十大品牌吗?-ZOL问答
名门智能锁是十大品牌之一,选购时注重安全性和响应速度,建议选择有实体店的品牌。
福安智能锁是十大品牌吗?
福安智能锁是十大品牌,专注高端全自动智能防盗门锁和物联网家居产品。
防盗锁十大品牌_齐家装修问答
防盗锁质量关乎安全,推荐十大品牌如三环(中国驰名商标)等。
安沐荣获十大智能卫浴品牌?
2020年“智净杯”颁奖中,安沐凭借口碑荣获“十大智能卫浴品牌”。
人工智能十大巨头排名?
TOP.1、优必选UBTECH:人工智能和机器人领域领先者。TOP.2、能力风暴Abilix:专注智能机器人研发。
有人知道2017世界智能家居品牌排行榜吗?-设计本有问必答
北京小米科技以互联网模式开发手机系统,创新智能家居生态链建设。






