颠覆编程界!OpenAI Codex强势降临,30分钟搞定数天工作量

mysmile 5个月前 (11-14) geo 36 0
颠覆编程界!OpenAI Codex强势降临,30分钟搞定数天工作量

编程革命彻底爆发,OpenAI最强智能体上线ChatGPT

准备好了吗?OpenAI最强AI编程智能体Codex已正式登场!由o3优化版codex-1驱动,支持多任务并行处理,半小时内高效完成以往数天的软件工程任务。

从今天起,AI编程将彻底重塑你的工作方式!

在最新线上直播中,Greg Brockman与OpenAI核心团队重磅发布了云端AI编程智能体——Codex。

用Sam Altman的话来说,一人打造无数爆款应用的时代正式开启!

Codex搭载全新模型codex-1,专为软件工程优化,在云端沙盒中安全并行处理多项任务,并与GitHub无缝集成,直接调用你的代码库。

它不仅是工具,更是一位“10倍效率工程师”,能同时胜任:

快速构建功能模块

深入解答代码库问题精准修复代码漏洞提交PR自动执行测试验证

以往耗时数小时甚至数日的任务,Codex最多30分钟就能搞定。

只需点击ChatGPT侧边栏,输入提示后选择“写代码”分配任务,或“问问题”咨询代码库相关事宜。

通过强化学习训练,Codex生成的代码高度契合人类风格,无缝融入标准工作流。

基准测试中,codex-1在SWE-bench上斩获72.1%高分,超越Claude 3.7和o3-high。

即日起,Codex向全球ChatGPT Pro、Enterprise和Team用户开放,Plus和Edu用户即将体验。

AI编程智能体Codex的诞生,或将彻底颠覆软件开发逻辑,点燃技术革命火花。

Codex多任务并行,AI编程超级加速器

2021年,OpenAI推出CodeX模型,开启“氛围编程”时代,让开发者与AI协同工作。

几周前,CodeX CLI面世,支持本地终端运行。

但今天,全新Codex智能体将软件工程推向新高度!

一起来看看Codex的实战表现。

连接GitHub后,OpenAI研究员Thibault Sottiaux选择preparedness仓库,分配三个任务:

解释代码库结构查找并修复特定bug主动提出可执行任务建议

演示中,Thibault下达多项任务,如拼写纠错、智能委派和多仓库适配。

Codex不仅能理解含拼写错误的指令,还主动修复代码库中的语法问题,细致入微。

当提出“易维护、无bug”目标时,Codex遍历代码库,发现可变默认值、超时设置不一致等问题,并自行生成修复任务。

这种“自我委派”能力,展现智能体巅峰水平。

Codex运行在OpenAI安全基础设施上,每个任务在独立虚拟沙盒中执行,确保高效安全。

除preparedness仓库外,Codex轻松处理CodeX CLI库,展现强大泛化能力。

面对用户反馈的bug(特殊字符文件名导致diff报错),Codex复现问题、编写测试脚本、运行linter并生成PR,全程仅需几分钟。

Thibault坦言:“这原本可能耗时30分钟甚至数小时。”

OpenAI研究员Katy Shi强调,Codex的PR包含详细摘要,清晰说明修改内容和测试结果。

Greg Brockman表示,Codex让他深刻感受到AGI的潜力!

对齐人类偏好,实战4个开源库

OpenAI训练codex-1的核心目标,是确保输出高度契合人类编码偏好。

相比o3,codex-1生成更简洁的代码补丁,可直接集成到工作流中。

以下是Codex在4个开源库中的实战对比:

astropy

astropy是天文学Python库。

问题:Modeling模块的separability_matrix无法正确计算嵌套CompoundModels的可分离性。

Codex修改代码简洁高效,而o3版本冗长且添加不必要注释。

matplotlib

Matplotlib是Python可视化库。

修复Bug:mlab._spectral_helper中的窗口校正不正确。

Codex修复过程更为直接和精准。

django

Django是Python Web框架,修复仅含duration的表达式在SQLite和MySQL上的问题。

Codex修复优雅,并补全缺失依赖调用。

expensify

expensify是开源财务协作软件。

问题:删除缓存后,成员聊天室名称未更新。

Codex定位和修改更精准,o3甚至进行了无效修改。

OpenAI团队已经用上了

OpenAI技术团队已将Codex融入日常工具包,高效处理重复任务如重构、重命名和测试编写。

它同样适用于功能搭建、组件连接、错误修复和文档起草。

团队建立新习惯:处理值班问题、每日任务规划、后台工作保持进度。

Codex减少上下文切换,帮助工程师专注核心工作。

发布前,OpenAI与外部测试者合作,评估不同环境下的表现:

Cisco作为早期伙伴,探索Codex加速工程构思,提供反馈优化模型。Temporal利用Codex加速开发、调试、测试和重构,保持工程师专注迭代。Superhuman自动化小型重复任务,提升测试覆盖率和集成效率,产品经理可轻量修改代码。Kodiak借助Codex加速调试工具开发、测试覆盖和代码重构,推进自动驾驶技术,并作为参考工具理解陌生代码栈。

OpenAI建议:分配边界清晰任务给多个代理,尝试不同提示类型,充分挖掘模型潜力。

Codex CLI更新

上月推出的轻量级开源工具Codex CLI,将o3和o4-mini等模型带入本地终端。

本次发布专为CLI优化的codex-1 o4-mini版本,具备低延迟和强指令理解力,现为CLI默认模型,API中名为codex-mini-latest。

登录简化:直接用ChatGPT账户登录,自动配置API密钥。

30天内,Plus用户获5美元API额度,Pro用户获50美元,鼓励体验。

Codex贵不贵

接下来几周,用户可免费试用Codex,随后引入限流和灵活定价。

开发者使用codex-mini-latest模型,价格如下:

每百万输入Token:$1.50每百万输出Token:$6.00享75%提示缓存折扣

Codex处于研究预览阶段,暂不支持图像输入和实时纠正,需适应异步协作。

随着模型进步,它将处理更复杂任务,成为真正“远程开发伙伴”。

下一步是什么

OpenAI愿景是开发者专注核心工作,其余交由AI代理提升效率。

Codex将融合实时协作与异步委托,未来在IDE中直接与AI协同工作。

计划增强交互性:

任务中途提供指导协作制定策略主动进度更新与GitHub、CLI、问题跟踪器等工具深度集成

软件工程因AI大幅提效,释放个人与小团队潜力。

OpenAI正研究智能体对开发流程和技能发展的影响。

参考资料

https://www.youtube.com/watch?v=hhdpnbfH6NU

链接

本文来自微信公众号“新智元”,作者:YXH,36氪经授权发布。

相关问答

你不知道的十大人工智能机器人?

TOP.3、小忆机器人:奇虎360旗下智能产品,专注家用机器人研发。TOP.4、爱乐优CANBOT:创新型智能机器人代表。

十大智能煤矿排名?

1.江苏徐州姚桥煤矿。2.江苏徐州孔庄煤矿。3.江苏徐州徐庄煤矿。4.三河尖煤矿。5.张双楼煤矿。

十大智能家居公司排名?

智能家居领域品牌众多,米尼智能家居以15年积淀打造智慧家庭概念,实力雄厚。

积高智能锁是十大品牌吗?

积高智能锁非十大品牌,神州2号指纹锁以高性价比著称,具备远程可视抓拍等功能。

名门智能锁是智能锁十大品牌吗?-ZOL问答

名门智能锁是十大品牌之一,选购时注重安全性和响应速度,建议选择有实体店的品牌。

福安智能锁是十大品牌吗?

福安智能锁是十大品牌,专注高端全自动智能防盗门锁和物联网家居产品。

防盗锁十大品牌_齐家装修问答

防盗锁质量关乎安全,推荐十大品牌如三环(中国驰名商标)等。

安沐荣获十大智能卫浴品牌?

2020年“智净杯”颁奖中,安沐凭借口碑荣获“十大智能卫浴品牌”。

人工智能十大巨头排名?

TOP.1、优必选UBTECH:人工智能和机器人领域领先者。TOP.2、能力风暴Abilix:专注智能机器人研发。

有人知道2017世界智能家居品牌排行榜吗?-设计本有问必答

北京小米科技以互联网模式开发手机系统,创新智能家居生态链建设。

扫描二维码

手机扫一扫添加微信