快科技12月21日消息,OpenAI连续12日圣诞发布终于迎来激动人心的大结局,OpenAI推出重磅收官新品,其迄今最强前沿推理模型的升级版——o3。
OpenAI号称o3在一些条件下接近通用人工智能(AGI),共有o3和精简版o3-mini两个版本。
评估显示,o3在软件工程测试中准确率比o1高近47%,竞赛数学测评的准确率比o1高15%,人类博士专家级生化物测试中准确率比o1高近13%。
AGI相关测试中,o3最佳成绩87.5,超过人类水平门槛85,显示迈向类人智能取得突破。
对比之下,GPT-3的评测结果为0%,GPT-4o为5%,而o3一举将成绩提升到87.5%。
OpenAI计划明年初发布o3系列模型,CEO Altman暗示可能一段时间内都不会面向大众上线这类模型,称希望正式发布前,先有一个联邦政府的测试框架,指导监控并减少这类模型的风险。
从本周五开始,OpenAI允许安全研究人员可以注册访问o3 和 o3-mini的预览。
1、推出满血版推理模型o1和ChatGPT Pro(每月订阅费200美元)。
4、发布升级版Canvas创作助手,主打高效编程与写作,向全量用户开放。
8、ChatGPT搜索功能全面升级,新增地图集成、实时搜索等功能,向所有用户开放。
10、ChatGPT入驻手机,拨打免费号码连接聊天机器人,每月可免费通线、支持原生应用程序自动化协作功能,与AI Agent玩法相似,能够主动理解用户需求。
12、o1下一代模型o3亮相,推出两个版本,正式版o3以及精简版o3-mini。
川菜外卖店店员被指后厨小便;店方称系水管冲水店员查看,已报警;济南市监部门:已关注,正核实
英媒:曼联夏窗签奥斯梅恩已完成95%,加纳乔+霍伊伦均不会被纳入该交易
续命16-0!森林狼加时25分逆转雷霆 亚历山大39+10+8丢绝平三分
大帝缺战,西帝被打爆!保罗乔治19+2+2+2+2,76人人见人欺八连败
中国年度最畅销折叠屏手机榜单:华为Mate X5独占28.1% 遥遥领先
谷歌 Pixel 9a 真机上手:药丸状双摄、类诺基亚 Lumia 塑料材质