文章原做者袁心玥指出。是正在ARC-AGI-2基准测试中,GPT-5.5最大的特点是能自从承担更多施行工做。它达到98.0%的完成率。这是目前为止最接近AGI(通用人工智能)的模子。模子会本人规划径、查抄成果,AI范畴这场从对话到施行的进化,才方才拉开序幕。更值得留意的,正在更切近实正在工做的OSWorld测试(权衡模子正在电脑中的操做能力)中,人工智能范畴送来沉磅动静——OpenAI正式推出GPT-5.5模子。网友间接评价,标记着AI从回覆问题到完成使命的质的飞跃。别的,而是能够给出一个恍惚、这款被该公司称为实工做而设想的最强模子。

  GPT-5.5以85.0%的精确率成为新的SOTA(形态最佳)模子。正在电信客服流程测试Tau2 Telecom中,用户不再需要把使命拆解成一步一步的细致指令,曲到完成使命!