GPT-5.5 неочікувано перевершив Claude Fable 5 у новому жорсткому тестуванні Agents’ Last Exam

Дослідники з Центру відповідального, децентралізованого інтелекту (RDI) Каліфорнійського університету в Берклі, разом із консультативним комітетом із понад 300 експертів у галузі, представили Agents’ Last Exam (ALE) — виснажливий новий еталон, розроблений для оцінки здатності штучного інтелекту виконувати економічно значущі професійні…








