Компания Anthropic анонсировала новый релиз своей мощной модели — Claude Opus 4.8. Эта версия привлекает внимание не только высокой производительностью, но и акцентом на честность в работе с кодом. В данной статье мы рассмотрим основные изменения, которые произошли с моделью, ее преимущества и новые функции, а также то, как это повлияет на пользователей.
Ключевые изменения в Claude Opus 4.8
- Увеличение производительности:
- Claude Opus 4.8 демонстрирует более быстрые результаты по сравнению с предыдущими версиями.
- В сравнительных тестах модель показала улучшенные показатели: 69,2% в SWE-Bench Pro против 64,3% у версии 4.7.
- Сохранение стоимости:
- Новая модель доступна по прежним ценам: $5 за 1 миллион входящих токенов и $25 за исходящие.
- Это делает её доступной для широкого круга пользователей.
Честность и надежность
- Улучшенная честность:
- Claude Opus 4.8 реже скрывает ошибки в коде — в четыре раза по сравнению с предыдущей версией.
- Модель менее склонна к неподтвержденным утверждениям, что повышает её надежность.
- Сравнение с конкурентами:
- Хотя модель уступает GPT-5.5 в тесте Terminal-Bench 2.1, она опережает её в других областях.
- «Мы протестировали модель на наборе тестов по кибербезопасности», — заявили разработчики.
Новые функции и возможности
- Dynamic Workflows:
- Новая функция позволяет модели разделять задачи на подзадачи для более эффективного выполнения.
- Результаты будут проверены перед окончательной выдачей, что повышает качество ответов.
- Настройка вычислительных ресурсов:
- Пользователи могут выбирать объем вычислений от Low до Max, что влияет на глубину ответов и затраты токенов.
- «Режим Fast Mode стал дешевле», — утверждают разработчики.
Перспективы развития и подготовка к IPO
Aнтропик готовится к первичному публичному размещению (IPO), что создает дополнительные возможности для роста компании. Привлеченные средства на сумму $65 миллиардов будут направлены на расширение вычислительных мощностей и масштабирование бизнеса. Это создаст еще более жесткую конкурентную среду между Anthropic и другими крупными игроками на рынке ИИ.
В заключение, Claude Opus 4.8 демонстрирует значительные улучшения в производительности и честности по сравнению с предыдущими версиями, предоставляя пользователям новые возможности для работы с ИИ.