
Компания Антропик протестовала в рамках эксперимента Project Deal алгоритмы фактически "вели торговлю" от имени людей, договаривались о покупке и продаже и заключали реальные сделки с оплатой.
К пилоту привлекли 69 сотрудников, которым выделили по $100 в виде подарочных сертификатов. Они покупали вещи друг у друга через агентов. В результате система обеспечила 186 транзакций, а общий объем сделок превысил $4 000.
Читайте такжеУменьшить "залипание" в смартфоне: какие инструменты есть для этого и насколько они эффективны
Эксперимент включал четыре отдельные среды с различными моделями ИИ. В одном случае использовали самую мощную модель компании, и все договоренности после завершения теста были выполнены. Другие варианты запускались как исследовательские, чтобы сравнить поведение агентов и эффективность различных подходов.
В Anthropic заметили, что более сильные модели давали лучшие результаты, но пользователи этого не осознавали. В то же время начальные инструкции почти не влияли ни на количество сделок, ни на цены.
Недавно Anthropic запустила тестирование модели Mythos для поиска уязвимостей в ПО. Claude Code и Cowork теперь могут открывать файлы на компьютере пользователя. А ИИ Claude Opus 4.6 нашел 22 уязвимости в Firefox всего за две недели.













