Антропический Клод 4 Обзор: творческий гений, пойманный в ловушку старыми ограничениями

Антропический базирующаяся в Сан-Франциско только что сбросил четвертое поколение своих моделей Claude AI, и результаты … сложные. В то время как Google продвигает контекстные окна в течение миллиона токенов, а Openai строит мультимодальные системы, которые видят, слышат и говорят, антропический застрял с тем же ограничением 200 000 точек и подходом только для текста. Сейчас это странный среди крупных компаний искусственного интеллекта.

Время кажется преднамеренным — Google объявил Gspanini на этой неделе, и Openai обнародовал нового агента кодирования на основе своей проприетарной модели кодекса. Ответ Клода? Гибридные модели, которые меняются между режимами рассуждений и неправозобления, в зависимости от того, что вы бросаете в них,-отдавая то, что Openai ожидает, когда они будут выпускать GPT-5.

Но вот кое -что для пользователей API, чтобы серьезно рассмотреть: Anpropic взимает премиальные цены за это обновление.

Изображение: T3.GG

Приложение Chatbot, однако, остается прежним в 20 долларов с Claude Max по цене 200 долларов в месяц, а на 20 раз больше ограничений на использование.

Мы разместили новые модели через их шаги по творческому письму, кодированию, математике и рассуждениям. Результаты рассказывают интересную историю с незначительными улучшениями в некоторых областях, удивительным улучшением в других и явным сдвигом в приоритетах Антропика от общего использования в отношении функций, ориентированных на разработчиков.

Вот как и Claude Sonnet 4, и Claude Opus 4 выполнялись в наших различных тестах. (Вы можете проверить их, включая наши подсказки и результаты, в нашем репозитории GitHub.)

Творческое письмо

Творческие возможности письма определяют, могут ли модели искусственного интеллекта создавать привлекательные повествования, поддерживать постоянный тон и естественным образом интегрировать фактические элементы. Эти навыки имеют значение для создателей контента, маркетологов и всех, кто нуждается в помощи ИИ с рассказыванием историй или убедительным письмом.

На данный момент нет модели, которая бы не может победить Клода в этом субъективном тесте (конечно, не рассматривая, что не рассматривает Longwriter). Поэтому не имеет смысла сравнивать Клода с сторонними вариантами. Для этой задачи мы решили поставить сонет и опус лицом к лицу.

Мы попросили модели написать рассказ о человеке, который путешествует во времени, чтобы предотвратить катастрофу, но в конечном итоге понимает, что их действия из прошлого на самом деле были частью событий, которые заставили существование, склоняться к этому конкретному будущему. Подсказка добавила некоторые детали для рассмотрения и дала моделям достаточно свободы и творчества, чтобы настроить историю, которая считает нужным.

Claude Sonnet 4 создал яркую прозу с лучшими атмосферными деталями и психологическими нюансами. Модель создала захватывающие описания и предоставила убедительную историю, хотя окончание было не совсем так, как спросили, но она соответствовала повествованию и ожидаемому результату.

В целом, повествовательное строительство Сонета сбалансировало действие, самоанализ и философское понимание исторической неизбежности.

Оценка: 9/10—Доконечно лучше, чем Claude 3.7 Сонет

Claude Opus 4 основал свою спекулятивную фантастику в достоверных исторических контекстах, ссылаясь на мировоззрение коренных народов и доколониальное общество Тупи, с тщательным вниманием к культурным ограничениям. Модель интегрированного исходного материала естественным образом и дала более длинную историю, чем сонет, без возможности соответствовать его поэтическому таланту, к сожалению.

Это также показало интересную вещь: повествование началось намного более ярко и было более захватывающим, чем предоставление сонета, но где -то в середине он сместился, чтобы спешить с поворотом сюжета, что сделало весь результат скучным и предсказуемым.

Оценка: 8/10

Сонет 4 является победителем творческого письма, хотя маржа оставалась узкой. Писатели, будьте осторожны: в отличие от предыдущих моделей, кажется, что Anpropic не приоритет приоритетам для творческих улучшений письма, фокусируя усилия по разработке в других местах.

Все истории доступны здесь.

Кодирование

Оценка кодирования измеряет, может ли ИИ генерировать функциональное, поддерживаемое программное обеспечение, которое следует за лучшими практиками. Эта возможность влияет на разработчиков, используя ИИ для генерации кода, отладки и архитектурных решений.

Gspanini 2.5 Pro считается королем кодирования на основе AI, поэтому мы проверили его против Claude Opus 4 с расширенным мышлением.

Мы не выпускаем наши инструкции для игры-робота, который должен избегать журналистов на пути к слиянию с компьютером и достигать AGI-и использовал одну дополнительную итерацию, чтобы исправить ошибки и прояснить различные аспекты игры.

Claude Opus создал игру «невидимс» сверху вниз со сложной механикой, включая динамические звуковые волны, следственные состояния искусственного интеллекта и окклюзию конуса зрения. В реализации были представлены богатые элементы игрового процесса: журналисты отвечали на звуки через флаги Heardsound, препятствия, заблокированные расчеты линии зрения, а процедурное поколение создало уникальные уровни каждый прохождение.

Оценка: 8/10

Gspanini’s Gspanini создал платформер с боковой прокруткой с более чистой архитектурой, используя классы ES6 и названные константы.

Игра не была функциональной после двух итераций, но реализация эффективно разделяла опасения: level.init () обрабатывал генерацию местности, инкапсулированный патрульный класс журналиста и константы, такие как Player_jump_power, включенная легкая настройка. В то время как геймплей оставался проще, чем версия Клода, поддерживаемая структура и последовательные стандарты кодирования получили особенно высокие оценки для читаемости и обслуживаемости.

Вердикт: Claude Wan: он обеспечил превосходную функциональность игрового процесса, которую пользователи предпочли бы.

Тем не менее, разработчики могут предпочесть Близнецы, несмотря на все это, поскольку он создал более чистый код, который можно легче улучшить.

Наша подсказка и коды доступны здесь. И вы можете нажать здесь, чтобы сыграть в игру, сгенерированную с Клодом.

Математические рассуждения

Математические тесты по решению проблем, способствующие обработке сложных вычислений, показывают шаги рассуждения и приобретают правильные ответы. Это имеет значение для образовательных приложений, научных исследований и любой области, требующей точного вычислительного мышления.

Мы сравнили последнюю модель рассуждений Claude и Openai, O3, попросив модели решить проблему, которая появилась на эталоне FrontierMath, разработанной специально для решения моделей:

«Построить степень 19 Полиномиал P (x) ∈ C[x] Такое, что x: = {p (x) = p (y)} ⊂ P1 × P1 имеет не менее 3 (но не все линейные) непревзойденные компоненты по сравнению с C. Выберите p (x), чтобы быть нечетным, монический, иметь реальные коэффициенты и линейный коэффициент -19 и рассчитать p (19) ».

Claude Opus 4 показал свой полный процесс рассуждения при решении сложных математических проблем. Прозрачность позволила оценщикам отслеживать логические пути и определить, где вычисления пошли не так. Несмотря на показ всей работы, модель не смогла достичь идеальной точности.

Модель O3 O3 достигла 100% точности при идентичных математических задачах, отметив первый раз, когда любая модель полностью решила задачи тестирования. Тем не менее, O3 усел свой рассуждение, показывая только окончательные ответы без промежуточных шагов. Этот подход предотвратил анализ ошибок и сделал невозможным для пользователей проверить логику или учиться на процессе решения.

Вердикт: Openai O3 выиграл категорию математических рассуждений через идеальную точность, хотя прозрачный подход Клода предлагал образовательные преимущества. Например, исследователям может быть легче уловить сбои при анализе полной цепочки мышления, вместо того, чтобы либо полностью доверять модели, либо решить проблему вручную, чтобы подтвердить результаты.

Вы можете проверить здесь цепь мысли Клода 4.

Нематематические рассуждения и общение

Для этой оценки мы хотели проверить способность моделей понимать сложности, ремесленные нюансы и баланс интересов. Эти навыки оказываются важными для бизнес -стратегии, связей с общественностью и любого сценария, требующего сложного человеческого общения.

Мы дали инструкции Claude, Grok и CHATGPT создать единую стратегию связи, которая одновременно обращается к пять различных групп заинтересованных сторон о критической ситуации в большом медицинском центре. Каждая группа имеет совершенно разные перспективы, эмоциональные состояния, информационные потребности и предпочтения в общении.

Клод продемонстрировал исключительное стратегическое мышление с помощью трехслойного обмена сообщениями для больничного кризиса вымогателей: сначала безопасность пациентов, активный ответ и более сильное будущее. Ответ включал в себя конкретное распределение ресурсов в размере 2,3 млн. Долл. США, подробные сроки для каждой группы заинтересованных сторон и культурно чувствительные адаптации для многоязычных групп населения. Индивидуальные проблемы членов совета получили приспособленное внимание при сохранении согласованности сообщений. Модель предоставила хороший набор открывающих заявлений, чтобы получить представление о том, как подходить к каждой аудитории.

Chatgpt также был хорош в задаче, но не на том же уровне детализации и практичности. Предоставляя твердые рамки с четкими основными принципами, GPT4.1 больше полагался на вариацию тона, чем адаптацию существенного контента. Ответы были обширными и подробными, ожидая вопросов и настроений, и как наши действия могут повлиять на те, которые рассматриваются. Тем не менее, ему не хватало конкретных распределений ресурсов, подробных результатов и других деталей, которые предоставил Клод.

Вердикт: Клод побеждает

Вы можете проверить результаты и цепочку мышления для каждой модели, здесь.

Иглы в стоге сена

Возможности поиска контекста определяют, насколько эффективно модели ИИ могут найти конкретную информацию в длинных документах или разговорах. Этот навык оказался критически важным для юридических исследований, анализа документов, обзоров академической литературы и любого сценария, требующего точного извлечения информации из больших текстовых томов.

Мы проверили способность Клода идентифицировать конкретную информацию, похороненную в постепенно более крупных контекстных окнах, используя стандартную методологию «иглы в сена». Эта оценка включала в себя размещение целевой части информации в различных позициях в документах различной длины и измерения точности поиска.

Claude Sonnet 4 и Opus 4 успешно идентифицировали иглу, когда встроены в сено -сток с токеном 85 000. Модели продемонстрировали надежные возможности поиска в разных позициях размещения в этом диапазоне контекста, сохраняя точность, появилась ли целевая информация в начале, среднем или конце документа. Качество ответа оставалось последовательным, причем модель предоставила точные цитаты и соответствующий контекст вокруг полученной информации.

Тем не менее, производительность моделей достигла жесткого ограничения при попытке обработать 200 000 токенов. Они не могли завершить эту оценку, поскольку размер документа превысил их максимальную емкость окна контекста 200 000 токенов. Это значительное ограничение по сравнению с конкурентами, такими как Google Gspanini, которые обрабатывают контекстные окна, превышающие один миллион токенов, и модели OpenAI с значительно большими возможностями обработки.

Это ограничение имеет практические последствия для пользователей, работающих с обширной документацией. Специалисты по юристам, анализирующие длительные контракты, исследователи обрабатывают комплексные академические документы, или аналитики, рассматривающие подробные финансовые отчеты, могут обнаружить проблемы контекста Клода. Неспособность обработать полный тест на 200 000 токенов предполагает, что реальные документы, приближающиеся к этому размеру, могут вызвать усечение или потребовать ручной сегментации.

Вердикт: Близнецы — лучшая модель для длинных контекстных задач

Вы можете проверить как потребность, так и сток сена, здесь.



Заключение

Клод 4 великолепен и лучше, чем когда -либо, но это не для всех.

Пользователи энергетики, которые нуждаются в его творчестве и возможностях кодирования, будут очень довольны. Его понимание человеческой динамики также делает его идеальным для бизнес-стратегов, специалистов по коммуникациям и всем, кто нуждается в сложном анализе сценариев с несколькими заинтересованными лицами. Процесс прозрачного рассуждения модели также приносит пользу преподавателям и исследователям, которым необходимо понять пути принятия решений искусственным интеллектом.

Тем не менее, начинающие пользователи, желающие полного опыта ИИ, могут найти чат -бот немного тусклым. Он не генерирует видео, вы не можете с ним разговаривать, и интерфейс менее отполирован, чем то, что вы можете найти в Gspanini или CHATGPT.

Ограничение окна токена 200 000 токенов влияет на то, что пользователи CLAUDE обрабатывают длительные документы или поддержали расширенные разговоры, а также реализуют очень строгую квоту, которая может повлиять на пользователи, ожидающие долгих сессий.

По нашему мнению, это солидный «да» для творческих писателей и кодеров. Другие типы пользователей могут потребоваться некоторое рассмотрение, сравнивая плюсы и минусы с альтернативами.

Под редакцией Эндрю Хейворда

Децентрализованный ИИ и будущее Web3: эксклюзивное интервью DFINITY в интернет -компьютере
Sui Foundation остается нейтральным, так как Hack Recovery 162 млн.

Похожие посты

Пакетные услуги

  • ГосподдержкаМатеринский капиталОнлайн решениеСрочное решение
    Подробнее
    АО «Альфа-Банк»
    Ипотека «Семейная на строительство дома» | АО «Альфа-Банк»

    Сумма:

    600 000 ₽ - 30 млн. ₽

    Ставка:

    от 6%

    Срок ипотеки:

    3 - 30 лет

    Первый взнос:

    от 20,1%

    ПСК:

    23,534 - 34,326 %

    Описание компании: АО «Альфа-Банк» — один из крупнейших универсальных банков России, с более чем 30-летней историей деятельности и обширной сетью отделений по всей стране, включающей свыше 500 офисов и дистанционных сервисов.

    Банк отличается высокой степенью цифровизации, устойчивыми финансовыми показателями, поддержкой со стороны государства и сильными позициями в рейтингах надежности, что делает его значимым игроком на российском ипотечном рынке.

    Актуальные тарифы: по программе «Семейная ипотека на строительство дома» предлагается кредитная ставка от 6% годовых, сумма займа — от 600 000 до 30 000 000 рублей, срок кредитования — от 3 до 30 лет, а минимальный первоначальный взнос составляет 20,1%.

    Полная стоимость кредита (ПСК) варьируется от 23,534% до 34,326% годовых в зависимости от условий страхования и параметров заемщика.

    Условия: семейная ипотека доступна при строительстве частного дома на собственном земельном участке или с одновременным приобретением земли под застройку, при этом объект должен соответствовать требованиям ИЖС и быть отдельно стоящим зданием до 3 этажей и высотой не выше 20 метров.

    Ипотека оформляется под залог приобретаемого жилья или участка, а участие в государственной программе субсидирования позволяет получить льготную ставку при соблюдении всех критериев.

    Опции: допускается использование материнского капитала для первоначального взноса или досрочного погашения кредита, возможна опция досрочного погашения без штрафов, а также подключение страхования жизни, имущества и титула на добровольной основе с возможным снижением ставки.

    Программа поддерживает участие индивидуальных предпринимателей и самозанятых, при условии подтвержденной деятельности от 18 месяцев, а также допускает до трёх созаёмщиков с возможностью оформления долевой собственности.

    Требования: минимальный возраст заемщика — 21 год, максимальный — до 75 лет на момент полного погашения кредита, обязательным условием является гражданство Российской Федерации, постоянная или временная регистрация не требуется, а подтверждение дохода может быть предоставлено не только по форме 2-НДФЛ, но и в альтернативной банковской форме.

    Рабочий стаж должен составлять не менее 4 месяцев на текущем месте для наемных работников и от 18 месяцев для ИП; при этом допускаются различные формы занятости, включая официальную, предпринимательскую и самозанятость.

    Документы: для подачи заявки потребуется паспорт гражданина РФ, СНИЛС, справка о доходах, документы по объекту строительства (договор подряда, выписка из ЕГРН, проект строительства), правоустанавливающие документы на земельный участок и согласование от местной администрации.

    Банк принимает объекты с аккредитованными подрядчиками, а типы строительных материалов должны соответствовать требованиям: кирпич, бетон, газоблок, клееный брус, каркас, СИП-панели и другие варианты по согласованию.

    Подача заявки: осуществляется онлайн или в отделении банка, предварительное решение выдается моментально в течение одной минуты, а финальное решение принимается в срок от одного до трёх рабочих дней после предоставления полного пакета документов.

    Процесс подачи полностью цифровизирован, клиент получает статус рассмотрения через интернет-банк, что существенно ускоряет оформление и снижает бюрократическую нагрузку.

    Средняя оценка по программе «Семейная ипотека на строительство дома» от Альфа-Банк составляет 4,7 из 5 звезд благодаря стабильности банка, выгодным ставкам от 6% и возможности кредитования на сумму до 30 млн рублей при гибких условиях и участии в государственной программе.

  • Досрочное закрытиеБез капитализацииБез пополненияБез снятия
    Подробнее
    Вклад «Максимальный доход: в юанях» | ПАО АКБ «Металлинвестбанк»

    Сумма:

    3 000 ¥ - 10 млн. ¥

    Ставка:

    до 3,5 %

    Срок вклада:

    91 - 1100 дней

    Выплата процентов:

    в конце срока

    Капитализация:

    нет

    Описание компании: ПАО АКБ «Металлинвестбанк» является устойчивым финансовым институтом, работающим на российском рынке более двух десятилетий, обладающим лицензией № 2440 Центрального банка РФ и предлагающим широкий спектр услуг для физических и юридических лиц, включая валютные вклады, кредитные продукты и расчетные операции.

    Актуальные тарифы: Вклад «Максимальный доход: в юанях» предусматривает фиксированную процентную ставку до 3,5 % годовых, срок размещения от 91 до 1100 дней, минимальную сумму открытия 3 000 ¥ и максимальный лимит 10 000 000 ¥, что делает продукт доступным как для частных инвесторов, так и для клиентов, ориентированных на крупные вложения.

    Условия: Проценты начисляются со дня открытия вклада и выплачиваются в конце срока без капитализации, пролонгация осуществляется автоматически по действующим ставкам, а досрочное расторжение возможно на условиях сниженной доходности, что обеспечивает прозрачность и предсказуемость финансового результата.

    Опции: Вклад можно открыть онлайн через интернет-банк или мобильное приложение, а также в офисе банка, предусмотрена возможность перевода средств через Систему быстрых платежей, доступен личный кабинет для управления вкладом и круглосуточная техническая поддержка по телефону и в чате.

    Требования: Открытие вклада возможно для резидентов РФ старше 18 лет, минимальный неснижаемый остаток равен всей сумме вклада, пополнение и частичное снятие не предусмотрены, ставка фиксируется на весь срок, а операции проводятся исключительно в китайских юанях.

    Документы: Для открытия вклада требуется паспорт гражданина РФ, процедура занимает несколько минут при онлайн-оформлении, подтверждение осуществляется через SMS, email или выписку, а при необходимости доступ к договору можно восстановить через службу поддержки.

    Подача заявки: Клиент может оформить вклад дистанционно через интернет-банк или мобильное приложение, либо лично в офисе, при этом процесс открытия полностью автоматизирован, уведомления о состоянии вклада поступают через SMS, email или push-уведомления, что обеспечивает удобство и контроль над финансовыми операциями.

    Средний рейтинг: 4,3 звезды из 5, что объясняется высокой надежностью банка, прозрачными условиями продукта и удобными цифровыми сервисами, при этом часть клиентов отмечает ограниченные возможности по пополнению и снятию средств.

  • Онлайн решениеСрочное решение
    Подробнее
    Ипотека «Покупка нежилой недвижимости» | АО «Россельхозбанк»

    Сумма:

    до 30 млн. ₽

    Ставка:

    19,2% - 20,2 %

    Срок ипотеки:

    до 15 лет

    Первый взнос:

    от 20%

    ПСК:

    19,917 % - 25,938 %

    Описание компании: АО «Россельхозбанк» — универсальный государственный банк, стабильно работающий на финансовом рынке России более 20 лет, входит в топ крупнейших банков страны по объему активов, размеру кредитного портфеля и широте региональной сети.

    Основной фокус банка направлен на развитие сельского хозяйства и региональной экономики, при этом активно развиваются ипотечные и инвестиционные продукты, включая кредитование на покупку нежилой недвижимости, рассчитанное на физических лиц, индивидуальных предпринимателей и бизнес-сегмент.

    Актуальные тарифы: ставка по ипотеке на покупку нежилой недвижимости в Россельхозбанке составляет от 19,2% до 20,2% годовых в зависимости от наличия добровольного страхования жизни, при этом полная стоимость кредита (ПСК) варьируется от 19,917% до 25,938% годовых.

    Максимальная сумма кредита — до 30 млн рублей (до 4 млн для кладовых и машино-мест), срок до 15 лет, минимальный первоначальный взнос от 20% (от 40% при покупке кладовых или машино-мест).

    Условия ипотечного кредитования: приобретаемая недвижимость должна быть капитальным строением без обременений, расположенным в Москве, Московской области или Санкт-Петербурге на цокольных, первых или вторых этажах многоквартирных домов.

    Для машино-мест и кладовок допустимо расположение в многоэтажных домах или гаражных комплексах, объект оформляется в залог, также допускается дополнительное обеспечение в виде участка или другой недвижимости.

    Опции ипотечной программы: доступны аннуитетные платежи, полное или частичное досрочное погашение без комиссий в дату очередного платежа, выбор страхования жизни влияет на ставку, имущественное страхование обязательно.

    Программа подходит для индивидуальных предпринимателей, самозанятых, владельцев ЛПХ, а также официально трудоустроенных топ-менеджеров.

    Требования к заемщику: возраст от 21 до 65 лет к моменту полного погашения кредита, при этом возможен срок до 75 лет при условии, что к 65-летию заемщик погасит не менее половины срока кредита.

    Объект и заемщик должны находиться в одном регионе присутствия банка, допускается до 3 созаёмщиков, супруг автоматически становится со-заёмщиком, при наличии брачного договора возможно его исключение из сделки.

    Необходимые документы: для граждан, ведущих личное подсобное хозяйство, требуется запись в похозяйственной книге, срок ведения ЛПХ — не менее 12 месяцев, для наёмных работников — стаж от 3 месяцев на текущем месте и не менее 1 года общего за последние 5 лет.

    Работающим пенсионерам, получающим пенсию через банк, требуется подтверждение стажа от 3 месяцев.

    Подача заявки: осуществляется как онлайн, так и через офисы и партнёров банка, срок рассмотрения заявки — до 5 рабочих дней.

    Решение по заявке действительно 90 дней на подбор объекта и 85 дней на заключение договора после оценки объекта недвижимости, комиссия за выдачу кредита отсутствует.

    Средний рейтинг услуги и компании составляет 4,6 из 5, что объясняется стабильной работой банка на рынке, широкими возможностями по привлечению со-заёмщиков, прозрачными условиями и надёжностью государственного финансового учреждения.

Закрыть
Категории
Закрыть Моя корзина
Закрыть Список пожеланий
Закрыть Просмотренные услуги
Закрыть
Сравнить Условия (0 Вар.)
 Сравнить продукт
 Сравнить продукт
 Сравнить продукт
 Сравнить продукт
 Сравнить продукт
 Сравнить продукт
Закрыть
Категории