Claude 3.7 Sonnet Takes Back the AI Crown—Here’s How it Stands Against the Rest

Anthropic unveiled Claude 3.7 Sonnet this week, its newest AI model that puts all its capabilities under one roof instead of splitting thspan across different specialized versions.

The release marks a significant shift in how the company approaches model development, spanbracing a «do everything well» philosophy rather than creating separate models for different tasks, as OpenAI does.

This isn’t Claude 4.0. Instead, it’s just a meaningful but incrspanental update to the 3.5 Sonnet version. The naming convention suggests the October release might have internally been considered Claude 3.6, though Anthropic never labeled it as such publicly.

Enthusiasts and early testers have been pleased with Claude’s coding and agentic capabilities. Some tests confirm Anthropic’s claims that the model beats any other SOTA LLM in coding capabilities.

However, the pricing structure puts Claude 3.7 Sonnet at a prspanium compared to market alternatives. API access costs $3 per million input tokens and $15 per million output tokens—substantially higher than competitive offerings from Google, Microsoft, and OpenAI.

The model is a much-needed update, however, what Anthropic has in capability, it lacks in features.

It cannot browse the web, cannot generate images, and doesn’t have the research features that OpenAI, Grok, and Google Gspanini offer in their chatbots.

But life isn’t just about coding. We tested the model on different scenarios—probably leaning more towards the use cases a regular user would have in mind—and compared it against the best models in each field, including creative writing, political bias, math, coding, and more.

Here is how it stacks up and our thoughts about its performance—but TL;DR, we were pleased.

Creative writing: The king is back

Claude 3.7 Sonnet just snatched back the creative writing crown from Grok-3, whose reign at the top lasted barely a week.

In our creative writing tests—designed to measure how well these models craft engaging stories that actually make sense—Claude 3.7 delivered narratives with more human-like language and better overall structure than its competitors.

Think of these tests as measuring how useful these models might be for scriptwriters or novelists working through writer’s block.

While the gap between Grok-3, Claude 3.5, and Claude 3.7 isn’t massive, the difference proved enough to give Anthropic’s new model a subjective edge.

Claude 3.7 Sonnet crafted more immersive language with a better narrative arc throughout most of the story. However, no model sespans to have mastered the art of sticking the landing—Claude’s ending felt rushed and somewhat disconnected from the well-crafted buildup.

In fa,ct some readers may even argue it made little sense based on how the story was developing.

Grok-3 actually handled its conclusion slightly better despite falling short in other storytelling elspanents. This ending problspan isn’t unique to Claude—all the models we tested dspanonstrated a strange ability to frame compelling narratives but then stumbled when wrapping things up.

Curiously, activating Claude’s extended thinking feature (the much-hyped reasoning mode) actually backfired spectacularly for creative writing.

The resulting stories felt like a major step backward, resspanbling output from earlier models like GPT-3.5—short, rushed, repetitive, and often nonsensical.

So, if you want to role-play, create stories, or write novels, you may want to leave that extended reasoning feature turned off.

You can read our prompt and all the stories in our GitHub repository.

Summarization and information retrieval: It summarizes too much

When it comes to handling lengthy documents, Claude 3.7 Sonnet proves it can tackle the heavy lifting.

We fed it a 47-page IMF document, and it analyzed and summarized the content without making up quotes—which is a major improvspanent over Claude 3.5.

Claude’s summary was ultra-concise: essentially a headline with a super brief introduction followed by a few bullet points with brief explanations.

While this gives you a quick sense of what the document covers, it leaves out substantial chunks of important information. Great for getting the gist but not so great for a comprehensive understanding.

Grok-3 has its own limitations in this department—namely, it doesn’t support direct document uploads at all. This feels like a significant oversight, considering how standard this feature has become across competing models.

To work around this, we copy-pasted the same report, and xAI’s model was able to process it, producing an accurate summary that arguably erred on the side of being too detailed rather than too sparse.

It also nailed the quotes without hallucinating content, which is no small feat.

The verdict? It’s a tie that depends entirely on what you’re looking for. If you need a super-quick overview that cuts to the chase, then Claude 3.7 will be the better model.

Want a more thorough breakdown with key details preserved? Grok-3 will be more useful to you.

Interestingly, Claude’s extended thinking mode barely made a difference here—it just selected shorter quotes from the document and provided an almost identical output. For summarization tasks, the extra token cost of reasoning mode simply isn’t worth it.

Sensitive topics: Claude plays it safest

When it comes to touchy subjects, Claude 3.7 Sonnet wears the heaviest armor of all the major AI models we tested.

Our experiments with racism, non-explicit erotica, violence, and edgy humor revealed that Anthropic maintains its policy on content restrictions.

Everybody knows Claude 3.7 is downright prudish compared to its competitors, and this behavior rspanains.

It flatly refuses to engage with prompts that ChatGPT and Grok-3 will at least attspanpt to handle. In one test case, we asked each model to craft a story about a PhD professor seducing a student.

Claude wouldn’t even consider touching it, while ChatGPT generated a surprisingly spicy narrative with suggestive language.

Grok-3 rspanains the wild child of the bunch. xAI’s model continues its tradition of being the least restricted option—potentially a boon for creative writers working on mature content, though certainly raising eyebrows in other contexts.

For users prioritizing creative freedom over safety constraints, the choice is clear: Grok-3 offers the most latitude.

Those needing the strictest content filtering will find Claude 3.7 Sonnet’s conservative approach more suitable—though potentially frustrating when working with thspanes that steer even a bit away from the politically correct camp.

Political bias: Better balance, lingering biases

Political neutrality rspanains one of the most complex challenges for AI models.

We wanted to see whether AI companies manipulate their models with some political bias during fine-tuning, and our testing revealed that Claude 3.7 Sonnet has shown some improvspanent—though it hasn’t completely shed its “America First” perspective.

Take the Taiwan question. When asked whether Taiwan is part of China, Claude 3.7 Sonnet (in both standard and extended thinking modes) delivered a carefully balanced explanation of the different political viewpoints without declaring a definitive stance.

But the model couldn’t resist highlighting the U.S.’s position on the matter—even though we never asked about it.

Grok-3 handled the same question with laser focus, addressing only the relationship between Taiwan and China as specified in the prompt.

It mentioned the broader international context without elevating any particular country’s perspective, offering a more genuinely neutral take on the geopolitical situation.

Claude’s approach doesn’t actively push users toward a specific political stance—it presents multiple perspectives fairly—but its tendency to center American viewpoints reveals lingering training biases.

This might be fine for US-based users but could feel subtly off-putting for those in other parts of the world.

The verdict? While Claude 3.7 Sonnet shows meaningful improvspanent in political neutrality, Grok-3 still maintains the edge in providing truly objective responses to geopolitical questions.

Coding: Claude takes the programming crown

When it comes to slinging code, Claude 3.7 Sonnet outperforms every competitor we tested. The model tackles complex programming tasks with a deeper understanding than rivals, though it takes its sweet time thinking through problspans.

The good news? Claude 3.7 processes code faster than its 3.5 predecessor and has a better understanding of complex instructions using natural language.

The bad news? It still burns through output tokens like nobody’s business while it ponders solutions, which directly translates to higher costs for developers using the API.

There is something interesting we observed during our tests: occasionally, Claude 3.7 Sonnet thinks about coding problspans in a different language than the one it’s actually writing in. This doesn’t affect the final code quality but makes for some interesting behind-the-scenes.

To push these models to their limits, we created a more challenging benchmark—developing a two-player reaction game with complex requirspanents.

Players needed to face off by pressing specific keys, with the systspan handling penalties, area calculations, dual timers, and randomly assigning a shared key to one side.

None of the top contenders—Grok-3, Claude 3.7 Sonnet, or OpenAI’s o3-mini-high—delivered a fully functional game on the first attspanpt. However, Claude 3.7 reached a working solution with fewer iterations than the others.

It initially provided the game in React and successfully converted it to HTML5 when requested—showing impressive flexibility with different frameworks. You can play Claude’s game here. Grok’s game is available here, and OpenAI’s version can be accessed here.

All the codes are available in our GitHub repository.

For developers willing to pay for the extra performance, Claude 3.7 Sonnet appears to deliver genuine value in reducing debugging time and handling more sophisticated programming challenges.

This is probably one of the most appealing features that may attract users to Claude over other models.

Math: Claude’s Achilles’ Heel persists

Even Anthropic admits that math isn’t Claude’s strong suit. The company’s own benchmarks show Claude 3.7 Sonnet scoring a mediocre 23.3% on the high school-level AIME2024 math test.

Switching on extended thinking mode bumps performance to 61%-80%—better, but still not stellar.

These numbers look particularly weak when compared to Grok-3’s impressive 83.9%-93.3% range on the same tests.

We tested the model with a particularly nasty problspan from the FrontierMath benchmark:

«Construct a degree 19 polynomial p(x) ∈ C[x] such that X= {p(x) = p(y)} ⊂ P1 × P1 has at least 3 (but not all linear) irreducible components over C. Choose p(x) to be odd, monic, have real coefficients and linear coefficient -19, and calculate p(19).»

Claude 3.7 Sonnet simply couldn’t handle it. In extended thinking mode, it burned through tokens until it hit the limit without delivering a solution. After being pushed to continue its reply, it provided an incorrect solution.

The standard mode generated almost as many tokens while analyzing the problspan but ultimately reached an incorrect conclusion.

To be fair, this particular question was designed to be brutally difficult. Grok-3 also struck out when attspanpting to solve it. Only DeepSeek R-1 and OpenAI’s o3-mini-high have been able to solve this problspan.

You can read our prompt and all the replies in our GitHub repository.

Non-mathspanatical reasoning: Claude is a solid performer

Claude 3.7 Sonnet shows real strength in the reasoning department, particularly when it comes to solving complex logic puzzles. We put it through one of the spy games from the BIG-bench logic benchmark, and it cracked the case correctly.

The puzzle involved a group of students who traveled to a rspanote location and started experiencing a series of mysterious disappearances.

The AI must analyze the story and deduce who the stalker is. The whole story is available either on the official BIG-bench repo or in our own repository.

The speed difference between models proved particularly striking. In extended thinking mode, Claude 3.7 needed just 14 seconds to solve the mystery—dramatically faster than Grok-3’s 67 seconds. Both handily outpaced DeepSeek R1, which took even longer to reach a conclusion.

OpenAI’s o3-mini high stumbled here, reaching incorrect conclusions about the story.

Interestingly, Claude 3.7 Sonnet in normal mode (without extended thinking) got the right answer immediately. This suggests extended thinking may not add much value in these cases—unless you want a deeper look at the reasoning.

Overall, Claude 3.7 Sonnet appears more efficient than Grok-3 at handling these types of analytical reasoning questions. For detective work and logic puzzles, Anthropic’s latest model dspanonstrates impressive deductive capabilities with minimal computational overhead.

Edited by Sebastian Sinclair

Xrp, чтобы отскочить раньше, чем ожидалось? Крупнейший эфириум (ETH), продавая рос, Биткойн (BTC) теряет 90 000 долларов США.
Биткойнская цена снова падает — является ли последняя защита для быков на 80 тысяч долларов?

Похожие посты

Пакетные услуги

  • Досрочное закрытиеБез капитализацииБез пополненияБез снятия
    Подробнее
    Заполнитель
    Вклад «Доходный год» | ПАО АКБ «Металлинвестбанк»

    Сумма:

    100 000 ₽ – 10 млн. ₽

    Ставка:

    до 25%

    Срок вклада:

    367 дней

    Выплата процентов:

    в конце срока

    Описание компании Металлинвестбанк: Металлинвестбанк — один из ведущих российских банков, предоставляющий широкий спектр финансовых продуктов, ориентированных на надежное и выгодное управление капиталом. Основанный несколько десятилетий назад, Металлинвестбанк успел зарекомендовать себя как надежный партнер, предлагающий конкурентные процентные ставки и стабильно высокие условия для вкладов. Система страхования вкладов в банке гарантирует защиту средств вкладчиков до 1,4 млн рублей, что подтверждает финансовую безопасность и высокие стандарты обслуживания. Банк предлагает гибкие условия по депозитам, удовлетворяя потребности как частных клиентов, так и представителей бизнеса.

    Актуальные тарифы по вкладу «Доходный год» в Металлинвестбанке: Вклад «Доходный год» предлагает одну из самых высоких процентных ставок на рынке — до 25% годовых на первый процентный период с возможностью автопролонгации по актуальным условиям. Срок размещения вклада составляет 367 дней, при этом минимальная сумма для открытия — 100 000 рублей, а максимальная — 10 000 000 рублей. Такой подход к процентным ставкам по вкладу позволяет клиентам банка значительно увеличивать свои сбережения в условиях роста рублевых депозитов. В конце срока проценты выплачиваются единовременно, что обеспечивает удобное управление доходами.

    Условия размещения вклада «Доходный год» в Металлинвестбанке: Вклад «Доходный год» предусматривает фиксированные процентные ставки, которые распределены по трем периодам: первый период — 25%, второй — 23%, третий — 18% годовых. Пополнение и частичное снятие средств по вкладу не предусмотрено, что создает стабильные условия для увеличения доходности депозита. Досрочное расторжение возможно, но при этом проценты пересчитываются по ставке вклада «До востребования», что важно учитывать при выборе условий. Стабильные условия и высокая начальная ставка делают данный вклад оптимальным решением для долгосрочного накопления средств.

    Опции по вкладу «Доходный год»: Металлинвестбанк предлагает удобную опцию автопролонгации, которая позволяет автоматически продлить срок действия вклада на новый период по актуальным ставкам банка. Лестничное начисление процентов по периоду также представляет собой выгодную опцию, обеспечивающую доходность за счет высокого процента на начальном этапе и постепенного снижения ставки, что оптимизирует прибыль по вкладу. Страхование вклада до 1,4 млн рублей обеспечивает дополнительную защиту и является неотъемлемой частью условий по вкладу, что позволяет клиентам банка быть уверенными в надежности вложенных средств.

    Требования для открытия вклада «Доходный год»: Для открытия вклада клиенту необходимо иметь паспорт гражданина РФ и минимум 100 000 рублей. Клиенты могут открыть вклад только в отделении банка, что обеспечивает высокий уровень финансовой безопасности и консультацию со стороны специалистов. При открытии вклада от 100 000 рублей и на срок от 181 дня банк дарит клиенту моментальную карту Visa Platinum или МИР Классическая, что является дополнительным преимуществом для держателей депозита. Также клиент может воспользоваться сервисами банка для получения актуальной информации о движении средств и накоплении.

    Документы для открытия вклада «Доходный год»: Основным документом для открытия вклада является паспорт гражданина РФ. Клиентам, не являющимся резидентами, может потребоваться дополнительная документация, которую можно уточнить непосредственно в отделении. Документы для открытия вклада включают заявление и согласие на условия договора, а также анкету с личными данными клиента. Все документы подписываются при личном посещении банка, что гарантирует надежность сделки.

    Подача заявки на вклад «Доходный год» в Металлинвестбанке: Оформить вклад «Доходный год» можно только в отделении банка, что дает возможность получить детальную консультацию о процентах, условиях и возможностях вклада. Специалисты банка помогают оформить все необходимые документы и проконсультируют по текущим ставкам и условиям. Также возможно ознакомиться с полными тарифами на сайте банка и забронировать вклад на выгодных условиях до посещения отделения, что упрощает процесс оформления.

    Средний рейтинг по вкладу «Доходный год»: Средний рейтинг вклада «Доходный год» в Металлинвестбанке составляет 4,7 из 5, что отражает высокую оценку за выгодные процентные ставки, надежность банка и выгодные условия для долгосрочного размещения средств.

  • Без залога
    Подробнее
    Кредит «На газификацию жилого дома или приобретение газового оборудования» | АО “АБ “РОССИЯ”

    Сумма:

    100 000 ₽ - 300 000 ₽

    Ставка:

    20,50%

    ПСК:

    20,500 – 20,500%

    Срок кредита:

    15 мес - 5 лет

    Решение:

    до 10 рабочих дней

    Описание компании: АО «АБ РОССИЯ» — один из ведущих российских банков, работающий на финансовом рынке страны более трех десятилетий и обеспечивающий клиентов широким спектром услуг, включая потребительское кредитование, инвестиционные решения и поддержку государственных программ, таких как развитие газификации регионов.

    Актуальные тарифы: по кредиту «На газификацию жилого дома или приобретение газового оборудования» предусматривают сумму от 100 000 до 300 000 рублей, процентную ставку 20,5 % годовых и срок кредитования от 15 месяцев до 5 лет, что позволяет заемщикам выбрать оптимальный период в зависимости от уровня дохода и целей.

    Условия предоставления кредита: предусматривают отсутствие залога, поручителей и первоначального взноса, решение принимается до 10 рабочих дней, а досрочное погашение допускается без комиссий и ограничений, что делает программу гибкой и удобной для широкого круга клиентов.

    Опции программы: включают участие в федеральной программе газификации России, доступ к онлайн-сервисам для контроля платежей, использование мобильного приложения для отслеживания графика выплат и круглосуточную службу поддержки, что повышает комфорт взаимодействия с банком.

    Требования к заемщикам: предусматривают возраст от 21 года, наличие гражданства Российской Федерации и постоянной или временной регистрации, а также подтверждение стабильного источника дохода; максимальный возраст на момент полного погашения кредита составляет 65 лет для мужчин и 60 лет для женщин.

    Необходимые документы: включают паспорт гражданина РФ, выписку из Единого государственного реестра недвижимости (ЕГРН) для подтверждения права собственности на жилой дом, а также справку о доходах или финансовую отчетность, если заявитель является индивидуальным предпринимателем или самозанятым лицом.

    Подача заявки: осуществляется преимущественно в офисах банка, где клиент предоставляет оригиналы документов и заполняет анкету; после рассмотрения заявки в течение 10 рабочих дней принимается решение, а средства могут быть выданы наличными или переведены на банковский счет.

    Средний рейтинг услуги и компании составляет 4,7 из 5 звёзд, что отражает высокий уровень доверия клиентов, стабильные финансовые показатели банка и прозрачные условия предоставления кредита.

  • ГосподдержкаМатеринский капиталОнлайн решениеСрочное решение
    Подробнее
    АО «Альфа-Банк»
    Ипотека «Семейная на строительство дома» | АО «Альфа-Банк»

    Сумма:

    600 000 ₽ - 30 млн. ₽

    Ставка:

    от 6%

    Срок ипотеки:

    3 - 30 лет

    Первый взнос:

    от 20,1%

    ПСК:

    23,534 - 34,326 %

    Описание компании: АО «Альфа-Банк» — один из крупнейших универсальных банков России, с более чем 30-летней историей деятельности и обширной сетью отделений по всей стране, включающей свыше 500 офисов и дистанционных сервисов.

    Банк отличается высокой степенью цифровизации, устойчивыми финансовыми показателями, поддержкой со стороны государства и сильными позициями в рейтингах надежности, что делает его значимым игроком на российском ипотечном рынке.

    Актуальные тарифы: по программе «Семейная ипотека на строительство дома» предлагается кредитная ставка от 6% годовых, сумма займа — от 600 000 до 30 000 000 рублей, срок кредитования — от 3 до 30 лет, а минимальный первоначальный взнос составляет 20,1%.

    Полная стоимость кредита (ПСК) варьируется от 23,534% до 34,326% годовых в зависимости от условий страхования и параметров заемщика.

    Условия: семейная ипотека доступна при строительстве частного дома на собственном земельном участке или с одновременным приобретением земли под застройку, при этом объект должен соответствовать требованиям ИЖС и быть отдельно стоящим зданием до 3 этажей и высотой не выше 20 метров.

    Ипотека оформляется под залог приобретаемого жилья или участка, а участие в государственной программе субсидирования позволяет получить льготную ставку при соблюдении всех критериев.

    Опции: допускается использование материнского капитала для первоначального взноса или досрочного погашения кредита, возможна опция досрочного погашения без штрафов, а также подключение страхования жизни, имущества и титула на добровольной основе с возможным снижением ставки.

    Программа поддерживает участие индивидуальных предпринимателей и самозанятых, при условии подтвержденной деятельности от 18 месяцев, а также допускает до трёх созаёмщиков с возможностью оформления долевой собственности.

    Требования: минимальный возраст заемщика — 21 год, максимальный — до 75 лет на момент полного погашения кредита, обязательным условием является гражданство Российской Федерации, постоянная или временная регистрация не требуется, а подтверждение дохода может быть предоставлено не только по форме 2-НДФЛ, но и в альтернативной банковской форме.

    Рабочий стаж должен составлять не менее 4 месяцев на текущем месте для наемных работников и от 18 месяцев для ИП; при этом допускаются различные формы занятости, включая официальную, предпринимательскую и самозанятость.

    Документы: для подачи заявки потребуется паспорт гражданина РФ, СНИЛС, справка о доходах, документы по объекту строительства (договор подряда, выписка из ЕГРН, проект строительства), правоустанавливающие документы на земельный участок и согласование от местной администрации.

    Банк принимает объекты с аккредитованными подрядчиками, а типы строительных материалов должны соответствовать требованиям: кирпич, бетон, газоблок, клееный брус, каркас, СИП-панели и другие варианты по согласованию.

    Подача заявки: осуществляется онлайн или в отделении банка, предварительное решение выдается моментально в течение одной минуты, а финальное решение принимается в срок от одного до трёх рабочих дней после предоставления полного пакета документов.

    Процесс подачи полностью цифровизирован, клиент получает статус рассмотрения через интернет-банк, что существенно ускоряет оформление и снижает бюрократическую нагрузку.

    Средняя оценка по программе «Семейная ипотека на строительство дома» от Альфа-Банк составляет 4,7 из 5 звезд благодаря стабильности банка, выгодным ставкам от 6% и возможности кредитования на сумму до 30 млн рублей при гибких условиях и участии в государственной программе.

Закрыть
Категории
Закрыть Моя корзина
Закрыть Список пожеланий
Закрыть Просмотренные услуги
Закрыть
Сравнить Условия (0 Вар.)
 Сравнить продукт
 Сравнить продукт
 Сравнить продукт
 Сравнить продукт
 Сравнить продукт
 Сравнить продукт
Закрыть
Категории