К середине 2025 года ландшафт генеративного искусственного интеллекта претерпел фундаментальный раскол. Если еще два года назад безусловное лидерство принадлежало одной-двум западным лабораториям, то сегодня рынок четко сегментировался на глобальные решения и суверенные технологические стеки. В данном исследовании проводится глубокий технический и экономический анализ ведущих больших языковых моделей (LLM), доступных бизнесу и частным пользователям. Мы рассматриваем не только «гонку параметров» между OpenAI, Google и Anthropic, но и стремительный прогресс российских гигантов — Сбера и Яндекса, чьи решения GigaChat и YandexGPT достигли паритета с мировыми аналогами в специфических задачах, связанных с русским языком. Особое внимание уделено скрытым аспектам эксплуатации: реальной стоимости токенов с учетом волатильности курсов, техническим ограничениям контекстных окон, которые часто отличаются от заявленных в маркетинговых материалах, и инфраструктурным барьерам, встающим перед российскими компаниями. Документ содержит детальные таблицы сравнения цен, результаты бенчмарков и разбор реальных кейсов внедрения, что позволит техническим директорам и специалистам принимать обоснованные решения о выборе платформы.

Глобальные лидеры генерации текста: Технологический фронтир

Мировой рынок искусственного интеллекта в 2025 году характеризуется жесткой конкуренцией между тремя основными архитекторами будущего: OpenAI, Google и Anthropic. Каждая из этих компаний выбрала уникальную траекторию развития, что привело к появлению специализированных инструментов, каждый из которых имеет свои преимущества в определенных сценариях использования.

OpenAI: Установление отраслевых стандартов с линейкой GPT

Компания OpenAI продолжает удерживать позицию законодателя мод в индустрии, предлагая наиболее универсальные решения. По состоянию на 2025 год, флагманская линейка моделей претерпела значительные изменения, разделившись на инструменты для быстрой генерации и модели для глубокого «размышления».

Эволюция моделей: от GPT-4 к GPT-5

На смену легендарной GPT-4 пришла серия GPT-5, которая демонстрирует качественный скачок не столько в скорости генерации, сколько в способности к многоступенчатым рассуждениям. Модели серии GPT-5.1 и специализированные версии, такие как GPT-5 pro, спроектированы так, чтобы тратить больше времени на «обдумывание» перед выдачей ответа, что делает их идеальными для решения сложных математических задач, программирования и агентирования.¹

Важным стратегическим шагом стал выпуск «мини» версий. Модель GPT-4o mini, а затем и GPT-5 mini, перевернули экономику автоматизации. Если раньше использование передовых нейросетей для рутинных задач (классификация почты, саммаризация чатов) было экономически нецелесообразным, то снижение стоимости токена в десятки раз сделало эти процессы доступными даже для малого бизнеса.² Технические спецификации указывают на то, что GPT-5 mini стоит приблизительно $0.15 за миллион входных токенов, что позволяет обрабатывать огромные массивы данных с минимальными затратами.¹

Ограничения памяти и контекста

Несмотря на заявленные возможности, пользователи и разработчики сталкиваются с нюансами реализации «памяти» моделей. Стандартное контекстное окно для большинства современных моделей OpenAI составляет 128 000 токенов. Это эквивалентно примерно 300 страницам текста, что позволяет загружать в модель небольшие книги или техническую документацию.³ Однако существуют расхождения между API и веб-интерфейсом. Тесты показывают, что в веб-версии ChatGPT реальная «память» может быть ограничена 32 000 токенов для пользователей подписки Plus, и только корпоративные тарифы Enterprise получают полный доступ к 128k окну.⁴ Это создает ситуацию, когда модель начинает «забывать» начало длинного диалога, что критично для аналитиков, работающих с длинными сессиями.

Anthropic: Этический ИИ и превосходство в коде

Компания Anthropic, основанная выходцами из OpenAI, заняла нишу «безопасного и интерпретируемого ИИ». Их модели серии Claude 3.5 и Claude 3.7 Sonnet стали де-факто стандартом для программистов.

Claude Sonnet и Opus: фокус на логике

В 2025 году модель Claude 3.7 Sonnet демонстрирует результаты, превосходящие GPT-4o в задачах написания кода и следовании сложным инструкциям. Особенностью архитектуры Claude является так называемый «теплый» тон общения и сниженная вероятность роботизированных ответов. Разработчики отмечают, что Claude лучше справляется с рефакторингом кода и поиском ошибок в больших проектах благодаря функции «Artifacts», которая позволяет визуализировать и редактировать код в отдельном окне.⁶

Ключевое преимущество Anthropic — огромное контекстное окно в 200 000 токенов, которое доступно даже в стандартных версиях, и до 1 миллиона токенов в специализированных тарифах. Это позволяет загружать в модель целые репозитории кода для анализа.⁸

Географическая блокада

Для пользователей из России работа с Claude представляет собой наибольшую сложность. Anthropic применяет агрессивную политику геоблокировки. Регистрация и использование сервиса требуют не просто VPN, но и «чистого» цифрового следа, не связанного с РФ. Аккаунты часто блокируются без предупреждения при попытке оплаты картами, выпущенными в неподдерживаемых регионах, или при обнаружении несоответствия IP-адреса региону регистрации.⁹

Google: Архитектура бесконечного контекста

Google сделал ставку на мультимодальность и колоссальный объем оперативной памяти своих моделей. Линейка Gemini, включающая версии 1.5 Pro и 2.5 Pro, предлагает возможности, недоступные конкурентам.

Миллионное окно контекста

Главная техническая особенность Gemini — поддержка контекстного окна в 1 или даже 2 миллиона токенов.¹¹ Это меняет парадигму использования ИИ: вместо того чтобы «скармливать» модели данные по кусочкам, пользователь может загрузить видеофайл длительностью в час, аудиозапись совещания за весь день или подшивку документов за год. Модель способна найти конкретный факт («иголку в стоге сена») среди этого массива данных.

Однако, несмотря на объем памяти, качество генерации текста у Gemini часто оценивается пользователями ниже, чем у Claude или GPT. Модель более склонна к отказам отвечать на безобидные вопросы из-за перестраховочных фильтров безопасности и иногда демонстрирует более высокий уровень «галлюцинаций» (выдумки фактов) при работе со сложными логическими цепочками.¹³ Доступность Gemini в России носит переменный характер: периодически сервис открывается без VPN, но официальные мобильные приложения остаются недоступными в российских магазинах приложений.¹⁵

Российские нейросети: От импортозамещения к суверенитету

Развитие искусственного интеллекта в России пошло по пути создания полных экосистем. Если западные компании продают модель как сервис, то российские гиганты интегрируют ИИ во все аспекты цифровой жизни — от банковских приложений до государственных услуг. Это обусловлено не только вопросами технологического престижа, но и жесткими требованиями законодательства (в частности, 152-ФЗ о хранении персональных данных) и необходимостью защиты от санкционных рисков.

Яндекс: Интеграция и понимание культуры

Яндекс, обладая одной из лучших школ машинного обучения в мире, последовательно развивает свою линейку YandexGPT. Версия YandexGPT 5 Pro, выпущенная в феврале 2025 года, стала центральным элементом облачной платформы Yandex Cloud и голосового помощника Алиса.¹⁶

Технические особенности YandexGPT 5

Ключевое преимущество модели Яндекса — глубокое понимание русскоязычного контекста. Модель обучалась на огромном корпусе русскоязычного интернета, литературы и нормативных актов. Это позволяет ей понимать сленг, культурные отсылки (например, цитаты из советского кино) и юридические нюансы лучше, чем GPT-4, который обучался преимущественно на английских текстах.¹⁸

Для бизнеса Яндекс предлагает гибкую линейку моделей:

YandexGPT Lite: Легковесная модель для задач, требующих мгновенного отклика (чат-боты поддержки, классификация обращений). Она экстремально дешева и быстра.
YandexGPT Pro: Тяжелая модель для генерации контента, маркетинговых текстов и анализа сложных документов. Она поддерживает асинхронный режим работы, что позволяет отправлять «тяжелые» запросы и получать ответ позже, не блокируя интерфейс приложения.¹⁹

Основным техническим ограничением долгое время оставался размер контекстного окна. В версии Pro оно составляет 32 000 токенов.²⁰ Хотя этого достаточно для большинства бизнес-задач (обработка статьи, диалог с клиентом), это значительно меньше, чем 128k или 1M у западных конкурентов, что ограничивает применение модели для сквозного анализа больших архивов данных.

Сбер: GigaChat как корпоративный стандарт

Сбер выбрал стратегию создания «тяжелого» промышленного ИИ. Линейка GigaChat, включающая версии MAX, Pro и Lite, позиционируется как решение для Enterprise-сегмента.

Архитектура и производительность

С выходом GigaChat MAX в 2025 году Сбер заявил о превосходстве над GPT-4o в ряде специфических бенчмарков на русском языке. Модель построена на архитектуре «смесь экспертов» (Mixture of Experts — MoE), что позволяет ей активировать только необходимые части нейросети для решения конкретной задачи, экономя вычислительные ресурсы при сохранении высокого качества.²¹

Уникальным предложением Сбера является возможность развертывания модели «on-premise» — то есть на собственных серверах заказчика. Это критически важно для банков, оборонных предприятий и госсектора, которым запрещено передавать данные в публичные облака. Кроме того, GigaChat поддерживает контекстное окно до 128 000 токенов, что ставит его в один ряд с GPT-4 по способности обрабатывать объемные документы.²²

Другие игроки и открытый код

Помимо гигантов, на российском рынке присутствуют и другие игроки, использующие открытые модели. Например, широкое распространение получила модель Qwen3-14B (разработка Alibaba), которая показывает феноменальные результаты в поддержке русского языка и часто используется как основа для локальных доработок в российских стартапах.²³ Открытость весов таких моделей позволяет компаниям дообучать их на своих закрытых данных, не опасаясь утечек.

Сравнительный анализ цен на токены и экономика использования

Вопрос ценообразования является определяющим для бизнеса. Сравнение осложняется тем, что зарубежные провайдеры тарифицируют услуги в долларах США, что вносит курсовые риски, тогда как российские компании работают в рублях с учетом НДС.

В таблице ниже приведен приведенный к единому знаменателю (доллары США по курсу 2025 года) анализ стоимости обработки 1 миллиона токенов. Важно помнить, что 1 миллион токенов — это примерно 750 000 слов, или около 2-3 томов «Войны и мира».

Таблица 1: Сравнение стоимости использования API (оценка 2025)

Модель	Входные токены (Input)	Выходные токены (Output)	Валюта и условия
OpenAI GPT-4o	~$2.50	~$10.00	USD. Требуется зарубежная карта, без НДС РФ.²
OpenAI GPT-4o mini	~$0.15	~$0.60	USD. Экстремально низкая цена, демпинг рынка.²
Claude 3.5 Sonnet	~$3.00	~$15.00	USD. Премиальная цена за качество кода.²
Google Gemini 1.5 Pro	~$1.25	~$2.50	USD. Агрессивное ценообразование для длинного контекста.²
YandexGPT Pro 5.1	~$3.30 (расчетно)	~$10.00 (расчетно)	RUB. Тарификация в рублях. Цена включает НДС.²⁴
YandexGPT Lite	~$0.50	~$1.50	RUB. Экономичное решение для массовых операций.²⁴
GigaChat Pro	~1500 руб / 1M	Включено в пакет	RUB. Пакетная модель продаж. Около $15-16 за пакет.²⁵

Анализ ценовых стратегий:

Пакетная модель Сбера: GigaChat использует модель, отличную от конкурентов. Вместо оплаты за каждый токен «по факту», клиенты часто покупают пакеты токенов (например, 1 млн, 5 млн). Это удобно для бюджетирования в крупных корпорациях, так как расходы фиксированы. Для малого бизнеса это может быть менее гибко.²⁵
Демпинг «Мини» моделей: Появление GPT-4o mini и YandexGPT Lite создало новый сегмент рынка. Разница в цене между «Pro» и «Lite» моделями достигает 10-20 раз. Это заставляет разработчиков использовать каскадную архитектуру: простые запросы обрабатывает дешевая модель, и только сложные передаются дорогой «умной» модели.
Рублевая премия: При прямом пересчете цен YandexGPT Pro оказывается сопоставим или даже чуть дороже GPT-4o. Это объясняется тем, что российские провайдеры включают в цену НДС и расходы на инфраструктуру, которая в условиях санкций обходится дороже. Однако для российского юрлица возможность получить официальные закрывающие документы и налоговый вычет по НДС часто перевешивает номинальную разницу в цене.

Технические характеристики: Контекстное окно и память

Понимание термина «контекстное окно» критически важно для выбора инструмента. Это объем информации, который нейросеть «держит в голове» в момент генерации ответа.

Таблица 2: Сравнение размера контекстного окна

Модель	Контекст (Токены)	Практическое применение
Gemini 1.5 Pro	1,000,000+	Анализ видеоархивов, кодовых баз крупных проектов, написание циклов книг.²
Claude 3.7 Sonnet	200,000	Глубокий анализ юридических договоров, работа с большими научными статьями.⁸
GPT-4o / GPT-5	128,000	Индустриальный стандарт. Достаточно для большинства бизнес-отчетов и длинных диалогов.³
GigaChat MAX	128,000	Паритет с западными аналогами. Позволяет загружать объемные регламенты и инструкции.²²
YandexGPT 5 Pro	32,000	Ограничено. Подходит для статей, новостей, коротких диалогов. Не подходит для книг.²⁰

Проблема «потери в середине» (Lost in the Middle):

Исследования показывают, что простого увеличения размера окна недостаточно. Модели склонны лучше запоминать информацию в начале и в конце переданного текста, но могут игнорировать данные в середине. Тесты показывают, что Claude 3.5 и GPT-4o демонстрируют наилучшую равномерность внимания, тогда как у Gemini при загрузке предельных объемов точность поиска конкретных фактов может снижаться.26 Ограничение YandexGPT в 32к токенов, вероятно, является сознательным решением инженеров для сохранения высокого качества ответов и скорости работы, жертвуя объемом ради точности.

Качество генерации и поддержка русского языка

Оценка «интеллекта» нейросети всегда субъективна, однако существуют стандартизированные бенчмарки. Для русского языка золотым стандартом стал бенчмарк MERA (Multimodal Evaluation for Russian-language Architectures).

Результаты MERA и пользовательский опыт

Согласно данным на начало 2025 года, расстановка сил выглядит следующим образом:

Русский язык и культура: Здесь лидерство захватили отечественные модели. GigaChat MAX и YandexGPT 5 Pro показывают результаты, превосходящие GPT-4o в тестах на знание российской истории, литературы, права и общественных норм.²¹ Это объясняется составом обучающей выборки: российские модели видели на порядки больше текстов на русском языке, включая специфические юридические и бюрократические документы.
Логика и STEM: В задачах высшей математики, физики и программирования западные модели (GPT-5, Claude 3.7) сохраняют пальму первенства. Их способность к абстрактному мышлению и построению сложных логических цепочек все еще выше.²⁷ Если задача — решить олимпиадную задачу по математике, лучше использовать GPT. Если задача — написать претензию в управляющую компанию по нормам ЖКХ РФ, лучше справится GigaChat или YandexGPT.
Творчество и стиль: Пользователи отмечают, что YandexGPT генерирует более живые и стилистически окрашенные тексты на русском языке. Западные модели часто грешат «кальками» с английского построения фраз, делая текст сухим и канцелярским. Яндекс, интегрированный с сервисом «Шедеврум», лучше понимает нюансы художественного стиля.²⁹

Цензура и безопасность:

Важным аспектом является «элайнмент» (настройка безопасности). Западные модели имеют жесткие фильтры, настроенные на западную повестку (DEI, политическая корректность США), что иногда приводит к отказам отвечать на нейтральные для России вопросы. Российские модели настроены в соответствии с законодательством РФ и этическими нормами российского общества, что делает их более предсказуемыми для использования внутри страны.18

Доступность, оплата и обход ограничений в России

Для российского пользователя технические характеристики часто отходят на второй план перед вопросом: «Как я могу это оплатить и запустить?».

Доступ к западным сервисам

Доступ к ChatGPT (OpenAI) и Claude (Anthropic) из России максимально затруднен.

Блокировки: OpenAI блокирует доступ с российских IP-адресов. Anthropic идет дальше и блокирует аккаунты при малейшем подозрении на использование VPN или несоответствии данных.⁹
Оплата: Прямая оплата российскими картами невозможна.

Методы обхода:

Рынок адаптировался, предложив несколько решений:

Сервисы-посредники: Существуют платформы (например, упоминаемый в источниках Oplatym.ru), которые позволяют оплатить подписку рублями. Пользователь переводит средства посреднику, а тот оплачивает сервис зарубежной картой. Комиссия таких сервисов высока: например, при стоимости подписки около 2000-3000 рублей комиссия может составлять от 500 до 700 рублей, что увеличивает стоимость на 20-30%.⁸
Криптовалютные карты: Продвинутые пользователи оформляют виртуальные карты зарубежных необанков, пополняемые через USDT/криптовалюту. Это рискованный метод, так как такие карты часто блокируются самими сервисами ИИ.
API-реселлеры: Для бизнеса существуют российские платформы, которые предоставляют доступ к API GPT-4 через свой шлюз, принимая оплату по счету в рублях. Это легальная «серая зона», позволяющая компаниям использовать западные технологии.

Доступ к российским сервисам

Здесь ситуация зеркальная — максимальная доступность.

YandexGPT: Доступен любому пользователю через Алису или сайт ya.ru. Для разработчиков и бизнеса вход осуществляется через консоль Yandex Cloud. Оплата производится с привязанной российской карты или лицевого счета компании.¹⁷
GigaChat: Доступен через веб-интерфейс, Telegram-бота и API. Для полного доступа часто требуется авторизация через Сбер ID (что есть у большинства граждан РФ). Для бизнеса предусмотрено заключение прямых договоров со Сбером.³¹

Реальные кейсы внедрения в бизнесе

Чтобы проиллюстрировать практическую пользу, рассмотрим два примера внедрения, освещенных в отчетах.

Кейс 1: Финансовый маркетплейс Banki.ru и YandexGPT

В 2025 году крупнейший финансовый агрегатор Banki.ru внедрил ИИ-ассистента на базе YandexGPT.

Проблема: Огромный поток типовых запросов от пользователей, ищущих кредиты, вклады и страховки. Операторы поддержки были перегружены, а классические кнопочные боты вызывали раздражение клиентов.
Решение: Внедрение генеративного чат-бота, способного понимать естественный язык («Нужна кредитка без процентов на 100 дней»).
Результат: Ассистент взял на себя значительную часть первичных консультаций. Ключевым фактором успеха стала способность модели «переводить» сложные банковские условия на понятный русский язык без галлюцинаций в цифрах. Использование отечественной модели обеспечило соответствие требованиям по работе с финансовыми данными.³²

Кейс 2: Медицинский ассистент от Сбера

Сбер использовал модель GigaChat для создания инструмента поддержки врачей.

Задача: Снизить нагрузку на медицинский персонал при заполнении карт и первичном анализе симптомов.
Реализация: Модель GigaChat Pro была дообучена на массиве медицинских данных и успешно сдала экзамен на врача-специалиста.
Эффект: Система используется для формирования «второго мнения» при диагностике и автоматического заполнения медицинской документации по итогам приема, что высвобождает время врача для общения с пациентом.³³

Мини-FAQ: Ответы на частые вопросы

1. Какая модель самая умная на сегодняшний день?

Если вам нужно написать сложный программный код или решить абстрактную логическую задачу, лидерами остаются Claude 3.7 Sonnet и GPT-5. Если задача касается российского права, написания текстов на хорошем русском языке или работы с отечественной историей, GigaChat MAX и YandexGPT 5 Pro справятся лучше.

2. Законно ли использовать ChatGPT (OpenAI) в российском бизнесе?

Само использование технологии не запрещено законом. Однако OpenAI не заключает прямых договоров с резидентами РФ. Это создает риски: невозможность легально провести расходы по бухгалтерии, отсутствие гарантий SLA (уровня сервиса) и риск блокировки аккаунта со всеми данными. Поэтому крупный бизнес выбирает российские аналоги или работу через реселлеров.

3. Почему YandexGPT имеет маленькое контекстное окно (32к)?

Вероятно, это баланс между стоимостью вычислений и скоростью работы. Обработка огромного контекста (как у Gemini) требует колоссальных вычислительных мощностей и стоит дорого. Яндекс фокусируется на массовых сценариях (поиск, короткие диалоги), где 32 000 токенов достаточно.

4. Можно ли использовать GigaChat бесплатно?

Да, у GigaChat есть бесплатный режим («freemium») для частных пользователей в веб-версии и Telegram. Для бизнеса и использования API существуют платные тарифы и пакеты токенов.

5. Как лучше всего оплатить Claude из Москвы частному лицу?

Самый надежный способ — попросить друга за границей оплатить подписку своей картой. Если такой возможности нет, придется пользоваться сервисами-посредниками (с комиссией 20-30%) или виртуальными картами. Важно всегда использовать качественный VPN и не менять часто IP-адреса, чтобы избежать бана.

6. Что такое «галлюцинации» и какая модель врет меньше?

Галлюцинации — это когда ИИ уверенно выдает выдуманные факты. Полностью от этого не избавлена ни одна модель. Однако модели с функцией «Web Search» (поиск в интернете), такие как Perplexity, GPT-4o (с браузингом) и YandexGPT (с поиском Яндекса), могут проверять факты в сети, что снижает уровень выдумок по сравнению с «закрытыми» версиями.

7. Заменят ли российские модели западные полностью?

В сегменте B2G (бизнес для государства) и в крупных корпорациях — уже заменили. В сегменте малого бизнеса и частных разработчиков сохранится гибридная модель: российские ИИ для документов и клиентов, западные — для кодинга и международного анализа.

Заключение

Эра «одной нейросети для всего» закончилась. Рынок 2025 года требует от профессионала владения инструментарием из нескольких моделей.

Для программиста незаменим Claude или GPT-5.
Для маркетолога в России лучшим выбором станет YandexGPT благодаря стилю и интеграции с сервисами Яндекса.
Для корпоративного юриста или банкира безальтернативным вариантом является GigaChat из-за безопасности и понимания специфики.

Технический разрыв между российскими и западными моделями сократился до минимума, превратив выбор из вопроса «кто умнее» в вопрос «чей экосистемный подход удобнее и безопаснее для моих задач».

Источники

API Pricing — OpenAI, дата последнего обращения: ноября 18, 2025, https://openai.com/api/pricing/
Understanding Gemini: Costs and Performance vs GPT and Claude — Census, дата последнего обращения: ноября 18, 2025, https://www.getcensus.com/blog/understanding-gemini-costs-and-performance-vs-gpt-and-claude-ai-columns
What is the maximum context window for OpenAI’s models? — Milvus, дата последнего обращения: ноября 18, 2025, https://milvus.io/ai-quick-reference/what-is-the-maximum-context-window-for-openais-models
ChatGPT: token limits and context windows updated for all models in 2025 — Data Studios, дата последнего обращения: ноября 18, 2025, https://www.datastudios.org/post/chatgpt-token-limits-and-context-windows-updated-for-all-models-in-2025
Mastering the GPT-5 32k Context Window | A Plus User Guide — Arsturn, дата последнего обращения: ноября 18, 2025, https://www.arsturn.com/blog/mastering-gpt-5-a-guide-to-the-32k-context-window-for-plus-users
Comparison of Claude Sonnet 3.5, GPT-4o, o1, and Gemini 1.5 Pro for coding — Qodo, дата последнего обращения: ноября 18, 2025, https://www.qodo.ai/blog/comparison-of-claude-sonnet-3-5-gpt-4o-o1-and-gemini-1-5-pro-for-coding/
Claude vs. GPT-4.5 vs. Gemini: A Comprehensive Comparison — Evolution AI, дата последнего обращения: ноября 18, 2025, https://www.evolution.ai/post/claude-vs-gpt-4o-vs-gemini
Как оплатить Claude Pro в России 2025: все способы купить …, дата последнего обращения: ноября 18, 2025, https://vc.ru/services/2284578-kak-kupit-podpisku-na-claude-pro-v-rossii
How to Use Claude AI Free Unlimited: 7 Working Methods (2025) — Cursor IDE, дата последнего обращения: ноября 18, 2025, https://www.cursor-ide.com/blog/claude-ai-free-unlimited
How to Use Claude 4 in Unsupported Countries: Full Guide — Writingmate, дата последнего обращения: ноября 18, 2025, https://writingmate.ai/blog/how-to-use-claude-3-in-unsupported-countries
GPT-5 Context Window: The AI Memory Revolution That Changes Everything, дата последнего обращения: ноября 18, 2025, https://blog.promptlayer.com/gpt-5-context-window-the-ai-memory-revolution-that-changes-everything/
Long context | Gemini API — Google AI for Developers, дата последнего обращения: ноября 18, 2025, https://ai.google.dev/gemini-api/docs/long-context
Detailed comparison gemini 1.5 pro 0827 vs gpt4o vs claude 3.5 sonnet : r/Bard — Reddit, дата последнего обращения: ноября 18, 2025, https://www.reddit.com/r/Bard/comments/1f37fbj/detailed_comparison_gemini_15_pro_0827_vs_gpt4o/
Gemini 2.5 Pro doesn’t search the internet and lies about it. : r/Bard — Reddit, дата последнего обращения: ноября 18, 2025, https://www.reddit.com/r/Bard/comments/1m16sn8/gemini_25_pro_doesnt_search_the_internet_and_lies/
Gemini now available to users in Russia — EDNEWS, дата последнего обращения: ноября 18, 2025, https://ednews.net/en/news/sience/691853-gemini-now-available-to-users-in-russia
Yandex AI Studio release notes, дата последнего обращения: ноября 18, 2025, https://yandex.cloud/en/docs/ai-studio/release-notes/
YandexGPT — Wikipedia, дата последнего обращения: ноября 18, 2025, https://en.wikipedia.org/wiki/YandexGPT
We compare Chat GPT, Gemini, Gigachat and YandexGPT. Strong language models (and not so strong) — C Cases, дата последнего обращения: ноября 18, 2025, https://www.ccases.ceo/en/insights/chat-gpt-gemini-gigachat-i-yandexgpt
All YandexGPT models available in 2025: complete list for web, app, and API with generation 5 variants and developer access — Data Studios, дата последнего обращения: ноября 18, 2025, https://www.datastudios.org/post/all-yandexgpt-models-available-in-2025-complete-list-for-web-app-and-api-with-generation-5-varian
YandexGPT 5 — Generative AI for Business — Yandex Cloud, дата последнего обращения: ноября 18, 2025, https://yandex.cloud/en/services/yandexgpt
GigaChat Family: Efficient Russian Language Modeling Through Mixture of Experts Architecture — ACL Anthology, дата последнего обращения: ноября 18, 2025, https://aclanthology.org/2025.acl-demo.10.pdf
GigaChat Family: Efficient Russian Language Modeling Through Mixture of Experts Architecture — arXiv, дата последнего обращения: ноября 18, 2025, https://arxiv.org/html/2506.09440v1
Ultimate Guide — The Best Open Source LLM For Russian In 2025 — SiliconFlow, дата последнего обращения: ноября 18, 2025, https://www.siliconflow.com/articles/en/best-open-source-LLM-for-Russian
Yandex AI Studio pricing policy, дата последнего обращения: ноября 18, 2025, https://yandex.cloud/en/docs/ai-studio/pricing
Тарифы GigaChat API для физлиц | Документация для разработчиков — Sber Developer, дата последнего обращения: ноября 18, 2025, https://developers.sber.ru/docs/ru/gigachat/tariffs/individual-tariffs
Just a reminder that the context window in ChatGPT Plus is still 32k… : r/OpenAI — Reddit, дата последнего обращения: ноября 18, 2025, https://www.reddit.com/r/OpenAI/comments/1mj78xy/just_a_reminder_that_the_context_window_in/
Claude 3.5 sonnet Vs GPT-4o: Key details and comparison — Pieces.app, дата последнего обращения: ноября 18, 2025, https://pieces.app/blog/how-to-use-gpt-4o-gemini-1-5-pro-and-claude-3-5-sonnet-free
LLM Leaderboard 2025 — Vellum AI, дата последнего обращения: ноября 18, 2025, https://www.vellum.ai/llm-leaderboard
The generative AI platform Yandexgpt from Yandex Progress in artificial intelligence and robotics — Xpert.Digital, дата последнего обращения: ноября 18, 2025, https://xpert.digital/en/yandex-ai-and-robotics/
Yandex Cloud Registry pricing policy, дата последнего обращения: ноября 18, 2025, https://yandex.cloud/en/docs/cloud-registry/pricing
Sber presents GigaChat 2.0, the strongest neural network model in Russian | The AI Journal, дата последнего обращения: ноября 18, 2025, https://aijourn.com/sber-presents-gigachat-2-0-the-strongest-neural-network-model-in-russian/
Yandex Cloud results for the first six months of 2025, дата последнего обращения: ноября 18, 2025, https://yandex.cloud/en/blog/financial-results-h1-2025
Sberbank: GigaChat — TAdviser, дата последнего обращения: ноября 18, 2025, https://tadviser.com/index.php/Product:Sberbank:_GigaChat