В современном мире, насыщенном информацией, геоданные играют все более важную роль. Сервисы, подобные Яндекс.Картам и 2ГИС, аккумулируют огромные массивы ценной информации о географических объектах, организациях и инфраструктуре. Доступ к этим данным и их анализ открывают широкие возможности для бизнеса, исследований и разработки новых продуктов. Одним из методов получения таких данных является парсинг.

1.1. Определение парсинга (веб-парсинга) и его релевантность для геосервисов.

Парсинг, или веб-парсинг (web scraping), представляет собой процесс автоматизированного извлечения данных с веб-страниц. Специализированные программы, называемые парсерами или скрейперами, имитируют поведение пользователя или напрямую взаимодействуют с веб-сервером для сбора информации, которая затем структурируется и сохраняется для дальнейшего использования.

В контексте геосервисов, таких как Яндекс.Карты и 2ГИС, парсинг приобретает особую специфику. Геоданные часто характеризуются высокой степенью структурированности (например, адреса, координаты, часы работы), значительными объемами и необходимостью динамического обновления из-за постоянных изменений в реальном мире (открытие новых организаций, изменение контактной информации и т.д.).

Яндекс.Карты и 2ГИС являются ключевыми источниками геоданных в русскоязычном сегменте Интернета благодаря своей популярности, полноте информации и широкому географическому покрытию. Они содержат сведения, которые могут быть не доступны или не полны в других источниках, что делает их привлекательными целями для парсинга. Однако, как будет рассмотрено далее, такой сбор данных сопряжен с рядом технических и юридических сложностей.

1.2. Ценность данных Яндекс.Карт и 2ГИС.

Данные, содержащиеся на платформах Яндекс.Карты и 2ГИС, представляют значительную ценность благодаря своему разнообразию и детализации. К основным типам извлекаемых данных относятся:

Информация об организациях: Это наиболее востребованная категория данных. Она включает названия компаний, точные адреса (вплоть до конкретного здания), контактные телефоны, адреса веб-сайтов и электронной почты, категории деятельности (например, «кафе», «аптека», «автосервис»), часы работы, принимаемые способы оплаты, пользовательские рейтинги и отзывы, а также фотографии интерьеров и экстерьеров.
Геокоординаты: Точные значения широты и долготы для каждого объекта, позволяющие однозначно определить его местоположение на карте.
Отзывы и рейтинги: Пользовательский контент, отражающий общественное мнение о качестве товаров и услуг, предоставляемых организациями. Эти данные могут быть использованы для анализа репутации и потребительских предпочтений.
Маршруты и транспортная информация: Данные о дорожной сети, схемах движения общественного транспорта, а также информация о дорожных заторах (пробках). Хотя прямой парсинг информации о пробках в реальном времени является отдельной и сложной задачей, общие данные о транспортной доступности могут быть полезны.
Данные о зданиях и инфраструктуре: Информация об этажности зданий, наличии отдельных входов, парковочных мест, пандусов для маломобильных групп населения и других характеристиках объектов.

Ценность этих данных заключается в их применимости для решения широкого круга задач. Бизнес-аналитика может использовать их для оценки конкурентной среды, определения емкости рынка или поиска оптимальных мест для открытия новых точек. Маркетинговые исследования опираются на эти данные для сегментации аудитории по географическому признаку и анализа потребительского поведения. Логистические компании могут использовать информацию о расположении объектов и дорожной сети для оптимизации маршрутов доставки. Разработчики могут создавать на основе этих данных новые информационные сервисы, агрегаторы или специализированные приложения. Научные исследования в области урбанистики, социологии или экономики также могут извлекать пользу из анализа пространственного распределения объектов и их характеристик.

Следует отметить, что высокая ценность и многообразие данных, доступных на Яндекс.Картах и 2ГИС , являются одним из ключевых факторов, стимулирующих активный интерес к их парсингу. Это не просто сбор контактной информации, а получение многослойных данных, необходимых для принятия обоснованных решений в различных сферах. Спрос на такую информацию очевиден для маркетинга, аналитики, логистики и многих других отраслей. Если бы эти данные были легко доступны через официальные API в полном объеме и по приемлемой цене, потребность в несанкционированном парсинге, вероятно, была бы значительно ниже.

1.3. Типичные сценарии использования спарсенных геоданных.

Собранные с Яндекс.Карт и 2ГИС данные находят применение в множестве практических сценариев:

Формирование баз данных организаций: Это один из самых распространенных сценариев. Компании собирают контактную информацию (телефоны, email, адреса) для последующих маркетинговых активностей, таких как холодные звонки или email-рассылки. Важно помнить, что такие действия должны строго соответствовать законодательству о рекламе и персональных данных, в частности, избегать рассылки спама.² Также эти базы используются для анализа конкурентной среды и поиска потенциальных партнеров.
Геомаркетинг: Анализ расположения торговых точек, сервисных центров или офисов конкурентов помогает выявить незанятые ниши или зоны с высокой концентрацией целевой аудитории. Поиск потенциальных клиентов в определенных географических зонах (например, в радиусе от существующего магазина) также является типичной задачей геомаркетинга.
Логистика и оптимизация маршрутов: Хотя Яндекс и 2ГИС предоставляют официальные API для построения маршрутов ³, спарсенные данные о местоположении большого количества точек (например, всех аптек в городе) могут использоваться для разработки собственных, более специфических алгоритмов оптимизации или для анализа транспортной доступности.
Анализ рынка недвижимости: Оценка привлекательности тех или иных районов города или отдельных объектов недвижимости часто основывается на анализе окружающей инфраструктуры: наличия магазинов, школ, детских садов, медицинских учреждений, остановок общественного транспорта и т.д. Вся эта информация может быть получена путем парсинга геосервисов.
Создание агрегаторов и справочников: Различные веб-порталы и мобильные приложения могут агрегировать информацию об организациях из Яндекс.Карт и 2ГИС, предоставляя ее пользователям в новом, удобном формате или с дополнительными функциями (например, сравнение цен, бронирование услуг).
Мониторинг цен и услуг: Компании могут отслеживать цены на товары и услуги, предлагаемые конкурентами, а также изменения в их ассортименте или условиях работы, парся соответствующие разделы на картах или сайтах организаций, указанных на картах.
Научные исследования: Ученые в области урбанистики, географии, социологии и экономики используют спарсенные геоданные для анализа пространственного распределения различных объектов (например, предприятий общественного питания, культурных учреждений), изучения моделей городской мобильности, оценки влияния инфраструктуры на социально-экономические показатели и т.д.

Фундаментальный конфликт интересов лежит в основе проблематики парсинга геоданных. Владельцы платформ, таких как Яндекс и 2ГИС, вкладывают значительные ресурсы в сбор, проверку и поддержание актуальности огромных массивов данных. Их бизнес-модели часто включают монетизацию этих данных через предоставление платных API ³ или продажу рекламных возможностей и приоритетного размещения на картах. Бесконтрольный парсинг со стороны третьих лиц может обесценивать эти усилия, нарушать их бизнес-модели и создавать дополнительную нагрузку на их серверную инфраструктуру. С другой стороны, пользователи и бизнес-структуры стремятся получить доступ к этим данным максимально полно и с минимальными затратами, рассматривая их как своего рода «общедоступную» информацию, что и порождает постоянное напряжение между желанием получить данные и ограничениями, устанавливаемыми их владельцами.

1.4. Обзор структуры исследования.

Настоящее исследование призвано дать всесторонний обзор темы парсинга данных с Яндекс.Карт и 2ГИС. Структура документа построена таким образом, чтобы последовательно провести читателя через все ключевые аспекты этого процесса:

Часть I (Введение и правовые основы): После текущего введения, вторая глава будет посвящена детальному анализу юридических аспектов парсинга в России, включая пользовательские соглашения сервисов, релевантное законодательство и судебную практику.
Часть II (Технологии и методы парсинга Яндекс.Карт): Третья глава рассмотрит возможности и ограничения официальных API Яндекс.Карт. Четвертая глава углубится в продвинутые техники парсинга Яндекс.Карт без использования официальных API, включая анализ сетевых запросов и применение специализированных библиотек.
Часть III (Технологии и методы парсинга 2ГИС): Пятая глава аналогичным образом проанализирует официальные API 2ГИС. Шестая глава будет посвящена методам парсинга 2ГИС при обходе систем защиты.
Часть IV (Продвинутые техники и преодоление сложностей парсинга): Седьмая глава объединит общие для обеих платформ продвинутые техники, такие как использование прокси-серверов, управление User-Agent, решение CAPTCHA и эмуляция поведения пользователя для обхода блокировок.
Часть V (Обработка, хранение и использование спарсенных данных): Восьмая глава рассмотрит вопросы структурирования, выбора форматов хранения (CSV, JSON, Parquet) и эффективной загрузки данных в базы данных на примере PostgreSQL с PostGIS. Девятая глава даст краткий обзор возможностей анализа и визуализации собранных геоданных.
Часть VI (Заключение и рекомендации): Десятая глава подведет итоги исследования, сформулирует сводные рекомендации по ответственному и эффективному парсингу, а также представит прогноз развития технологий в этой области.

Цель данной структуры – предоставить читателю своего рода дорожную карту, охватывающую весь жизненный цикл процесса парсинга: от понимания его ценности и правовых рамок до конкретных технических реализаций, преодоления сложностей и, наконец, использования полученных данных.

Глава 2: Юридические аспекты парсинга в России: На грани закона

Прежде чем приступать к технической реализации парсинга данных с Яндекс.Карт и 2ГИС, необходимо тщательно изучить правовую сторону вопроса. Автоматизированный сбор данных с веб-сайтов находится в сложной юридической плоскости, где пересекаются условия использования самих сервисов, нормы гражданского и даже уголовного законодательства. Недооценка этих аспектов может привести к серьезным последствиям, включая финансовые потери, блокировку доступа и юридическое преследование.

2.1. Пользовательские соглашения (Terms of Service) Яндекс.Карт и 2ГИС: Первичный барьер.

Первым и наиболее очевидным источником ограничений являются пользовательские соглашения (Terms of Service, ToS) самих платформ. Эти документы представляют собой публичную оферту, и, начиная использовать сервис, пользователь автоматически соглашается с изложенными в них условиями.

2.1.1. Анализ Условий использования сервиса Яндекс.Карты.
Для Яндекс.Карт основным документом, регулирующим использование картографического сервиса, являются «Условия использования сервиса Яндекс Карты».⁴ Ключевым для рассматриваемой темы является пункт 4.6 данных Условий, который гласит: «Любая информация, используемая в Сервисе, предназначена исключительно для личного некоммерческого использования. Любое копирование Данных, их воспроизведение, переработка, распространение, доведение до всеобщего сведения (опубликование) в сети Интернет, любое использование в средствах массовой информации и/или в коммерческих целях без предварительного письменного разрешения правообладателя запрещается». Исключения составляют случаи, прямо предусмотренные функциональными возможностями сервиса, настоящими Условиями, условиями использования других сервисов Яндекса или документами, указанными в п. 1.2. настоящих Условий.⁴
Этот пункт недвусмысленно запрещает автоматизированный сбор данных (который является формой копирования и воспроизведения) для любых коммерческих целей, а также для некоммерческих целей, выходящих за рамки «личного использования», без явного письменного разрешения Яндекса.
Кроме того, использование сервиса Яндекс.Карты регулируется и другими документами, с которыми пользователь также обязуется ознакомиться ⁵:

Пользовательское соглашение сервисов Яндекса (yandex.ru/legal/rules).
Лицензия на использование поисковой системы Яндекса (yandex.ru/legal/termsofuse).
Политика конфиденциальности (yandex.ru/legal/confidential).
Условия использования сервиса API Яндекс.Карты (yandex.ru/legal/maps_api/), если используется API.

Формулировки в этих документах, как правило, достаточно широки, чтобы охватить различные формы автоматизированного извлечения данных. Ограничение «личное некоммерческое использование» является фундаментальным. Важно отметить, что, согласно пункту 1.1 Условий использования API Яндекс.Карт, пользователь самостоятельно несет риск неознакомления со всеми регулирующими документами.⁵

2.1.2. Анализ «Соглашения об использовании сервисов 2ГИС».
Компания 2ГИС также устанавливает четкие правила использования своих сервисов. Основным документом является «Соглашение об использовании сервисов 2ГИС».⁶
Пункт 2.13 данного Соглашения прямо запрещает Пользователю самостоятельно или с привлечением третьих лиц применять стороннее программное обеспечение, делать любые автоматические и автоматизированные запросы, анализ, применять любые автоматические и автоматизированные скрипты, программы, боты и другие средства для сбора, выгрузки и (или) передачи каких-либо данных и информации при использовании Сервисов 2ГИС и (или) Личного кабинета и при взаимодействии с ними, если это напрямую не разрешено настоящим Соглашением. Администрация также может запретить такое автоматическое и автоматизированное обращение к Сервисам 2ГИС и (или) Личному кабинету, а также прекратить прием, передачу, выгрузку любой информации, сгенерированной автоматически или автоматизировано, путем направления Пользователю соответствующего уведомления по электронной почте.⁶
Дополнительно, пункт 3.4 Соглашения устанавливает, что использование Платформы и (или) Сайта Администрации иными способами, в том числе путем копирования (воспроизведения) размещенного на Сайте Контента, а также входящих в состав Платформы и (или) Сайта Администрации элементов дизайна, программ для ЭВМ и баз данных, их декомпиляция и модификация, строго запрещены.⁶ Это положение косвенно запрещает парсинг, так как он по своей сути является формой копирования и воспроизведения контента.
Помимо основного соглашения, могут существовать и другие релевантные документы, например, «Лицензионное соглашение» для программных продуктов 2ГИС ⁷ и «Политика конфиденциальности».⁸ Лицензионное соглашение ⁷ часто указывает на некоммерческий характер использования бесплатных версий продуктов и неприменимость законодательства о защите прав потребителей. Политика конфиденциальности ⁸ регулирует обработку персональных данных и может содержать запрет на сбор персональных данных третьих лиц без их согласия, что актуально, если в процессе парсинга извлекаются, например, отзывы с указанием имен авторов или иная личная информация. Пользовательские соглашения для специфических сервисов, таких как магазин 2ГИС ⁹, или требования к размещаемому контенту ⁶, хотя и могут быть менее релевантны непосредственно к парсингу карт, демонстрируют общую юридическую политику компании, направленную на контроль использования своих ресурсов.
2.1.3. Сравнительный анализ и общие выводы по Пользовательским соглашениям.
Анализ пользовательских соглашений Яндекс.Карт и 2ГИС показывает, что обе компании занимают схожую позицию в отношении автоматизированного сбора данных:

Явный запрет: Обе платформы прямо или косвенно запрещают автоматизированный сбор (парсинг) данных со своих сервисов без специального разрешения, особенно для коммерческих целей или в объемах, превышающих личное использование.
Последствия нарушения: Нарушение этих условий может привести к блокировке доступа к сервисам, а также служить основанием для предъявления юридических претензий со стороны правообладателей.
Публичная оферта: Пользовательские соглашения являются публичной офертой, и факт использования сервиса означает полное и безоговорочное согласие с их условиями. Ссылка на незнание или непонимание условий («не читал») не будет являться юридически значимым оправданием. Яндекс прямо указывает: «Пользователь обязуется ознакомиться со всеми Регулирующими документами и самостоятельно несет риск такого неознакомления».⁵ Аналогично, 2ГИС определяет свои соглашения как публичную оферту, акцептуемую действиями пользователя.⁹ Это стандартная юридическая практика, и суды исходят из того, что пользователь имел возможность ознакомиться с условиями.

Для наглядности, ключевые ограничивающие пункты сведены в таблицу.Таблица 1: Ключевые ограничивающие пункты в Пользовательских соглашениях Яндекс.Карт и 2ГИС.

Платформа	Ссылка на документ	Номер пункта (примерный)	Краткое содержание ограничения	Возможные последствия нарушения (согласно соглашению)
Яндекс.Карты	yandex.ru/legal/maps_termsofuse/	4.6	Запрет на копирование, воспроизведение, переработку, распространение данных, использование в коммерческих целях без письменного разрешения правообладателя.	Прекращение доступа к Сервису, иные меры.
Яндекс.Карты	yandex.ru/legal/maps_api/	1.1, Общие положения	Использование API регулируется Соглашением и Регулирующими документами. Пользователь несет риск неознакомления.	Прекращение доступа к API, ответственность по закону.
2ГИС	law.2gis.ru/rules	2.13	Запрет на применение стороннего ПО, автоматических запросов, скриптов, ботов для сбора, выгрузки данных без прямого разрешения.	Блокировка автоматизированного обращения, иные меры.
2ГИС	law.2gis.ru/rules	3.4	Запрет на копирование (воспроизведение) контента, элементов дизайна, программ для ЭВМ и баз данных, их декомпиляцию и модификацию.	Ответственность в соответствии с законодательством.

Эта таблица наглядно демонстрирует, что владельцы платформ юридически закрепили свое право контролировать доступ к данным и их использование.

2.2. Российское законодательство и парсинг: Более глубокий уровень.

Помимо пользовательских соглашений, парсинг данных регулируется и более общими нормами российского законодательства. Данные, размещенные на картографических сервисах, защищены не только контрактными обязательствами пользователя перед платформой, но и целым комплексом законодательных актов. Это создает своего рода «эшелонированную оборону» против несанкционированного извлечения информации.

2.2.1. Авторское право и смежные права на базы данных.
Российское законодательство рассматривает базы данных как объекты интеллектуальной собственности. Гражданский кодекс РФ (ГК РФ) предоставляет правовую охрану базам данных по двум направлениям:

Авторское право на базу данных как на составное произведение (ст. 1260 ГК РФ): Охраняется творческий характер подбора или расположения материалов. Составителю такой базы данных принадлежит авторское право на осуществленный им подбор или расположение материалов (составительство).¹²
Смежное право изготовителя базы данных (ст. 1334 ГК РФ): Охраняются существенные финансовые, материальные, организационные или иные затраты, понесенные на создание базы данных. Изготовителю базы данных, создание которой (включая обработку или представление соответствующих материалов) требует таких существенных затрат, принадлежит исключительное право извлекать из базы данных материалы и осуществлять их последующее использование в любой форме и любым способом.¹² Это право возникает независимо от наличия и действительности авторского права или иных исключительных прав на составляющие базу данных материалы.

Веб-сайты Яндекс.Карты и 2ГИС, с их огромными массивами структурированной и постоянно обновляемой информации, очевидно, подпадают под определение баз данных, требующих существенных затрат на их создание и поддержание. Следовательно, их владельцы (Яндекс и 2ГИС) обладают как авторскими, так и смежными правами на эти базы данных.Нарушение этих прав может повлечь за собой серьезные последствия. Правообладатель базы данных вправе требовать от нарушителя прекращения незаконного использования и возмещения убытков, либо выплаты компенсации в размере от десяти тысяч рублей до пяти миллионов рублей (ст. 1301, 1311 ГК РФ). ¹² прямо указывает на возможность взыскания компенсации до 5 млн. рублей.Закон устанавливает, что для возникновения смежного права изготовителя база данных должна содержать не менее десяти тысяч самостоятельных материалов (элементов) или ее создание должно быть связано с существенными затратами.¹² Картографические сервисы Яндекса и 2ГИС многократно превосходят этот порог по количеству элементов.Существует важный нюанс: статья 1260 ГК РФ указывает, что авторские права составителя сборника (или базы данных) не препятствуют другим лицам осуществлять самостоятельный подбор или расположение тех же материалов для создания своих произведений. Применительно к парсингу это иногда трактуется как разрешение извлекать отдельные, не являющиеся самостоятельными объектами авторского права, данные и располагать их по-своему. Однако это допустимо только при соблюдении трех условий ¹²:

Если извлекаемые данные сами по себе не являются объектами авторского права (например, отдельные факты, цифры, в отличие от фотографий или уникальных текстовых описаний).
Если не нарушаются смежные права изготовителя базы данных, то есть не копируется все содержимое базы данных или ее существенная часть (количественно или качественно). Определение «существенной части» может быть предметом спора.
Если не нарушается антимонопольное законодательство и не совершаются акты недобросовестной конкуренции.

Парсинг, особенно масштабный, очень легко может пересечь эту грань и быть признан нарушением смежных прав изготовителя базы данных.

2.2.2. Федеральный закон «Об информации, информационных технологиях и о защите информации» (№ 149-ФЗ).
Данный закон ¹³ устанавливает общие принципы правового регулирования отношений в сфере информации, информационных технологий и защиты информации. Хотя он напрямую не запрещает парсинг, его положения могут быть применимы. Например, если владелец информации (в данном случае, Яндекс или 2ГИС) установил определенные правила доступа к ней (через пользовательское соглашение или технические средства защиты), то обход этих правил может рассматриваться как нарушение установленного порядка доступа к информации. Закон также закрепляет право обладателя информации разрешать или ограничивать доступ к ней.
2.2.3. Федеральный закон «О персональных данных» (№ 152-ФЗ).
Этот закон ¹⁴ становится актуальным, если в процессе парсинга извлекаются персональные данные. К персональным данным относится любая информация, относящаяся к прямо или косвенно определенному или определяемому физическому лицу. В контексте Яндекс.Карт и 2ГИС это могут быть:

ФИО и контактные данные индивидуальных предпринимателей (если они не обезличены).
ФИО авторов отзывов, если они указаны.
Любая другая информация, позволяющая идентифицировать физическое лицо.

Сбор и обработка персональных данных без согласия субъекта (за исключением установленных законом случаев) запрещены. Нарушение законодательства о персональных данных влечет за собой административную ответственность (штрафы), а также обязанность прекратить обработку и уничтожить незаконно собранные данные. ² упоминает, что за сбор клиентских баз или защищенных данных предусмотрены штрафы, достигающие более 10 миллионов рублей. Политика конфиденциальности 2ГИС ⁸ также подчеркивает необходимость получения согласия на обработку персональных данных и запрещает сбор ПД третьих лиц без их согласия.

2.2.4. Статья 272 УК РФ: «Неправомерный доступ к компьютерной информации».
Это одна из наиболее серьезных потенциальных правовых проблем, связанных с парсингом, особенно если он осуществляется с обходом технических средств защиты. Статья 272 Уголовного кодекса РФ ¹⁵ предусматривает ответственность за неправомерный доступ к охраняемой законом компьютерной информации, если это деяние повлекло уничтожение, блокирование, модификацию либо копирование компьютерной информации.
Ключевые моменты:

Неправомерный доступ: Это доступ к информации лицом, не обладающим правами на получение и работу с данной информацией, или в нарушение установленных правил. Если пользовательское соглашение запрещает автоматизированный сбор, а парсер обходит технические средства защиты (CAPTCHA, IP-блокировки, проверки User-Agent, требования авторизации), такой доступ может быть признан неправомерным.¹⁵
Копирование информации: Парсинг по своей сути является систематическим копированием информации. Сам факт копирования информации в результате неправомерного доступа уже является одним из обязательных последствий, указанных в диспозиции ч.1 ст. 272 УК РФ.¹⁵
Охраняемая законом информация: Информация, содержащаяся в базах данных Яндекс.Карт и 2ГИС, является коммерческой информацией, защищенной как условиями использования, так и нормами об интеллектуальной собственности.
Субъективная сторона: Преступление совершается с прямым умыслом. То есть лицо осознает, что осуществляет доступ к информации без надлежащих прав и копирует ее, предвидит общественно опасные последствия и желает их наступления.¹⁵
Санкции: Наказание по ч.1 ст. 272 УК РФ варьируется от штрафа до двухсот тысяч рублей до лишения свободы на срок до двух лет. Если деяние причинило крупный ущерб, совершено из корыстной заинтересованности, группой лиц по предварительному сговору, с использованием служебного положения или повлекло тяжкие последствия, наказание ужесточается (штрафы до пятисот тысяч рублей, лишение свободы на более длительные сроки).¹⁶

Важно понимать, что для квалификации действий по ст. 272 УК РФ не обязательно осуществлять «взлом» сервера в традиционном понимании этого слова. Преодоление программных средств защиты, установленных владельцем ресурса для предотвращения несанкционированного доступа и копирования, уже может быть достаточным основанием. Как отмечается в анализе ¹⁵, простой просмотр информации не образует состава преступления, однако парсинг – это целенаправленное и систематическое извлечение и копирование. Примеры из судебной практики ¹⁵ показывают, что даже ситуации, кажущиеся бытовыми (например, несанкционированный доступ к аккаунту в соцсети из ревности), могут привести к возбуждению уголовного дела по данной статье, что свидетельствует о потенциально низком пороге для начала расследования.

2.2.5. Прочие риски и виды ответственности.
Помимо вышеперечисленного, существуют и другие риски:

Создание помех работе серверов (DDoS-атаки): Чрезмерно агрессивный парсинг, создающий высокую нагрузку на серверы Яндекс.Карт или 2ГИС, может быть расценен как разновидность DDoS-атаки. Это может привести к неработоспособности ресурса для других пользователей. За такие действия предусмотрена уголовная ответственность (ст. 273 УК РФ «Создание, использование и распространение вредоносных компьютерных программ», если парсер содержит элементы, нарушающие нормальную работу, или ст. 274.1 УК РФ «Неправомерное воздействие на критическую информационную инфраструктуру Российской Федерации», если объект атаки подпадает под это определение) и значительные штрафы.²
Рассылка спама: Использование собранных контактных данных (email, телефонов) для массовых рассылок без согласия получателей является нарушением законодательства о рекламе и может повлечь штрафы до 500 000 рублей за каждое сообщение.²
Плагиат и нарушение авторских прав на контент: Если в процессе парсинга извлекаются уникальные текстовые описания, фотографии, видео или другие материалы, являющиеся самостоятельными объектами авторского права, их использование без разрешения правообладателя будет нарушением авторских прав.²
Недобросовестная конкуренция: Использование спарсенных данных для получения необоснованных преимуществ на рынке, копирования бизнес-моделей или нанесения ущерба конкурентам может быть квалифицировано как акт недобросовестной конкуренции (глава 2.1 Федерального закона «О защите конкуренции»).

Для систематизации информации о различных видах ответственности ниже приведена таблица.Таблица 2: Виды ответственности и возможные санкции за неправомерный парсинг в РФ.

Вид нарушения	Нормативный акт	Возможные санкции (штраф, компенсация, блокировка, исправительные работы, лишение свободы)	Источник информации
Нарушение Пользовательского соглашения (ToS)	Пользовательское соглашение сервиса	Блокировка доступа, расторжение соглашения, возможные гражданско-правовые иски от владельца сервиса.	⁴
Нарушение авторских/смежных прав на базу данных	Гражданский кодекс РФ (ст. 1260, 1301, 1311, 1334)	Компенсация до 5 млн. рублей, возмещение убытков, прекращение нарушения.	¹²
Нарушение ФЗ «О персональных данных» (№ 152-ФЗ)	КоАП РФ (ст. 13.11), ФЗ-152	Штрафы (до нескольких миллионов рублей для юрлиц), предписание об уничтожении данных.	²
Неправомерный доступ к компьютерной информации	Уголовный кодекс РФ (ст. 272)	Штраф (до 500 тыс. руб. и выше), исправительные работы, ограничение свободы, принудительные работы, лишение свободы.	¹⁵
Создание помех работе серверов (DDoS-подобная активность)	Уголовный кодекс РФ (ст. 273, 274.1)	Штрафы (до нескольких сотен тысяч рублей и выше), лишение свободы.	²
Рассылка спама с использованием спарсенных данных	КоАП РФ (ст. 14.3), ФЗ «О рекламе»	Штрафы (до 500 тыс. рублей за каждое сообщение для юрлиц).	²
Нарушение авторских прав на контент (тексты, фото)	Гражданский кодекс РФ (ст. 1259, 1301)	Компенсация до 5 млн. рублей за каждый объект, возмещение убытков.	²

Эта таблица наглядно демонстрирует, что неправомерный парсинг может повлечь за собой широкий спектр юридических последствий, от гражданско-правовой до уголовной ответственности.

2.3. Судебная практика: Реальные кейсы и их значение.

Анализ судебной практики позволяет оценить, как теоретические нормы права применяются в реальных спорах, связанных с парсингом и использованием данных.

Дело «ВКонтакте» против ООО «Дабл» ¹²:

Суть дела: IT-компания «Дабл» осуществляла сбор данных пользователей социальной сети «ВКонтакте» (ВК) с их страниц и продавала эту информацию банкам для оценки кредитоспособности. Сбор производился с помощью программного бота без согласия ВК как правообладателя базы данных.
Итог: Судебный спор длился несколько лет (с 2017 по 2022 год) и завершился заключением мирового соглашения. По условиям соглашения, ООО «Дабл» обязалось не нарушать права «ВКонтакте» как владельца соцсети и соблюдать права ее пользователей. Важно, что в ходе разбирательства Суд по интеллектуальным правам подтвердил, что интересы владельца социальной сети (в данном случае, ВК) защищаются смежным правом изготовителя базы данных.
Значение: Этот кейс является важным прецедентом. Он демонстрирует, что крупные интернет-платформы готовы активно защищать свои базы данных в судебном порядке, и суды признают их права как изготовителей баз данных. Это повышает риски для компаний, занимающихся коммерческим парсингом данных с подобных ресурсов. Сам факт длительного судебного разбирательства и признания прав ВК является сильным сдерживающим фактором для других потенциальных парсеров.
Примеры из практики по ст. 272 УК РФ 15:
Хотя не все приведенные примеры напрямую касаются парсинга геоданных, они иллюстрируют общий подход правоохранительных органов и судов к делам о неправомерном доступе к компьютерной информации.

Пример 1 (Компьютерный вирус для доступа): Сотрудник IT-отдела скопировал вредоносную программу и с ее помощью получил доступ к логину и паролю для подключения к сети Интернет. Действия были квалифицированы по ч.2 ст. 272 УК РФ и ч.1 ст. 165 УК РФ (причинение имущественного ущерба). Обвиняемый был приговорен к условному лишению свободы и штрафу.¹⁵ Этот пример показывает, что неправомерное получение доступа к информации с последующим ее использованием может привести к уголовной ответственности.
Пример 2 (Изменение пароля в соцсети): Гражданка из ревности подсмотрела пароль от аккаунта в социальной сети, изменила его, ознакомилась с перепиской и удалила фотографии. Уголовное дело было прекращено в связи с примирением сторон, однако автор статьи ¹⁵ подчеркивает, что в ином случае мог быть вынесен обвинительный приговор со штрафом или даже лишением свободы. Этот случай демонстрирует, что даже «бытовые» ситуации неправомерного доступа к информации могут повлечь возбуждение уголовного дела по ст. 272 УК РФ.
Пример 3 (Спам-рассылка с взломанного аккаунта): Неизвестные лица получили неправомерный доступ к странице пользователя в соцсети и осуществили спам-рассылку, что повлекло блокирование и модификацию компьютерной информации. Обвиняемый был приговорен к условному лишению свободы.¹⁵
Значение: Эти примеры подчеркивают, что статья 272 УК РФ применяется достаточно широко, и парсинг, особенно сопряженный с обходом систем защиты и копированием значительных объемов информации, потенциально может подпадать под ее действие.
Дело Harman International Industries (JBL) ¹²:

Суть дела: Американская компания Harman International Industries Incorporated, правообладатель промышленных образцов и товарного знака «JBL», обнаружила на российском сайте предложение к продаже колонок, схожих с ее продукцией. Ответчик (владелец сайта) пояснил, что карточка товара была создана автоматически с помощью парсера, и он выступал лишь информационным посредником.
Итог: Суд признал нарушение прав истца на интеллектуальную собственность (промышленные образцы) и обязал ответчика выплатить компенсацию.
Значение: Этот кейс важен тем, что показывает: даже если данные получены путем парсинга и отображаются на сайте в автоматическом режиме, владелец сайта может нести ответственность за содержание этих данных, если они нарушают чьи-либо права (например, права на товарные знаки, промышленные образцы, авторские права на изображения или тексты). Аргумент «это сделал парсер» не освобождает от ответственности.
Выводы из судебной практики:

Правообладатели (владельцы крупных веб-ресурсов) все активнее прибегают к судебной защите своих прав на данные.
Суды склонны признавать веб-сайты и их содержимое (включая пользовательский контент и структурированную информацию) базами данных, охраняемыми авторским и смежными правами.
Риск привлечения к юридической ответственности за несанкционированный парсинг реален, особенно если он осуществляется в коммерческих целях, в больших объемах или с явным обходом систем защиты.
Даже если парсер используется для наполнения «информационного» ресурса, владелец этого ресурса может быть привлечен к ответственности за нарушение прав третьих лиц, если спарсенный контент является контрафактным или нарушает иные права.

2.4. Этические соображения при парсинге.

Помимо строгих юридических норм, существуют и этические аспекты, которые следует учитывать при разработке и использовании парсеров:

Уважение к ресурсам сайта-источника: Агрессивный парсинг может создавать чрезмерную нагрузку на серверы целевого сайта, замедляя его работу для обычных пользователей или даже приводя к его временной недоступности. Этически корректный парсинг предполагает установку разумных задержек между запросами, ограничение количества одновременных потоков и уважение к файлу robots.txt (хотя юридически он не всегда является обязывающим, его игнорирование может быть расценено как недобросовестное поведение).
Прозрачность (если это применимо и возможно): В некоторых случаях, особенно при парсинге в исследовательских целях, может быть уместно указать в User-Agent своего парсера его назначение и контактную информацию. Однако в большинстве сценариев коммерческого парсинга это не практикуется из-за риска немедленной блокировки.
Приватность пользователей: Необходимо избегать сбора и использования избыточных персональных данных, особенно если они не являются необходимыми для заявленных целей парсинга. Если парсятся данные, содержащие личную информацию (например, отзывы с именами), следует продумать вопросы их анонимизации или получения согласия (что на практике крайне сложно при массовом парсинге).
Влияние на бизнес-модели сервисов: Следует осознавать, что массовый неконтролируемый парсинг может подрывать бизнес-модели компаний, которые вкладывают значительные средства в создание и поддержку своих баз данных. Хотя это соображение может не останавливать тех, кто ищет коммерческую выгоду, его стоит учитывать в общей оценке ситуации.
Баланс между доступностью информации и правами владельцев данных: Это фундаментальный этический вопрос. С одной стороны, свободный доступ к информации способствует инновациям и развитию. С другой стороны, правообладатели имеют законное право защищать свои инвестиции и контролировать использование созданных ими ресурсов. Поиск разумного баланса – сложная задача, не имеющая простого решения.

В заключение юридического обзора, необходимо подчеркнуть, что парсинг данных с Яндекс.Карт и 2ГИС – это деятельность, сопряженная со значительными правовыми рисками. Пренебрежение пользовательскими соглашениями и нормами действующего законодательства может привести не только к техническим проблемам (блокировкам), но и к серьезным юридическим последствиям. Поэтому перед началом любого проекта по парсингу настоятельно рекомендуется провести тщательный юридический анализ и оценить все возможные риски.

Часть II: Технологии и методы парсинга Яндекс.Карт

После рассмотрения правовых аспектов перейдем к технической стороне вопроса. Яндекс.Карты, как одна из ведущих геоинформационных платформ, предоставляет разработчикам определенные инструменты для доступа к своим данным, но также активно защищает их от несанкционированного сбора.

Глава 3: Официальные API Яндекс.Карт: Возможности и ограничения

Использование официальных API (Application Programming Interface) является наиболее легитимным и предпочтительным способом получения данных от Яндекса. API предоставляют структурированный доступ к информации, имеют документацию и поддерживаются разработчиками платформы.

3.1. Обзор доступных API Яндекс.Карт.

Яндекс предлагает несколько API, которые могут быть полезны для задач, связанных с геоданными и информацией об организациях:

JavaScript API и HTTP API Геокодера: Это фундаментальные инструменты. JavaScript API позволяет встраивать интерактивные карты на веб-сайты и в приложения, отображать объекты, строить маршруты и выполнять поиск.¹⁸ HTTP API Геокодера предназначен для преобразования почтовых адресов в географические координаты (прямое геокодирование) и наоборот – координат в адреса (обратное геокодирование).³
API Поиска по организациям (Places API / API Геопоиска): Этот API является ключевым для сбора информации об организациях. Он позволяет находить компании и другие объекты по различным параметрам: ключевым словам, категориям, в определенной географической области (например, по координатам и радиусу или в пределах видимой области карты).³ Результаты поиска обычно содержат название организации, адрес, телефон, сайт, часы работы, рейтинг и другую атрибутивную информацию.
API Матрицы расстояний (Distance Matrix API): Позволяет рассчитывать время и расстояние для множества пар точек (пунктов отправления и назначения). Этот API полезен для логистических задач, но менее релевантен для прямого парсинга данных об организациях.³
API Маршрутизатора (Directions API): Позволяет строить оптимальные маршруты между двумя или несколькими точками с учетом различных параметров (тип транспорта, избегание платных дорог и т.д.).³
Static API (API Статических карт): Предоставляет возможность получать статические изображения карт в виде картинок (PNG, JPG). Используется, когда интерактивная карта не нужна.
MapKit SDK: Набор библиотек для разработки мобильных приложений (iOS, Android) с использованием карт Яндекса.

Важно подчеркнуть, что любое использование этих API регулируется специальными «Условиями использования API Яндекс.Карты» ⁵, которые необходимо внимательно изучить перед началом работы.

3.2. Получение API-ключа и условия использования.

Для работы с большинством API Яндекс.Карт требуется API-ключ. Процесс его получения обычно включает следующие шаги ¹⁸:

Регистрация в Кабинете разработчика Яндекса: Необходимо иметь аккаунт Яндекса.
Подключение API: В Кабинете разработчика нужно выбрать необходимые API (например, «JavaScript API и HTTP API Геокодера») и нажать «Подключить API».
Заполнение анкеты: Потребуется указать личные данные, контактную информацию, название компании (если применимо), описать проект и цели использования API.
Выбор условий использования: Яндекс предлагает различные тарифы, включая бесплатное использование с определенными ограничениями и коммерческие (платные) тарифы для более интенсивного использования или специфических нужд. Для бесплатного использования обычно требуется указать, что API будет использоваться в «открытой» системе, для «бесплатного» проекта и для «отображения данных на карте».¹⁸
Получение ключа: После одобрения заявки API-ключ становится доступен в Кабинете разработчика.

Условия использования API Яндекс.Карт могут различаться для бесплатного и платного доступа:

Лимиты запросов: Бесплатные ключи обычно имеют суточные или секундные лимиты на количество запросов к API. Превышение этих лимитов может привести к временной блокировке доступа.
Доступные функции: Некоторые расширенные функции API могут быть доступны только на платных тарифах.
Коммерческое использование: Для использования API в коммерческих проектах, как правило, требуется переход на платный тариф. Условия бесплатного использования часто запрещают прямое извлечение и хранение данных для создания собственных баз или перепродажи.
Требования к указанию авторства (attribution): При отображении карт или данных, полученных через API Яндекса, необходимо корректно указывать источник данных (логотип Яндекса, ссылки на условия использования), согласно требованиям документации.

3.3. Примеры кода на Python для взаимодействия с API.

Рассмотрим несколько примеров использования API Яндекс.Карт с помощью языка Python и библиотеки requests для выполнения HTTP-запросов.

3.3.1. Геокодирование адресов (HTTP API Геокодера).
API Геокодера позволяет получить координаты по адресу и наоборот.

Запрос: GET https://geocode-maps.yandex.ru/1.x/?apikey=ВАШ_API_КЛЮЧ&format=json&geocode=Москва, улица Тверская, дом 1
Python-код:

Python import requests import json api_key = "ВАШ_API_КЛЮЧ" address = "Москва, улица Тверская, дом 1" params = { "apikey": api_key, "format": "json", "geocode": address } try: response = requests.get("https://geocode-maps.yandex.ru/1.x/", params=params) response.raise_for_status() # Проверка на HTTP ошибки data = response.json() # Извлечение координат первого найденного объекта feature_member = data["response"]["GeoObjectCollection"]["featureMember"] if feature_member: point_str = feature_member["GeoObject"]["Point"]["pos"] longitude, latitude = map(float, point_str.split()) print(f"Адрес: {address}") print(f"Координаты: Широта={latitude}, Долгота={longitude}") # Полный адрес из ответа full_address = feature_member["GeoObject"]["text"] print(f"Полный адрес от Яндекса: {full_address}") else: print("Объект не найден.") except requests.exceptions.RequestException as e: print(f"Ошибка HTTP запроса: {e}") except (KeyError, IndexError) as e: print(f"Ошибка разбора JSON ответа: {e}") except Exception as e: print(f"Произошла ошибка: {e}")
Структура ответа: Ответ приходит в формате JSON (или XML по запросу) и содержит коллекцию геообъектов (GeoObjectCollection). Каждый объект включает координаты (Point.pos), точность геокодирования, полный адрес (GeocoderMetaData.text) и другую метаинформацию. Пример использования API Геокодера для преобразования адресов в геокоординаты также можно найти в руководстве Yandex DataSphere.¹⁹
3.3.2. Поиск организаций (API Поиска по организациям).
API Поиска по организациям (также известный как API Геопоиска или Places API) позволяет искать организации по различным критериям.
Запрос (примерный): GET https://search-maps.yandex.ru/v1/?apikey=ВАШ_API_КЛЮЧ_ДЛЯ_ПОИСКА&lang=ru_RU&text=кафе&ll=37.618920,55.756994&spn=0.1,0.1&type=biz&results=50

apikey: Специальный API-ключ для Поиска по организациям (может отличаться от ключа Геокодера).
text: Поисковый запрос (например, «кафе», «аптека»).
ll: Координаты центра области поиска (долгота, широта).
spn: Размеры области поиска (дельта долготы, дельта широты).
type=biz: Искать только организации.
results: Максимальное количество результатов на странице.

Python-код (скелет):
Python import requests import json # Внимание: Для API Поиска по организациям может требоваться отдельный ключ # и соблюдение специфических коммерческих условий. # Данный пример является иллюстративным. api_key_search = "ВАШ_API_КЛЮЧ_ДЛЯ_ПОИСКА" search_query = "кофейня" center_lon, center_lat = 37.618920, 55.756994 # Центр Москвы span_lon, span_lat = 0.05, 0.05 # Область поиска params = { "apikey": api_key_search, "lang": "ru_RU", "text": search_query, "ll": f"{center_lon},{center_lat}", "spn": f"{span_lon},{span_lat}", "type": "biz", "results": 50 # Максимальное количество результатов (может быть ограничено) # "rspn": "1", # Для поиска только в заданной области spn # "skip": 0 # Для пагинации } try: response = requests.get("https://search-maps.yandex.ru/v1/", params=params) response.raise_for_status() data = response.json() if "features" in data: for feature in data["features"]: company_meta = feature.get("properties", {}).get("CompanyMetaData", {}) name = company_meta.get("name") address = company_meta.get("address") url = company_meta.get("url") phones = [p.get("formatted") for p in company_meta.get("Phones",)] print(f"Название: {name}") print(f"Адрес: {address}") if url: print(f"Сайт: {url}") if phones: print(f"Телефоны: {', '.join(phones)}") print("-" * 20) else: print("Организации не найдены или ошибка в ответе.") # print(data) # Распечатать ответ для диагностики except requests.exceptions.RequestException as e: print(f"Ошибка HTTP запроса: {e}") except json.JSONDecodeError: print(f"Ошибка декодирования JSON. Ответ сервера: {response.text}") except Exception as e: print(f"Произошла ошибка: {e}")
Структура ответа: Ответ обычно содержит GeoJSON-подобную структуру со списком features. Каждая feature представляет собой найденную организацию и в properties.CompanyMetaData содержит ее атрибуты: название, адрес, телефоны, сайт, часы работы, категории и т.д.
3.3.3. Получение маршрутов.
Хотя это не прямой парсинг организаций, API Маршрутизатора может использоваться для анализа доступности объектов. Пример кода для этого API будет более сложным и зависит от конкретной задачи (автомобильный, пешеходный, общественный транспорт).

3.4. Лимиты, квоты и коммерческие условия.

Как уже упоминалось, использование API Яндекс.Карт сопряжено с ограничениями:

Бесплатные лимиты: Для JavaScript API и HTTP API Геокодера обычно существует дневной лимит бесплатных запросов (например, 25 000 запросов к Геокодеру в сутки, но эти цифры могут меняться и их нужно уточнять в актуальной документации). Для API Поиска по организациям условия бесплатного использования могут быть более строгими или отсутствовать для масштабного сбора данных.
Коммерческие тарифы: Для превышения лимитов, использования API в коммерческих продуктах или для специфических сценариев (например, хранение и анализ данных) Яндекс предлагает платные пакеты услуг. Стоимость зависит от объема запросов и набора используемых API.
Последствия превышения лимитов: При превышении бесплатных лимитов запросы к API начнут возвращать ошибки (например, HTTP 429 Too Many Requests или HTTP 403 Forbidden), и доступ может быть временно или постоянно заблокирован.

Официальные API Яндекса представляют собой легальный и поддерживаемый способ получения геоданных. Однако их ограничения по количеству запросов, стоимости платных тарифов, а также потенциальная неполнота данных по сравнению с тем, что отображается непосредственно на карте (это общее наблюдение для многих веб-сервисов, где API могут отдавать не всю доступную информацию), могут не удовлетворять всем потребностям разработчиков. Если требуемый объем данных очень велик, бюджет на использование API ограничен, или необходимы специфические данные, которые не предоставляются через официальные каналы, это может косвенно стимулировать поиск альтернативных методов сбора информации, таких как прямой парсинг веб-страниц.

Кроме того, работа с API требует определенных трудозатрат на разработку: необходимо получить ключи ¹⁹, внимательно изучить и соблюдать условия использования, корректно обрабатывать различные типы ответов и ошибок, а также следить за возможными изменениями в спецификациях API (версионирование, изменение эндпоинтов, полей ответа), что требует постоянной поддержки и обновления кода.

Таблица 3: Сравнение официальных API Яндекс.Карт для задач сбора данных.

Название API	Основное назначение	Тип возвращаемых данных	Ключевые параметры запроса (примеры)	Ограничения бесплатной версии (примерные, требуют уточнения)	Возможность коммерческого использования	Ссылка на документацию
HTTP API Геокодера	Преобразование адресов в координаты и обратно.	JSON, XML (координаты, адресные компоненты, метаданные).	apikey, geocode (адрес/координаты), format, sco (область).	~25,000 запросов/сутки.	Да, по коммерческим тарифам.	yandex.ru/dev/maps/geocoder/
API Поиска по организациям (Геопоиск)	Поиск организаций по названию, категории, местоположению.	JSON (GeoJSON-подобный формат с информацией об организациях: название, адрес, телефон, сайт, часы работы, рейтинг).	apikey, text, ll, spn, bbox, type, results, skip.	Лимиты могут быть строгими или требовать коммерческого ключа для масштабного сбора.	Да, по коммерческим тарифам.	yandex.ru/dev/maps/search/
JavaScript API	Встраивание интерактивных карт, отображение объектов, маршрутизация на клиенте.	Объекты JavaScript, события. Данные об организациях могут запрашиваться через встроенные модули поиска.	Зависит от используемых модулей (например, geocode, search).	Лимиты на количество загрузок карты и гео-операций.	Да, по коммерческим тарифам.	yandex.ru/dev/maps/jsapi/
API Матрицы расстояний	Расчет времени и расстояний между множеством точек.	JSON (матрица с временем/расстоянием).	apikey, origins, destinations, mode.	Обычно требует коммерческого ключа.	Преимущественно коммерческое.	yandex.ru/dev/routing/matrix/
API Маршрутизатора	Построение маршрутов.	JSON, XML (геометрия маршрута, маневры, время, расстояние).	apikey, waypoints, mode.	Ограниченное количество запросов бесплатно.	Да, по коммерческим тарифам.	yandex.ru/dev/routing/router/

Эта таблица помогает разработчикам быстро сориентироваться в доступных официальных инструментах Яндекса, понять их назначение и основные ограничения перед тем, как принимать решение об их использовании или поиске альтернативных путей.

Глава 4: Парсинг Яндекс.Карт без официального API: Продвинутые техники

Несмотря на наличие официальных API, в некоторых случаях разработчики прибегают к прямому парсингу веб-интерфейса Яндекс.Карт. Причины могут быть разными: необходимость получения данных, не доступных через API, желание обойти лимиты или стоимость коммерческих тарифов, или специфические требования проекта. Однако такой подход сопряжен со значительными техническими сложностями и юридическими рисками, как обсуждалось в Главе 2.

Яндекс.Карты, как и любая крупная и технологически развитая платформа, активно противодействует несанкционированному парсингу, постоянно совершенствуя свои механизмы защиты. Это приводит к своего рода «гонке вооружений»: по мере усложнения защиты разработчики парсеров вынуждены искать и применять все более изощренные методы обхода, переходя от простых HTTP-запросов к анализу внутреннего взаимодействия компонентов веб-приложения, использованию браузерной автоматизации и даже, в некоторых случаях, к реверс-инжинирингу API мобильных приложений (хотя последний аспект выходит за рамки данного исследования).

4.1. Анализ сетевых запросов Яндекс.Карт: В поисках «скрытых» API.

Современные веб-приложения, включая Яндекс.Карты, активно используют технологию AJAX (Asynchronous JavaScript and XML) для динамической подгрузки данных без перезагрузки всей страницы. Информация об организациях, результаты поиска, детали объектов часто загружаются с сервера посредством фоновых HTTP-запросов, обычно XHR (XMLHttpRequest). Анализ этих запросов может выявить внутренние (недокументированные) эндпоинты, которые фронтенд карт использует для получения данных.

Инструменты: Основным инструментом для такого анализа являются встроенные в веб-браузеры «Инструменты разработчика» (Developer Tools), особенно вкладка «Сеть» (Network). Она позволяет отслеживать все HTTP-запросы, которые страница отправляет на сервер.
Идентификация эндпоинтов: При взаимодействии с картой (например, при вводе поискового запроса, перемещении по карте, клике на значок организации) необходимо внимательно следить за списком запросов на вкладке «Сеть», фильтруя их по типу XHR или Fetch. Цель – найти запросы, которые возвращают структурированные данные (обычно в формате JSON) об искомых объектах. URL этих запросов и есть потенциальные «скрытые» эндпоинты.
Анализ структуры запросов: Для каждого интересного запроса необходимо изучить:

Метод: GET или POST.
Параметры URL (query parameters): Для GET-запросов они являются частью URL. Типичные параметры могут включать:

ll: Координаты центра карты (долгота, широта).
spn: Масштаб или размер видимой области карты.
bbox: Координаты ограничивающего прямоугольника (bounding box), в пределах которого осуществляется поиск.
text или query: Поисковый запрос пользователя.
type: Тип искомых объектов (например, «biz» для организаций).
lang: Язык ответа.
results или limit: Количество запрашиваемых результатов.
skip или page или offset: Параметры для пагинации (получения следующих страниц результатов).
Различные токены сессии, идентификаторы пользователя или устройства, которые могут использоваться для защиты.
Заголовки (Headers): Особенно важны:

User-Agent: Строка, идентифицирующая браузер и операционную систему. Яндекс.Карты могут блокировать запросы с отсутствующим или подозрительным User-Agent.
Referer: URL страницы, с которой был сделан запрос.
X-Requested-With: XMLHttpRequest: Часто указывает на AJAX-запрос.
Кастомные заголовки, которые могут содержать токены авторизации, CSRF-токены или другие параметры, необходимые для успешного выполнения запроса.
Тело запроса (Payload): Для POST-запросов параметры передаются в теле, часто в формате JSON или application/x-www-form-urlencoded.
Анализ структуры ответов:

Формат: Чаще всего это JSON, но иногда могут встречаться и другие форматы, например, Protocol Buffers (protobuf). Если данные передаются в protobuf, это значительно усложняет парсинг, так как для их десериализации требуются соответствующие .proto файлы (определения структуры данных), которые обычно не являются публичными.
Ключевые поля: В JSON-ответе необходимо найти поля, содержащие нужную информацию: названия организаций, адреса, телефоны, веб-сайты, геокоординаты, категории, часы работы, отзывы и т.д. Структура ответа может быть сложной и вложенной.

Пример гипотетического анализа: Предположим, при поиске «рестораны» в определенном районе Москвы на Яндекс.Картах, в Инструментах разработчика обнаруживается XHR GET-запрос к URL вида https://api-maps.yandex.ru/services/search/v2/, содержащий параметры text=рестораны, bbox=координаты_района, results=20, token=некий_токен. Ответ приходит в JSON и содержит массив объектов, каждый из которых описывает ресторан с его атрибутами. Задача парсера – научиться формировать такие запросы (включая получение или генерацию token, если он динамический) и извлекать данные из ответа.Следует понимать, что использование таких недокументированных эндпоинтов является прямым нарушением Условий использования сервиса Яндекс.Карты ⁴, которые запрещают любое использование, кроме как через официальные средства или с письменного разрешения. Яндекс не несет никаких обязательств по поддержке стабильности таких API: URL, параметры, формат ответа, механизмы защиты могут быть изменены в любой момент без какого-либо предупреждения. Это делает парсеры, основанные на «скрытых» API, крайне нестабильными и требующими постоянного мониторинга и адаптации.

4.2. Разработка парсера на Python с использованием requests и BeautifulSoup/lxml.

Если в результате анализа сетевых запросов удалось выявить эндпоинты, возвращающие данные в формате JSON или в виде HTML-фрагментов, можно попытаться разработать парсер с использованием библиотеки requests для выполнения HTTP-запросов и, при необходимости, BeautifulSoup или lxml для разбора HTML.

Предпосылка: Для Яндекс.Карт данные об организациях чаще всего передаются через XHR-запросы в формате JSON. В этом случае BeautifulSoup или lxml могут не понадобиться, так как JSON легко разбирается встроенными средствами Python (json.loads() или методом response.json() у объекта ответа requests). Если же какая-то информация встроена непосредственно в HTML-код основной страницы (что менее вероятно для динамических карт), то эти библиотеки будут полезны.
Пошаговое создание парсера (для JSON ответа от «скрытого» API):

Формирование URL запроса: На основе анализа из п. 4.1, конструируется URL с необходимыми параметрами (поисковый запрос, координаты, токены и т.д.).
Настройка заголовков: Обязательно устанавливается корректный User-Agent, имитирующий реальный браузер. Могут потребоваться и другие заголовки (Referer, Accept, кастомные токены).
Отправка запроса: Используется requests.get() или requests.post() в зависимости от метода, определенного на этапе анализа.
Обработка ответа:

Проверка HTTP-статус кода ответа (например, response.status_code == 200).
Разбор JSON-ответа: data = response.json().

Извлечение данных: Навигация по структуре полученного JSON-объекта для извлечения нужных полей (названия, адреса, телефоны и т.д.).
Реализация пагинации: Если API поддерживает пагинацию (например, через параметры skip и results, или page), необходимо реализовать цикл для последовательного запроса всех страниц с результатами.
Обработка ошибок: Внедрение блоков try-except для отлова сетевых ошибок (requests.exceptions.RequestException), ошибок разбора JSON (json.JSONDecodeError), а также специфических ошибок API (например, если токен устарел или превышены лимиты). Реализация логики повторных попыток (retries) с задержками.

Пример кода (скелет для гипотетического эндпоинта):

Python import requests import json import time BASE_URL = "https://example-yandex-maps-internal-api.com/search" # Гипотетический URL API_TOKEN = "некий_динамический_или_статический_токен" headers = { "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/90.0.4430.93 Safari/537.36", "Authorization": f"Bearer {API_TOKEN}", # Пример заголовка авторизации "X-Custom-Header": "some_value" } def parse_organizations(query, bbox_coords): """ Парсит организации по запросу в заданной географической области. bbox_coords: строка вида "lon1,lat1~lon2,lat2" """ results_per_page = 50 page_num = 0 all_organizations = while True: params = { "text": query, "bbox": bbox_coords, "type": "biz", "lang": "ru_RU", "results": results_per_page, "skip": page_num * results_per_page # Другие необходимые параметры, выявленные при анализе } try: response = requests.get(BASE_URL, headers=headers, params=params, timeout=10) response.raise_for_status() data = response.json() organizations_on_page = data.get("features",) if not organizations_on_page: break # Нет больше результатов for org_feature in organizations_on_page: try: org_data = {} company_meta = org_feature.get("properties", {}).get("CompanyMetaData", {}) org_data["name"] = company_meta.get("name") org_data["address"] = company_meta.get("address") org_data["id"] = company_meta.get("id") #... извлечение других полей... geometry_coords = org_feature.get("geometry", {}).get("coordinates") if geometry_coords and len(geometry_coords) == 2: org_data["longitude"] = geometry_coords org_data["latitude"] = geometry_coords all_organizations.append(org_data) except Exception as e: print(f"Ошибка извлечения данных для организации: {org_feature.get('id', 'N/A')}, {e}") print(f"Спарсено {len(organizations_on_page)} организаций со страницы {page_num + 1}") # Проверка, есть ли еще страницы (логика зависит от API) # Например, если общее количество известно: # total_results = data.get("properties", {}).get("ResponseMetaData", {}).get("SearchResponse", {}).get("found", 0) # if (page_num + 1) * results_per_page >= total_results: # break # Или если API возвращает признак последней страницы page_num += 1 time.sleep(1) # Задержка между запросами except requests.exceptions.Timeout: print("Таймаут запроса, повтор через 5 секунд...") time.sleep(5) except requests.exceptions.HTTPError as http_err: print(f"HTTP ошибка: {http_err}, код: {response.status_code}") if response.status_code == 401 or response.status_code == 403: print("Проблема с авторизацией или доступом. Возможно, токен устарел.") break # Другие обработки кодов ошибок break except Exception as e: print(f"Общая ошибка: {e}") break return all_organizations if __name__ == "__main__": # Пример: поиск кафе в центре Москвы # Координаты bbox (нижний левый угол ~ верхний правый угол) # Долгота от 37.5 до 37.7, Широта от 55.7 до 55.8 moscow_center_bbox = "37.5,55.7~37.7,55.8" found_cafes = parse_organizations("кафе", moscow_center_bbox) print(f"\nВсего найдено организаций: {len(found_cafes)}") # for cafe in found_cafes: # print(cafe)

Существуют открытые проекты на GitHub, такие как asluchevskiy/yandex-maps-spider-example ²⁰, которые представляют собой примеры веб-скрейперов для Яндекс.Карт. Хотя данный репозиторий был создан достаточно давно (более 10 лет назад на момент написания этого текста) и его актуальность может быть под вопросом, анализ его кода (в частности, файла main.py, если бы он был доступен для детального разбора в рамках подготовки этого материала ²⁰) мог бы дать представление о том, какие эндпоинты и подходы использовались ранее.

4.3. Использование Selenium/Playwright для парсинга динамического контента и взаимодействия с картой.

Если данные на Яндекс.Картах подгружаются сложным образом с помощью JavaScript, и не удается выявить простые XHR-запросы для их получения, или если для доступа к данным требуется эмуляция сложных пользовательских взаимодействий (клики по кнопкам, прокрутка карты, выбор опций в фильтрах, прохождение через несколько этапов интерфейса), то на помощь приходят инструменты браузерной автоматизации, такие как Selenium или Playwright.

Когда это необходимо:

Контент генерируется на стороне клиента JavaScript-фреймворками (React, Angular, Vue).
Отсутствуют очевидные XHR-запросы, возвращающие нужные данные в чистом виде.
Требуется взаимодействие с элементами интерфейса для активации загрузки данных.
Сайт использует продвинутые техники защиты от ботов, основанные на анализе поведения браузера, которые сложно имитировать простыми HTTP-запросами.
Основные шаги при работе с Selenium/Playwright:

Настройка WebDriver (для Selenium) или Browser Context (для Playwright): Установка и настройка драйвера для управления браузером (например, ChromeDriver для Google Chrome, GeckoDriver для Firefox). Playwright имеет свои собственные драйверы.
Запуск браузера и переход на страницу: Открытие Яндекс.Карт в управляемом браузере.
Поиск элементов на странице: Использование локаторов (XPath-выражения, CSS-селекторы, ID элементов) для нахождения нужных элементов интерфейса: поля ввода поискового запроса, кнопки «Найти», контейнеров с карточками организаций, кнопок пагинации и т.д.
Эмуляция действий пользователя:

Ввод текста в поля (element.send_keys(«запрос»)).
Клики по кнопкам (element.click()).
Прокрутка страницы/карты для подгрузки новых элементов.
Ожидание появления элементов или загрузки данных (WebDriverWait в Selenium, аналогичные механизмы в Playwright). Это критически важно, так как контент загружается асинхронно.

Извлечение данных: После того как нужная информация отобразилась на странице, ее можно извлечь из HTML-структуры с помощью методов типа .text (для получения текстового содержимого элемента) или .get_attribute(«атрибут») (для получения значения атрибута элемента).

Пример кода (скелет на Selenium):

Python from selenium import webdriver from selenium.webdriver.common.by import By from selenium.webdriver.common.keys import Keys from selenium.webdriver.support.ui import WebDriverWait from selenium.webdriver.support import expected_conditions as EC import time # Путь к chromedriver.exe (или используйте webdriver-manager) # DRIVER_PATH = 'путь/к/chromedriver' # driver = webdriver.Chrome(executable_path=DRIVER_PATH) # Рекомендуется использовать webdriver-manager для автоматического управления драйверами from selenium.webdriver.chrome.service import Service as ChromeService from webdriver_manager.chrome import ChromeDriverManager driver = webdriver.Chrome(service=ChromeService(ChromeDriverManager().install())) wait = WebDriverWait(driver, 20) # Увеличенное время ожидания try: driver.get("https://yandex.ru/maps/") # Ожидание и закрытие возможных всплывающих окон (например, о куки или геолокации) try: # Пример: закрытие предложения определить местоположение close_geolocation_popup = wait.until(EC.element_to_be_clickable((By.XPATH, "//div[contains(@class, 'popup')]//div[contains(text(),'Нет, спасибо')] | //button[contains(.,'Закрыть')]"))) # Примерный XPath close_geolocation_popup.click() print("Закрыто всплывающее окно геолокации (если было).") except Exception: print("Всплывающее окно геолокации не найдено или не удалось закрыть.") pass # Продолжаем, если окна нет # Находим поле ввода поиска # XPath может меняться, его нужно актуализировать search_box_xpath = "//input[@placeholder='Поиск мест и адресов']" search_box = wait.until(EC.presence_of_element_located((By.XPATH, search_box_xpath))) search_query = "пиццерия Москва" search_box.send_keys(search_query) search_box.send_keys(Keys.ENTER) print(f"Введен поисковый запрос: {search_query}") # Ожидание загрузки результатов поиска # XPath для контейнера с результатами (нужно найти актуальный) results_container_xpath = "//div[@class='search-list-view__list']" # Примерный XPath wait.until(EC.presence_of_element_located((By.XPATH, results_container_xpath))) print("Результаты поиска загружены.") time.sleep(5) # Дополнительная пауза для полной прорисовки organizations_data = # Пример: извлечение названий первых нескольких организаций # XPath для элементов списка организаций (нужно найти актуальный) organization_elements_xpath = f"{results_container_xpath}//div[contains(@class, 'search-snippet-view')]" # Примерный XPath # Попытка прокрутки для загрузки большего количества результатов (если есть) # last_height = driver.execute_script("return document.body.scrollHeight") # for _ in range(3): # Прокрутить несколько раз # driver.execute_script("window.scrollTo(0, document.body.scrollHeight);") # time.sleep(3) # new_height = driver.execute_script("return document.body.scrollHeight") # if new_height == last_height: # break # last_height = new_height org_elements = driver.find_elements(By.XPATH, organization_elements_xpath) print(f"Найдено {len(org_elements)} элементов организаций на первой 'странице'.") for i, org_element in enumerate(org_elements[:10]): # Возьмем первые 10 для примера try: # XPath для названия и адреса внутри карточки (нужно найти актуальные) name_xpath = ".//div[contains(@class, 'search-business-snippet-view__title')]/a" # Пример address_xpath = ".//div[contains(@class, 'search-business-snippet-view__address')]" # Пример name = org_element.find_element(By.XPATH, name_xpath).text.strip() address = org_element.find_element(By.XPATH, address_xpath).text.strip() organizations_data.append({"name": name, "address": address}) print(f"Организация {i+1}: Название='{name}', Адрес='{address}'") except Exception as e: print(f"Не удалось извлечь данные для элемента {i+1}: {e}") print("\nСобранные данные:") for org in organizations_data: print(org) except Exception as e: print(f"Произошла ошибка в Selenium: {e}") finally: time.sleep(10) # Пауза перед закрытием, чтобы успеть посмотреть driver.quit()
Проблемы и недостатки Selenium/Playwright:

Скорость: Работа через браузер значительно медленнее, чем прямые HTTP-запросы.
Ресурсоемкость: Управляемый браузер потребляет больше процессорного времени и оперативной памяти.
Хрупкость: Парсеры, основанные на Selenium/Playwright, очень чувствительны к изменениям в HTML-верстке и CSS-классах сайта. Любое обновление интерфейса Яндекс.Карт может сломать локаторы и потребовать переписывания части кода.
Обнаружение: Хотя эти инструменты эмулируют браузер, продвинутые системы защиты от ботов все же могут их обнаруживать (см. Главу 7).

4.4. Обзор существующих библиотек и инструментов на GitHub для парсинга Яндекс.Карт.

Несмотря на сложности и риски, сообщество разработчиков периодически создает и публикует инструменты для взаимодействия с Яндекс.Картами, включая парсеры. Поиск на GitHub по ключевым словам «yandex maps parser», «yandex maps scraper python» может выявить некоторые из них.²¹

Примеры найденных репозиториев:

useless-apple/yandex_reviews-parser ²¹: Библиотека на Python, предназначенная для парсинга отзывов с Яндекс.Карт. Это указывает на интерес к сбору специфического пользовательского контента.
OwlSoul/YandexTransportWebdriverAPI-Python ²¹: Инструмент для работы с данными Яндекс.Транспорта, использующий WebDriver (т.е. браузерную автоматизацию). Хотя это не напрямую парсер организаций с Карт, он демонстрирует применение Selenium/WebDriver для взаимодействия с сервисами Яндекса.
asluchevskiy/yandex-maps-spider-example ²⁰: Упомянутый ранее пример веб-скрейпера, созданный давно. Его актуальность сомнительна, но он показывает, что попытки парсинга предпринимались и ранее.
Множество JavaScript-библиотек (vue-yandex-map, react-yandex-maps и др. ²¹): Это в основном обертки над официальным JavaScript API Яндекс.Карт для упрощения интеграции карт в веб-приложения на соответствующих фреймворках. Они не являются парсерами, но их изучение может дать представление о том, как фронтенд взаимодействует с API карт.
Краткий анализ: Большинство найденных инструментов либо являются обертками официальных API, либо узкоспециализированными (например, для отзывов или транспорта), либо устаревшими. Это может свидетельствовать о высокой сложности создания и поддержки универсальных и актуальных парсеров для Яндекс.Карт из-за частых изменений на платформе и активных мер защиты.
Предостережение: Использование сторонних неофициальных библиотек и парсеров всегда сопряжено с рисками:

Безопасность: Код может содержать уязвимости или вредоносные элементы.
Поддержка: Библиотека может быть заброшена автором и перестать работать после очередного обновления Яндекс.Карт.
Соответствие ToS: Использование таких инструментов почти наверняка нарушает Условия использования Яндекс.Карт.

Тем не менее, GitHub ²⁰ остается важной площадкой, где разработчики делятся своим опытом, инструментами и подходами к решению сложных задач, включая парсинг. Это создает определенную базу знаний, пусть и неофициальную, о том, какие методы могут работать или работали ранее, и свидетельствует о сохраняющемся высоком спросе на данные Яндекс.Карт.

В следующей части мы рассмотрим аналогичные подходы и инструменты для парсинга данных с платформы 2ГИС.

Часть III: Технологии и методы парсинга 2ГИС

Платформа 2ГИС, так же как и Яндекс.Карты, является богатым источником геопространственных данных и информации об организациях. Подходы к извлечению этих данных во многом схожи: существуют официальные API и возможности для «серого» парсинга веб-интерфейса.

Глава 5: Официальные API 2ГИС: Инструменты для разработчиков

2ГИС предоставляет набор API, позволяющих разработчикам интегрировать картографические и справочные данные в свои приложения и сервисы. Использование официальных API является рекомендуемым и легальным способом взаимодействия с платформой.

5.1. Обзор API 2ГИС.

Основные API, предлагаемые 2ГИС для работы с данными:

Places API (API Справочника / Catalog API): Это основной API для получения информации об организациях и других объектах (филиалах, зданиях, остановках и т.д.). Он позволяет осуществлять поиск по текстовому запросу, географическим координатам (в точке, в радиусе, в прямоугольной области), по рубрикам (категориям), а также фильтровать результаты по различным атрибутам.²⁴ API возвращает подробную информацию об объектах, включая название, адрес, контакты, часы работы, рейтинг, фотографии и пр.
Categories API (API Рубрикатора / Rubrics API): Данный API предназначен для работы с иерархическим каталогом рубрик (категорий) 2ГИС. Он позволяет искать рубрики по названию, получать список дочерних рубрик, а также ID рубрик, которые затем могут быть использованы для фильтрации результатов в Places API.²⁵
Navigation API (Navi-Router): API для построения автомобильных, пешеходных и велосипедных маршрутов, а также маршрутов на общественном транспорте. Он учитывает дорожную обстановку и предоставляет информацию о времени в пути и расстоянии.²⁶
Tiles API (API Тайлов): Предоставляет доступ к тайлам (фрагментам карты) для отображения векторных или растровых карт в собственных приложениях.²⁶ Этот API менее релевантен для непосредственного парсинга данных об организациях, но важен для картографических приложений. В документации упоминаются изменения в токенах доступа для векторных и растровых данных через этот API.²⁶
On-premise решения: 2ГИС также предлагает решения для локального развертывания своих сервисов (on-premise). Документация ²⁶ содержит множество параметров конфигурации для таких систем, включая настройки API. Хотя это напрямую не относится к парсингу публичного веб-сервиса, анализ этих параметров может дать косвенное представление о структуре запросов и возможностях API, которые могут быть частично применимы и к облачным версиям.

5.2. Получение ключа доступа и условия использования.

Для использования API 2ГИС необходим ключ доступа (API key). Процесс его получения, как правило, включает следующие шаги ²⁵:

Регистрация в Platform Manager 2ГИС: Создание учетной записи на платформе для разработчиков.
Создание ключа: В Platform Manager можно создать демонстрационный (demo) ключ для тестирования или приобрести коммерческий ключ для полноценного использования API.

Условия использования API 2ГИС, особенно для демо-ключей, имеют существенные ограничения ²⁴:

Лимиты запросов: Демо-ключи обычно имеют строгие ограничения на количество результатов на одной странице (например, page_size не более 10) и на общее количество доступных страниц (например, page не более 5). Это означает, что с помощью демо-ключа можно получить не более 50 объектов по одному типу запроса, что делает его практически непригодным для масштабного сбора данных.
Тарифы: Для снятия ограничений и коммерческого использования API необходимо приобретать платные пакеты или подписки. Стоимость зависит от объема запросов и набора используемых API.
Требования к атрибуции: При использовании карт и данных 2ГИС через API необходимо соблюдать требования по отображению логотипа 2ГИС и ссылок на сервис, согласно условиям лицензионного соглашения.

Жесткие лимиты демо-доступа являются стандартной практикой и служат для ознакомления с возможностями API. Они мотивируют пользователей, нуждающихся в больших объемах данных или коммерческом использовании, переходить на платные тарифы. Если бюджет проекта не позволяет этого, разработчики могут начать рассматривать альтернативные методы, такие как парсинг веб-версии, несмотря на связанные с этим риски.

5.3. Примеры кода на Python для работы с API.

Взаимодействие с API 2ГИС осуществляется посредством HTTP-запросов. Рассмотрим примеры на Python с использованием библиотеки requests.

5.3.1. Поиск организаций по параметрам (Places API / Catalog API).
Places API (часто упоминаемый как Catalog API в документации версии 3.0) позволяет гибко настраивать поиск организаций.
Примеры URL-запросов (из документации ²⁴):

Поиск по тексту: https://catalog.api.2gis.com/3.0/items?q=Москва кафе&type=branch&key=YOUR_KEY
Поиск в радиусе: https://catalog.api.2gis.com/3.0/items?q=кафе&type=branch&point=37.416469%2C55.619325&radius=1000&key=YOUR_KEY
Поиск в прямоугольной области: https://catalog.api.2gis.com/3.0/items?q=кафе&fields=items.point&point1=37.602631%2C55.764592&point2=37.648702%2C55.743089&key=YOUR_KEY
Поиск в конкретном городе по city_id: https://catalog.api.2gis.com/3.0/items?q=кафе&fields=items.point&city_id=4504222397630173&key=YOUR_KEY
Фильтрация по времени работы и наличию сайта: https://catalog.api.2gis.com/3.0/items?q=салон красоты&city_id=4504222397630173&work_time=thu,09:00&has_site=true&key=YOUR_KEY

Python-код (пример):
Python import requests import json API_KEY = "YOUR_2GIS_API_KEY" # Ваш ключ API 2ГИС BASE_URL = "https://catalog.api.2gis.com/3.0/items" def search_organizations_2gis(query, location_params, api_key): """ Ищет организации в 2ГИС. location_params: словарь с параметрами местоположения, например, {"point": "37.6,55.7", "radius": 1000} или {"city_id": "4504222397630173"} """ params = { "q": query, "key": api_key, "fields": "items.adm_div,items.rubrics,items.org,items.reviews,items.point,items.geometry.centroid,items.links,items.schedule,items.ads,items.contact_groups", # Запрашиваем больше полей "type": "branch", # Искать филиалы организаций "page_size": 10, # Для демо-ключа, или больше для платного "page": 1 } params.update(location_params) all_results = current_page = 1 max_pages_for_demo = 5 # Ограничение для демо-ключа while True: params["page"] = current_page print(f"Запрос страницы {current_page} для '{query}'...") try: response = requests.get(BASE_URL, params=params, timeout=15) response.raise_for_status() data = response.json() if data.get("meta", {}).get("code") == 200: results_on_page = data.get("result", {}).get("items",) if not results_on_page: print("Больше результатов не найдено.") break all_results.extend(results_on_page) print(f"Найдено {len(results_on_page)} организаций на странице {current_page}.") # Проверка на лимит страниц для демо-ключа if "demo" in api_key.lower() and current_page >= max_pages_for_demo: print(f"Достигнут лимит страниц ({max_pages_for_demo}) для демо-ключа.") break # Проверка, есть ли еще страницы (если API возвращает общее количество) total_found = data.get("result", {}).get("total", 0) if len(all_results) >= total_found and total_found > 0 : print("Все доступные результаты собраны.") break current_page += 1 time.sleep(0.5) # Небольшая задержка else: print(f"Ошибка API: {data.get('meta', {}).get('error', {}).get('message', 'Неизвестная ошибка')}") break except requests.exceptions.RequestException as e: print(f"Ошибка HTTP запроса: {e}") break except json.JSONDecodeError: print(f"Ошибка декодирования JSON. Ответ: {response.text}") break return all_results if __name__ == "__main__": # Пример: поиск "ресторан" в Москве (city_id Москвы для примера) # city_id можно найти через API или в документации # Для Новосибирска city_id='9011666847040415' # Для Москвы city_id='4504222397630173' moscow_params = {"city_id": "4504222397630173"} restaurants = search_organizations_2gis("ресторан", moscow_params, API_KEY) print(f"\nВсего найдено ресторанов: {len(restaurants)}") for org in restaurants[:5]: # Выведем первые 5 для примера print(f"Название: {org.get('name')}, Адрес: {org.get('address_name')}") if org.get('rubrics'): print(f" Рубрики: {', '.join([r.get('name') for r in org.get('rubrics')])}") if org.get('contact_groups'): for group in org.get('contact_groups'): if group.get('type') == 'phone': print(f" Телефоны: {', '.join([c.get('value') for c in group.get('contacts')])}") print("-" * 10)
Структура ответа: Ответ обычно приходит в формате JSON. Он содержит метаинформацию (meta) о запросе и блок result с массивом items, где каждый элемент item представляет собой найденную организацию со всеми ее атрибутами (название, адрес, контакты, рубрики, рейтинг, геометрия и т.д.).
5.3.2. Работа с рубриками (Categories API / Rubrics API).
Categories API (в документации версии 2.0 часто называется Rubrics API) позволяет получать информацию о категориях бизнеса. Это часто используется в связке с Places API.

Пример запроса на поиск ID рубрики по названию ²⁵: https://catalog.api.2gis.com/2.0/catalog/rubric/search?q=кафе&region_id=32&key=YOUR_KEY (где region_id – идентификатор региона).
Пример запроса на получение списка всех компаний в определенной рубрике (комбинация API) ²⁵:

Сначала получить rubric_id через Categories API.
Затем использовать этот rubric_id в запросе к Places API: https://catalog.api.2gis.com/3.0/items?rubric_id=162&sort_point=37.627798%2C55.755355&key=YOUR_KEY (где sort_point – точка, относительно которой сортируются результаты).

Python-код (иллюстрация логики):
Python #... (импорты и API_KEY как выше)... BASE_URL_RUBRICS_V2 = "https://catalog.api.2gis.com/2.0/catalog/rubric/search" BASE_URL_ITEMS_V3 = "https://catalog.api.2gis.com/3.0/items" def get_rubric_id(rubric_name, region_id, api_key): params = {"q": rubric_name, "region_id": region_id, "key": api_key} try: response = requests.get(BASE_URL_RUBRICS_V2, params=params) response.raise_for_status() data = response.json() if data.get("meta", {}).get("code") == 200 and data.get("result", {}).get("items"): return data["result"]["items"]["id"] # Берем ID первой найденной рубрики except Exception as e: print(f"Ошибка при получении ID рубрики: {e}") return None def get_organizations_by_rubric_id(rubric_id, sort_point_coords, api_key): # sort_point_coords: строка "долгота,широта" params = { "rubric_id": rubric_id, "sort_point": sort_point_coords, "key": api_key, "fields": "items.adm_div,items.rubrics,items.org,items.point", # Упрощенный набор полей "page_size": 10, "page": 1 } #... (далее логика запроса и пагинации, аналогичная search_organizations_2gis)... # Здесь для краткости опустим полную реализацию пагинации try: response = requests.get(BASE_URL_ITEMS_V3, params=params) response.raise_for_status() data = response.json() if data.get("meta", {}).get("code") == 200: return data.get("result", {}).get("items",) except Exception as e: print(f"Ошибка при получении организаций по ID рубрики: {e}") return if __name__ == "__main__": target_rubric_name = "кафе" novosibirsk_region_id = "32" # Пример ID региона (Новосибирск) # Координаты для сортировки (например, центр Новосибирска) sort_coords_nsk = "82.920430,55.030139" rubric_id = get_rubric_id(target_rubric_name, novosibirsk_region_id, API_KEY) if rubric_id: print(f"Найден ID рубрики '{target_rubric_name}': {rubric_id}") cafes_in_rubric = get_organizations_by_rubric_id(rubric_id, sort_coords_nsk, API_KEY) print(f"Найдено {len(cafes_in_rubric)} кафе в рубрике (на первой странице).") for cafe in cafes_in_rubric[:3]: print(f" Название: {cafe.get('name')}, Адрес: {cafe.get('address_name')}") else: print(f"Рубрика '{target_rubric_name}' не найдена.")

Эффективное использование API 2ГИС часто требует именно такой комбинации запросов к различным эндпоинтам: сначала уточнение параметров поиска (например, ID рубрики или ID города) через один API, а затем использование этих идентификаторов в запросах к другому API для получения уже непосредственно списка организаций.²⁵ Это говорит о продуманной, хотя и многошаговой, архитектуре API.

Таблица 4: Сравнение официальных API 2ГИС для задач сбора данных.

Название API	Основное назначение	Тип возвращаемых данных	Ключевые параметры запроса (примеры)	Ограничения демо-ключа/бесплатной версии (примерные)	Возможность коммерческого использования	Ссылка на документацию
Places API (Catalog API v3.0)	Поиск организаций и объектов, получение детальной информации.	JSON (метаданные, список объектов items с атрибутами: название, адрес, контакты, рубрики, геометрия, рейтинг и др.).	key, q (запрос), point, radius, rect, city_id, rubric_id, fields, page, page_size.	page_size до 10, page до 5 (всего до 50 объектов). ²⁴	Да, по коммерческим тарифам.	docs.2gis.com/ru/api/search/places/overview
Categories API (Rubrics API / Catalog API v2.0 для рубрик)	Поиск рубрик (категорий), получение их ID, иерархии.	JSON (метаданные, список рубрик items с ID, названием, количеством филиалов).	key, q (название рубрики), region_id, parent_id.	Лимиты на количество запросов, могут быть специфичны для демо-ключей.	Да, по коммерческим тарифам.	docs.2gis.com/ru/api/search/categories/overview
Navigation API (Navi-Router)	Построение маршрутов.	JSON (геометрия маршрута, маневры, время, расстояние).	key, waypoints (точки маршрута), type (тип транспорта).	Обычно требует коммерческого ключа для интенсивного использования.	Преимущественно коммерческое.	docs.2gis.com/ru/api/navigation/navigation/overview
Tiles API	Получение тайлов карты для отображения.	Изображения (PNG, JPG) или векторные данные.	key, координаты тайла (x, y, z).	Лимиты на количество запросов.	Да, по коммерческим тарифам.	docs.2gis.com/ru/api/maps/tiles/overview

Эта таблица, аналогично таблице для API Яндекс.Карт, призвана помочь разработчикам быстро оценить возможности и ограничения официальных инструментов 2ГИС, прежде чем приступать к разработке или рассматривать альтернативные методы сбора данных.

Глава 6: Парсинг 2ГИС: Обход защиты и сбор данных

Как и в случае с Яндекс.Картами, несмотря на наличие официальных API, могут возникать ситуации, когда разработчики обращаются к прямому парсингу веб-интерфейса 2ГИС. Причины те же: ограничения API, стоимость, необходимость получения специфических данных, не отдаваемых через API. И так же, как и Яндекс, 2ГИС применяет меры для защиты своих данных от несанкционированного автоматизированного сбора.

Судя по анализу существующих открытых решений и общей тенденции защиты современных веб-приложений, парсинг 2ГИС без использования официального API с высокой вероятностью потребует применения инструментов браузерной автоматизации, таких как Selenium или Playwright. Это связано с тем, что фронтенд 2ГИС, скорее всего, использует JavaScript-фреймворки для динамической отрисовки контента и может включать механизмы защиты от ботов, которые сложнее обойти простыми HTTP-запросами.

6.1. Анализ веб-интерфейса 2ГИС и сетевых запросов.

Первым шагом при попытке парсинга веб-интерфейса является его тщательный анализ с использованием инструментов разработчика в браузере (вкладка «Сеть» / Network). Цели этого анализа:

Изучение взаимодействия пользователя с интерфейсом: Как происходит поиск, как подгружаются списки организаций, как отображается детальная информация при клике на объект, как работает пагинация или «бесконечная прокрутка».
Отслеживание XHR-запросов: Особое внимание следует уделить фоновым AJAX-запросам, которые веб-страница отправляет на сервер для получения данных. Необходимо идентифицировать URL этих запросов (эндпоинты), передаваемые параметры (в URL или теле запроса) и получаемые ответы (обычно в формате JSON).
Анализ заголовков запросов: Какие заголовки важны для успешного выполнения запроса (User-Agent, Referer, Cookie, кастомные токены авторизации или сессии).
Изучение структуры DOM: Если данные встроены непосредственно в HTML или динамически добавляются в DOM, необходимо понять структуру HTML-элементов, содержащих нужную информацию, и определить надежные селекторы (XPath, CSS) для их извлечения.

Если удастся выявить стабильные внутренние API, возвращающие данные в JSON, это может упростить задачу. Однако, как и в случае с Яндексом, такие API не документированы, могут меняться без предупреждения и их использование нарушает пользовательское соглашение.⁶

В некоторых случаях, как предполагает анализ репозитория interlark/parser-2gis ²⁷, разработчики могут сразу прибегать к браузерной автоматизации, если прямой анализ XHR-запросов оказывается слишком сложным или если сайт активно использует меры защиты, основанные на поведении браузера.

6.2. Создание парсера на Python.

В зависимости от результатов анализа веб-интерфейса, можно выбрать один из двух основных подходов к созданию парсера.

6.2.1. С использованием requests (если найдены рабочие эндпоинты).
Если удалось идентифицировать внутренние API-эндпоинты, которые возвращают данные в структурированном виде (например, JSON) и не требуют сложной аутентификации или выполнения JavaScript на клиенте, можно попытаться создать парсер на основе библиотеки requests. Логика будет схожа с парсингом «скрытых» API Яндекс.Карт (см. п. 4.2):

Формирование URL запроса с необходимыми параметрами.
Установка корректных HTTP-заголовков.
Отправка запроса и получение ответа.
Разбор JSON-ответа и извлечение данных.
Реализация пагинации и обработки ошибок.

Однако вероятность того, что такой простой подход будет долго и стабильно работать с современной версией 2ГИС, невелика из-за возможных защит и динамического характера платформы.

6.2.2. С использованием Selenium/Playwright.
Этот подход предполагает полную эмуляцию работы пользователя в браузере и является более универсальным, хотя и более медленным и ресурсоемким.

Настройка WebDriver/Browser Context: Инициализация управляемого браузера.
Навигация: Переход на сайт 2ГИС, ввод поискового запроса в соответствующее поле, эмуляция нажатия кнопки «Найти» или клавиши Enter.
Взаимодействие с элементами: Использование XPath или CSS-селекторов для поиска элементов на странице (карточек организаций, ссылок на детальную информацию, кнопок пагинации, элементов для скроллинга).
Извлечение данных: Получение текстового содержимого или атрибутов из найденных HTML-элементов.
Обработка динамической подгрузки: Если результаты подгружаются по мере прокрутки («бесконечный скроллинг»), необходимо эмулировать прокрутку и ожидать появления новых данных. Если используется классическая пагинация – эмулировать клики по кнопкам «Следующая страница».
Обработка CAPTCHA и других защит: При необходимости интегрировать решения для обхода CAPTCHA или другие техники, описанные в Главе 7.

Пример старого парсера Abu-Sagidolla/2gis-parser ²⁸ упоминает файл selen.py, что указывает на использование Selenium. Хотя код устарел (5 лет на момент написания), он может дать общее представление о том, как мог бы выглядеть такой парсер: он принимал список улиц и пытался собрать информацию об организациях на них. Репозиторий interlark/parser-2gis ²⁷, по заявлениям, использует Google Chrome (вероятно, через Selenium или Playwright) и успешно обходит анти-бот блокировки в РФ. Для детального понимания его работы потребовался бы анализ основного кода модуля parser_2gis, а не только файла-точки входа.Парсеры, основанные на взаимодействии с веб-интерфейсом, особенно с использованием Selenium/Playwright, очень чувствительны к любым изменениям в верстке сайта, структуре DOM и CSS-классах. Платформа 2ГИС, как и любой активно развивающийся веб-сервис, регулярно обновляет свой интерфейс, что может приводить к поломке локаторов и необходимости частой доработки и поддержки парсера. Это делает такие решения нестабильными в долгосрочной перспективе.

6.3. Обзор существующих парсеров 2ГИС на GitHub.

Поиск на GitHub по запросам «2gis parser python», «2gis scraper github» выявляет несколько проектов, но их актуальность и функциональность требуют тщательной проверки.

Abu-Sagidolla/2gis-parser ²⁸: Как уже упоминалось, это старый проект на Python и Selenium, предназначенный для сбора названий, сайтов и телефонов организаций по списку улиц Москвы (с возможностью адаптации под другие города). Его основная ценность сегодня – историческая, как пример одного из ранних подходов.
interlark/parser-2gis ²⁷: Более современный проект, также на Python, использующий, по-видимому, браузерную автоматизацию. Заявлено, что он способен обходить блокировки. Для оценки его реальных возможностей и используемых техник необходим детальный анализ исходного кода.
Другие репозитории: Могут встречаться различные скрипты или небольшие проекты, но часто они либо узкоспециализированные, либо быстро устаревают. Например, 2gis/pytestrail ³⁰ не является парсером карт, а инструментом для интеграции с TestRail. Фрагменты конфигураций, как в ³¹, или общие библиотеки для парсинга ³² редко предоставляют готовое решение именно для 2ГИС.

Успешность парсинга 2ГИС через веб-интерфейс будет зависеть не только от качества самого кода парсера, но и от множества внешних факторов: качества используемых прокси-серверов, актуальности User-Agent’ов, способности обходить CAPTCHA (если они будут внедрены или уже используются для подозрительной активности), и других техник маскировки, которые будут рассмотрены в следующей главе. Сам по себе «умный» парсер на Selenium – это лишь часть комплексного решения.

Часть IV: Продвинутые техники и преодоление сложностей парсинга

Независимо от того, какая платформа является целью – Яндекс.Карты или 2ГИС – при попытке парсинга без использования официальных API разработчики сталкиваются с общими проблемами: обнаружение и блокировка со стороны сервера. Для успешного и продолжительного сбора данных необходимо применять продвинутые техники, направленные на маскировку активности парсера и обход защитных механизмов.

Эффективный обход блокировок редко достигается применением какого-то одного «магического» метода. Чаще всего это комбинация различных техник, создающая многоуровневую стратегию «атаки» в ответ на многослойную «оборону» сервера.

Глава 7: Обход блокировок и мер защиты от парсинга

7.1. Использование прокси-серверов: Маскировка вашего IP-адреса.

Одной из первых линий защиты веб-серверов от парсинга является отслеживание и блокировка IP-адресов, с которых поступает аномально большое количество запросов или запросы, характерные для ботов. Использование прокси-серверов позволяет скрыть реальный IP-адрес парсера и распределить запросы по множеству различных IP.

Зачем нужны прокси: Когда парсер отправляет сотни или тысячи запросов с одного IP-адреса за короткий промежуток времени, сервер легко идентифицирует такую активность как автоматизированную и может заблокировать этот IP-адрес, временно или постоянно. Прокси-сервер выступает в роли посредника: парсер отправляет запрос на прокси, а прокси уже от своего имени – на целевой сайт. Таким образом, целевой сайт видит IP-адрес прокси, а не парсера.
Типы прокси:

Дата-центровые (Data-center proxies): IP-адреса, принадлежащие дата-центрам. Они обычно быстрые, относительно дешевые и доступны в больших количествах. Однако их IP-адреса легко идентифицируются как принадлежащие дата-центрам, и многие сайты их активно блокируют.
Резидентные (Residential proxies): IP-адреса, выданные интернет-провайдерами реальным домашним пользователям. Такие прокси значительно дороже, но их сложнее обнаружить и заблокировать, так как запросы с них выглядят как трафик от обычных пользователей.
Мобильные (Mobile proxies): IP-адреса, принадлежащие операторам мобильной связи. Это самый дорогой тип прокси, но и самый надежный для обхода блокировок на некоторых сайтах, так как мобильные IP-адреса часто являются динамическими и используются большим количеством реальных пользователей.
Бесплатные прокси: Публично доступные списки бесплатных прокси-серверов. Категорически не рекомендуется их использовать для серьезного парсинга. Они крайне ненадежны, медленны, часто не работают или уже заблокированы, а также могут представлять угрозу безопасности (например, перехватывать данные).³³

Таблица 5: Типы прокси-серверов: преимущества и недостатки.

Тип прокси	Источник IP	Скорость	Надежность	Уровень анонимности	Стоимость	Риск блокировки
Дата-центровые	Дата-центры	Высокая	Средняя	Средний	Низкая-Средняя	Высокий
Резидентные	Домашние интернет-провайдеры	Средняя-Высокая	Высокая	Высокий	Высокая	Низкий-Средний
Мобильные	Операторы мобильной связи	Средняя	Очень высокая	Очень высокий	Очень высокая	Очень низкий
Бесплатные	Неизвестные, публичные списки	Очень низкая	Очень низкая	Низкий-Нулевой	Бесплатно	Очень высокий

Ротация прокси: Концепция ротации заключается в автоматической смене IP-адреса для каждого запроса или для небольшой группы запросов. Это не позволяет серверу связать большое количество запросов с одним IP и снижает вероятность блокировки.

Реализация в Python с requests: Можно создать список доступных прокси и для каждого запроса выбирать случайный прокси из этого списка.
Python import requests import random proxy_list = [ "http://user:pass@proxy1_ip:port", "http://user:pass@proxy2_ip:port", #... и т.д. ] def get_with_random_proxy(url, params=None, headers=None): if not proxy_list: return requests.get(url, params=params, headers=headers) # Без прокси, если список пуст chosen_proxy_url = random.choice(proxy_list) proxies = { "http": chosen_proxy_url, "https": chosen_proxy_url, # Если целевой сайт HTTPS } try: response = requests.get(url, params=params, headers=headers, proxies=proxies, timeout=10) return response except requests.exceptions.RequestException as e: print(f"Ошибка с прокси {chosen_proxy_url}: {e}") # Можно добавить логику удаления "плохого" прокси из списка return None
Реализация с Selenium: Selenium позволяет настроить WebDriver для использования прокси-сервера при запуске браузера. Для более гибкого управления прокси, включая ротацию и аутентификацию, часто используется библиотека Selenium Wire.³³ Пошаговый процесс ротации прокси в Selenium Python ³³:

Установка необходимых пакетов: selenium, webdriver-manager, selenium-wire.
Подготовка списка прокси:

Python proxies_selenium =
Выбор случайного прокси и настройка опций Selenium Wire:

Python from seleniumwire import webdriver # импортируем webdriver из selenium-wire from selenium.webdriver.chrome.service import Service as ChromeService from webdriver_manager.chrome import ChromeDriverManager import random if proxies_selenium: selected_proxy_str = random.choice(proxies_selenium) # Selenium Wire ожидает прокси в формате схемы, затем хост:порт # Если есть аутентификация, она должна быть частью URL # http://user:pass@host:port # Разбираем URL прокси, если нужно отделить user:pass # Для простоты примера, предполагаем, что формат уже корректный selenium_wire_options = { 'proxy': { 'http': selected_proxy_str, 'https': selected_proxy_str, # Обычно тот же для HTTPS 'no_proxy': 'localhost,127.0.0.1' # Адреса, которые не будут проксироваться } } driver = webdriver.Chrome(service=ChromeService(ChromeDriverManager().install()), seleniumwire_options=selenium_wire_options) else: # Запуск без прокси, если список пуст driver = webdriver.Chrome(service=ChromeService(ChromeDriverManager().install())) # Далее работа с driver как обычно # driver.get("https://httpbin.org/ip") # Проверка IP # print(driver.page_source) # driver.quit()

Для каждой новой сессии или даже для каждого нового домена можно повторять выбор прокси и перезапускать драйвер с новыми настройками, либо использовать более сложные стратегии ротации внутри одной сессии, если Selenium Wire это позволяет. Использование прокси является одним из фундаментальных методов обхода блокировок при парсинге.³⁵

7.2. Управление User-Agent и HTTP-заголовками: Притворяемся обычным браузером.

Помимо IP-адреса, серверы анализируют и другие характеристики HTTP-запросов, в частности, заголовок User-Agent и набор других HTTP-заголовков.

User-Agent: Это строка, которую браузер (или парсер) отправляет серверу для его идентификации. Она содержит информацию о названии и версии браузера, операционной системе и иногда о других компонентах. Серверы часто блокируют запросы с отсутствующим, стандартным (например, python-requests/2.x.x) или подозрительным User-Agent. Поэтому важно ³⁶:

Использовать User-Agent строки реальных, современных браузеров.
Иметь список из нескольких таких User-Agent и случайным образом выбирать один из них для каждого запроса или сессии.

Python user_agents = headers = {"User-Agent": random.choice(user_agents)} # response = requests.get(url, headers=headers,...)

При использовании Selenium, браузер по умолчанию отправляет свой реальный User-Agent, но его также можно изменить через опции драйвера, если это необходимо.

Другие важные HTTP-заголовки: Реальные браузеры отправляют целый набор заголовков. Чтобы парсер выглядел более «человечным», полезно имитировать и их:

Accept: Сообщает серверу, какие типы контента клиент может принять (например, text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8).
Accept-Language: Предпочитаемые языки (например, ru-RU,ru;q=0.9,en-US;q=0.8,en;q=0.7).
Referer: URL предыдущей страницы, с которой был сделан переход на текущую. Для первого запроса к сайту он может отсутствовать, но для внутренних переходов его наличие естественно.
Accept-Encoding: Поддерживаемые методы сжатия (например, gzip, deflate, br). Библиотека requests обычно обрабатывает это автоматически.
Connection: keep-alive или close.
Upgrade-Insecure-Requests: 1: Сигнализирует о поддержке перехода на HTTPS.
Cookie: Если сайт использует куки для отслеживания сессий или состояния, их может потребоваться корректно обрабатывать (принимать, хранить и отправлять обратно). requests.Session() помогает автоматизировать работу с куками.

Selenium Stealth Mode ³⁷ также уделяет внимание корректной установке и модификации заголовков браузера, чтобы они соответствовали типичным профилям пользователей и не вызывали подозрений у анти-бот систем.

7.3. Работа с CAPTCHA: Борьба с «тестами Тьюринга».

CAPTCHA (Completely Automated Public Turing test to tell Computers and Humans Apart) – это распространенный механизм защиты, предназначенный для различения людей и ботов. Если парсер сталкивается с CAPTCHA, он не сможет продолжить сбор данных без ее решения.

Типы CAPTCHA:

Текстовые CAPTCHA: Требуют распознать искаженные символы на картинке.
Image CAPTCHA: Требуют выбрать все изображения с определенными объектами (например, «выберите все светофоры»).
reCAPTCHA (v2, v3, Enterprise) от Google: Наиболее распространенные и сложные. v2 часто представляет собой чекбокс «Я не робот» и/или задание с выбором картинок. v3 работает в фоновом режиме, оценивая «человечность» пользователя по его поведению, и возвращает оценку; если оценка низкая, может быть показана дополнительная проверка. Enterprise – платная версия для крупных сайтов.
hCaptcha: Альтернатива reCAPTCHA, также часто использующая задачи с выбором изображений.
FunCAPTCHA, KeyCAPTCHA и др.: Менее распространенные, но могут использовать игровые или интерактивные элементы.
Методы решения CAPTCHA:
Ручное решение: Неприменимо для автоматического

Источники

2гис парсер — собери контакты целевой аудитории — Интернет маркетинг PPC, дата последнего обращения: июня 10, 2025, https://marketing.i3.com.ua/parser-2gis/
Парсинг: законно ли им пользоваться — Altcraft CDP, дата последнего обращения: июня 10, 2025, https://altcraft.com/ru/glossary/parsing-chto-eto-takoe-i-mogut-li-za-nego-oshtrafovat
API Яндекс.Карт: Описание, Функции и Интерфейс – 2025 — Soware, дата последнего обращения: июня 10, 2025, https://soware.ru/products/api-yandexmaps
Условия использования сервиса Яндекс Карты — Правовые …, дата последнего обращения: июня 10, 2025, https://yandex.ru/legal/maps_termsofuse/
Пользовательское соглашение сервиса «API Яндекс.Карты» — Правовые документы. Помощь, дата последнего обращения: июня 10, 2025, https://yandex.ru/legal/maps_api/20092011/index.html
Соглашение об использовании сервисов 2ГИС, дата последнего обращения: июня 10, 2025, https://law.2gis.ru/rules
Лицензионное соглашение — 2ГИС, дата последнего обращения: июня 10, 2025, https://law.2gis.kz/licensing-agreement/
Privacy Policy, дата последнего обращения: июня 10, 2025, https://law.2gis.ru/en/privacy
Пользовательское соглашение, дата последнего обращения: июня 10, 2025, https://shop.2gis.ru/upload/medialibrary/87d/ghkevt61yznjicgqqzxphc2b92thb6ct/terms_of_use_21_03_2024.docx
Пользовательское соглашение, дата последнего обращения: июня 10, 2025, https://shop.2gis.ru/info/legal/
Требования к информационным материалам — Правовая информация — 2ГИС, дата последнего обращения: июня 10, 2025, https://law.2gis.ru/informational-requirements
Парсинг сайтов: законно или нет? Юридические способы защиты, дата последнего обращения: июня 10, 2025, https://ezybrand.ru/blog/kak-zashhitit-svoj-veb-resurs-ot-kopirovaniya/
Федеральный закон «Об информации, информационных технологиях и о защите информации» от 27.07.2006 N 149-ФЗ (последняя редакция) — КонсультантПлюс, дата последнего обращения: июня 10, 2025, https://www.consultant.ru/document/cons_doc_LAW_61798/
Федеральный закон «О персональных данных» от 27.07.2006 N 152-ФЗ (последняя редакция) — КонсультантПлюс, дата последнего обращения: июня 10, 2025, https://www.consultant.ru/document/cons_doc_LAW_61801/
272 УК РФ (неправомерный доступ) | Комментарии Примеры …, дата последнего обращения: июня 10, 2025, https://rtmtech.ru/articles/prestupleniya-v-sfere-kompyuternoj-informatsii-st-272-uk-rf/
УК РФ Статья 272. Неправомерный доступ к компьютерной информации \ КонсультантПлюс, дата последнего обращения: июня 10, 2025, https://www.consultant.ru/document/cons_doc_LAW_10699/5c337673c261a026c476d578035ce68a0ae86da0/
Неправомерный доступ к охраняемой законом компьютерной информации уголовно наказуем. Разъясняет прокуратура г.Екатеринбурга — Правительство Свердловской области, дата последнего обращения: июня 10, 2025, https://midural.ru/normative_documents/100615/100629/page4/document168773/
How Do I Get an API Key for Yandex.Maps — uKit Knowledge Base, дата последнего обращения: июня 10, 2025, https://ukit.com/help/yandex-maps-apikey
Geocoding with the Yandex Maps API for data visualization in DataLens, дата последнего обращения: июня 10, 2025, https://yandex.cloud/en/docs/tutorials/datalens/data-from-ch-geocoder
asluchevskiy/yandex-maps-spider-example: Yandex.Maps … — GitHub, дата последнего обращения: июня 10, 2025, https://github.com/asluchevskiy/yandex-maps-spider-example
yandex-maps · GitHub Topics, дата последнего обращения: июня 10, 2025, https://github.com/topics/yandex-maps
yandex-api · GitHub Topics, дата последнего обращения: июня 10, 2025, https://github.com/topics/yandex-api?l=javascript&o=desc&s=updated
Yandex Maps 3.0 components library for VueJS. — GitHub, дата последнего обращения: июня 10, 2025, https://github.com/yandex-maps-unofficial/vue-yandex-maps
Examples | 2GIS Documentation, дата последнего обращения: июня 10, 2025, https://docs.2gis.com/en/api/search/places/examples
Categories API — 2GIS Documentation, дата последнего обращения: июня 10, 2025, https://docs.2gis.com/en/api/search/categories/overview
On‑Premise | 2GIS Documentation, дата последнего обращения: июня 10, 2025, https://docs.2gis.com/en/on-premise/releases
interlark/parser-2gis: Парсер сайта 2GIS для сбора … — GitHub, дата последнего обращения: июня 10, 2025, https://github.com/interlark/parser-2gis
Abu-Sagidolla/2gis-parser — GitHub, дата последнего обращения: июня 10, 2025, https://github.com/Abu-Sagidolla/2gis-parser
parser-2gis.py — GitHub, дата последнего обращения: июня 10, 2025, https://github.com/interlark/parser-2gis/blob/main/parser-2gis.py
2gis/pytestrail: Binding for TestRail API — GitHub, дата последнего обращения: июня 10, 2025, https://github.com/2gis/pytestrail
raw.githubusercontent.com, дата последнего обращения: июня 10, 2025, https://raw.githubusercontent.com/darkreader/darkreader/master/src/config/dynamic-theme-fixes.config
avin/selenium-parser: Selenium parser lib for various sites — GitHub, дата последнего обращения: июня 10, 2025, https://github.com/avin/selenium-parser
How to rotate proxies in Selenium Python? [5 Easy Steps] — TechJury, дата последнего обращения: июня 10, 2025, https://techjury.net/research/how-to-rotate-proxies-in-selenium-python/
How to rotate proxy servers in Selenium/Python? — IP Location, дата последнего обращения: июня 10, 2025, https://www.iplocation.net/how-to-rotate-proxy-servers-in-selenium-python
Как обойти блокировки при парсинге сайта: советы, лайфхаки — TRINET.Group, дата последнего обращения: июня 10, 2025, https://trinet.ru/blog/seo/kak-obojti-blokirovki-pri-parsinge-sajta/
Как обойти блокировки сайтов при парсинге? — parsing-cloud.ru, дата последнего обращения: июня 10, 2025, https://parsing-cloud.ru/articles/parsing-saitov-kak-oboiti-blokirovki
How to use Selenium Stealth Mode for Web Scraping? | BrowserStack, дата последнего обращения: июня 10, 2025, https://www.browserstack.com/guide/selenium-stealth