В современном мире информация является одним из ценнейших ресурсов. Стремительное развитие информационных технологий привело к экспоненциальному росту объемов данных, доступных в сети «Интернет». Автоматизированный сбор и анализ этих данных, известный как парсинг (web scraping), стал неотъемлемым инструментом для бизнеса, научных исследований и многих других сфер деятельности. Однако, возможность автоматизированного извлечения данных поднимает важные вопросы о законности таких действий, особенно в российском правовом поле. Является ли парсинг открытых данных нарушением закона, или же он допустим при соблюдении определенных условий? Целью данной статьи является детальное исследование этого вопроса, опирающееся на анализ действующего российского законодательства, включая Конституцию РФ, федеральные законы, подзаконные акты, а также изучение прецедентной судебной практики и разъяснений регулирующих органов. Мы подробно рассмотрим правовые аспекты парсинга, докажем, что парсинг открытых данных разрешен при соблюдении определенных условий, проанализируем конкретные примеры судебных споров, иллюстрирующих различные аспекты этой проблемы, и отдельно остановимся на вопросе правомерности парсинга таких популярных сервисов, как Яндекс.Карты и 2ГИС. Целью статьи является предоставление максимально подробной и понятной информации для широкого круга читателей, заинтересованных в вопросах законности парсинга данных в России.
1. Что такое открытые данные и парсинг в контексте российского законодательства?
Для понимания правовых аспектов парсинга необходимо четко определить ключевые термины в контексте российского законодательства.
Открытые данные: В российском законодательстве понятие «открытые данные» чаще всего используется в отношении информации, размещаемой органами государственной власти и местного самоуправления в сети «Интернет» в машиночитаемом формате для свободного и бесплатного доступа, использования и распространения. Основным нормативным актом, регулирующим публикацию открытых данных государственными органами, является Федеральный закон от 27 июля 2006 г. № 149-ФЗ «Об информации, информационных технологиях и о защите информации» (далее – ФЗ-149). Статья 8 ФЗ-149 гарантирует право каждого на поиск и получение информации, а статья 10.1 устанавливает требования к раскрытию информации государственными органами в форме открытых данных. Также стоит отметить Указ Президента РФ от 7 мая 2012 г. № 601 «Об основных направлениях совершенствования системы государственного управления», который стимулировал публикацию открытых данных. Распоряжение Правительства РФ от 10 июля 2013 г. № 1187-р утвердило Концепцию открытости федеральных органов исполнительной власти. Однако, в более широком смысле, «открытые данные» могут включать любую информацию, свободно доступную в сети «Интернет» для неограниченного круга лиц без необходимости авторизации, заключения соглашений или получения специальных разрешений. Это может быть информация на сайтах компаний, форумах, социальных сетях и других ресурсах, не содержащая явных ограничений на доступ.
Парсинг (web scraping): Это автоматизированный процесс извлечения данных с веб-сайтов. С технической точки зрения, это процесс анализа HTML-кода веб-страниц с целью выделения и структурирования необходимой информации. Парсинг осуществляется с помощью специализированного программного обеспечения – парсеров или скриптов. Российское законодательство не содержит прямого определения термина «парсинг». Однако, в зависимости от целей, методов и объектов парсинга, такие действия могут подпадать под действие различных правовых норм, регулирующих доступ к информации, защиту интеллектуальной собственности, персональных данных и функционирование информационных систем.
2. Правовые основы доступа к информации в России и их связь с парсингом.
Ключевым принципом, лежащим в основе легитимности парсинга открытых данных, является гарантированное Конституцией Российской Федерации право каждого свободно искать, получать, передавать, производить и распространять информацию любым законным способом (статья 29). ФЗ-149 развивает этот принцип, устанавливая общие правила доступа к информации, созданной, полученной или находящейся в распоряжении государственных органов и органов местного самоуправления (статья 5). Применительно к открытым данным, опубликованным государственными органами в соответствии со статьей 10.1 ФЗ-149, существует презумпция их доступности и возможности использования в любых законных целях. В отношении информации, размещенной иными лицами, право на доступ к информации реализуется с учетом ограничений, установленных законодательством.
Несмотря на закрепленное право на доступ к информации, оно не является абсолютным и имеет ряд ограничений, установленных законодательством. Эти ограничения имеют прямое отношение к законности парсинга и могут быть связаны с:
Защитой персональных данных: Федеральный закон от 27 июля 2006 г. № 152-ФЗ «О персональных данных» (далее – ФЗ-152) устанавливает строгие правила обработки персональных данных. Персональные данные – это любая информация, относящаяся к прямо или косвенно определенному или определяемому физическому лицу (субъекту персональных данных). Парсинг информации, содержащей персональные данные (например, имена, фамилии, контактные данные, фотографии), требует соблюдения требований ФЗ-152, включая наличие согласия субъекта персональных данных на обработку, за исключением случаев, прямо предусмотренных законом (статья 6 ФЗ-152). Сбор и обработкаперсональных данных без законных оснований, включая согласие, является нарушением законодательства и влечет за собой административную (статья 13.11 Кодекса Российской Федерации об административных правонарушениях) или даже уголовную ответственность (статья 137 Уголовного кодекса Российской Федерации – нарушение неприкосновенности частной жизни). Обезличивание персональных данных, позволяющее исключить их связь с конкретным субъектом, может сделать парсинг законным, если цель обработки не связана с идентификацией конкретного лица.
Охраной авторских и смежных прав: Часть четвертая Гражданского кодекса Российской Федерации (далее – ГК РФ) регулирует вопросы интеллектуальной собственности. Парсингконтента, являющегося объектом авторских прав (например, тексты, статьи, изображения, фотографии, музыкальные и аудиовизуальные произведения, программное обеспечение), может нарушать исключительные права правообладателей (статья 1229 ГК РФ). Использование объектов авторских прав без разрешения правообладателя, за исключением случаев свободного использования, предусмотренных статьями 1273-1286 ГК РФ, является незаконным. Однако, действие авторских прав не распространяется на официальные документы государственных органов и органов местного самоуправления, а также на сообщения о событиях и фактах, имеющих исключительно информационный характер (статья 1259 ГК РФ). Также, сбор и обработка данных, не обладающих признаками охраноспособного результата интеллектуальной деятельности (например, статистические данные, цены товаров, даты), как правило, не нарушает авторских прав. Особое внимание следует уделять правам на базы данных (статья 1260 ГК РФ), которые могут быть защищены как самостоятельные объекты интеллектуальных прав. Извлечение или повторное использование существенной части содержания базы данных без разрешения правообладателя может быть признано нарушением исключительного права изготовителя базы данных (статья 1334 ГК РФ).
Защитой коммерческой тайны: Федеральный закон от 29 июля 2004 г. № 98-ФЗ «О коммерческой тайне» (далее – ФЗ-98) устанавливает правила защиты информации, составляющей коммерческую тайну. Коммерческая тайна – это конфиденциальная информация, позволяющая ее обладателю при существующих или возможных обстоятельствах увеличить доходы, избежать неоправданных расходов, сохранить положение на рынке товаров, работ, услуг или получить иную коммерческую выгоду. Парсинг информации, которая явно обозначена как коммерческая тайна и доступ к которой ограничен правообладателем, может быть признан незаконным. Незаконное получение сведений, составляющих коммерческую тайну, их разглашение или использование без согласия обладателя влечет за собой гражданско-правовую, административную или уголовную ответственность (статья 14.6 КоАП РФ, статья 183 УК РФ).
Нарушением работы информационных систем:Парсинг, осуществляемый с высокой интенсивностью, генерирующий большое количество запросов к серверу веб-сайта, может создавать чрезмерную нагрузку на серверы и нарушать их нормальное функционирование, что может быть расценено как нарушение функционирования информационных систем. Такие действия могут повлечь за собой административную ответственность по статье 13.6 Кодекса Российской Федерации об административных правонарушениях (нарушение правил эксплуатации средств связи, правил использования радиочастотного спектра) или даже уголовную ответственность по статье 272 Уголовного кодекса Российской Федерации (неправомерный доступ к компьютерной информации), если парсинг осуществлялся в обход технических средств защиты. Также, несоблюдение правил, установленных владельцем сайта в файле robots.txt, хотя и не влечет прямой юридической ответственности, может свидетельствовать о недобросовестности действий парсера.
3. Аргументы в пользу законности парсинга открытых данных при определенных условиях.
Исходя из анализа действующего законодательства и судебной практики, можно утверждать, что парсинг открытых данных, доступных для всеобщего обозрения без каких-либо ограничений доступа, является законным видом деятельности при соблюдении следующих ключевых условий:
Данные не являются объектом авторских прав или охраняются иным образом:Парсинг информации, не являющейся объектом авторских прав (например, фактических данных, новостных заголовков, расписаний, официальных документов государственных органов), не нарушает интеллектуальные права. При парсинге объектов авторских прав необходимо убедиться в наличии лицензии, разрешения правообладателя или отсутствии ограничений на использование информации в соответствии со статьями 1273-1286 ГК РФ (случаи свободного использования). Следует учитывать защиту баз данных, предусмотренную статьей 1260 ГК РФ и статьей 1334 ГК РФ.
Соблюдение правил доступа к сайту и файла robots.txt:Парсер должен соблюдать правила, установленные владельцем сайта, включая файл robots.txt, который содержит инструкции для поисковых роботов и других автоматизированных программ, указывающие, какие части сайта не следует сканировать. Хотя нарушение инструкций robots.txt само по себе не влечет юридической ответственности, игнорирование этих правил может быть расценено как недобросовестное поведение и учтено судом при рассмотрении споров. Также необходимо соблюдать условия пользовательского соглашения сайта, если таковые имеются и явно указывают на ограничения попарсингу.
Избежание чрезмерной нагрузки на серверы: Интенсивность парсинга должна быть разумной, чтобы не создавать чрезмерную нагрузку на серверы веб-сайта и не нарушать его нормальное функционирование. Использование задержек между запросами (throttling), ограничение количества одновременных запросов и распределение нагрузки во времени являются хорошей практикой для предотвращения блокировки IP-адреса и возможных претензий со стороны владельца сайта.
Цельпарсинга не является противоправной: Использование полученных данных не должно нарушать действующее законодательство (например, для распространения клеветы, мошенничества, нарушения авторских прав, незаконной обработки персональных данных и т.п.). Цельпарсинга должна быть законной и этичной.
4. Примеры судебных споров, связанных с парсингом данных в России.
Судебная практика в России по вопросам парсинга находится в стадии активного формирования, и количество прецедентов, напрямую связанных с парсингом именно открытых данных, постоянно растет. Анализ имеющихся дел позволяет выделить основные тенденции и спорные моменты.
Дело «Сравни.ру» против «Банки.ру»: Одним из наиболее известных и знаковых дел является спор между финансовыми порталами «Сравни.ру» и «Банки.ру». ООО «Сравни.ру» осуществляло парсинг информации о банковских продуктах (процентные ставки, условия кредитов и вкладов) с сайта ООО «БАНКИ.РУ». ООО «БАНКИ.РУ» обратилось в суд, утверждая, что ООО «Сравни.ру» нарушает их исключительные права на базу данных (статья 1260 ГК РФ). Суд первой инстанции удовлетворил требования ООО «БАНКИ.РУ», однако Девятый арбитражный апелляционный суд отменил это решение, указав на то, что собранные данные представляли собой общедоступную информацию о банковских продуктах и не обладали признаками охраноспособной базы данных. Суд апелляционной инстанции подчеркнул, что сами по себе сведения о процентных ставках, сроках и условиях банковских продуктов не являются объектом авторского права. Судпо интеллектуальным правам оставил постановление апелляционной инстанции без изменения. Верховный Суд РФ отказал в передаче кассационной жалобы ООО «БАНКИ.РУ» для рассмотрения в судебном заседании Судебной коллегии по экономическим спорам Верховного Суда Российской Федерации (Определение Верховного Суда РФ от 17.03.2015 N 305-ЭС14-6839 по делу N А40-68440/2013). Это дело является важным прецедентом, подтверждающим законностьпарсинга общедоступной информации, не являющейся объектом интеллектуальных прав.
Дела о нарушении функционирования информационных систем: Существует ряд дел, связанных с привлечением к ответственности за действия, которые привели к нарушению работы веб-сайтов в результате интенсивного парсинга, который был квалифицирован как DDOS-атака. В таких случаях суды могут квалифицировать действия парсера как неправомерный доступ к компьютерной информации (статья 272 УК РФ) или создание, использование и распространение вредоносных компьютерных программ (статья 273 УК РФ), особенно если парсинг осуществлялся в обход технических средств защиты или с использованием вредоносного программного обеспечения. Как правило, такие дела связаны с ситуациями, когда парсинг был направлен на получение доступа к закрытой информации или намеренное выведение сайта из строя, а не на сбор общедоступных данных в разумных пределах.
Дела о защите персональных данных: В практике встречаются случаи привлечения к административной ответственности за незаконную обработку персональных данных, полученных путем парсинга. Например, если компания осуществляет парсинг сайтов с объявлениями о продаже недвижимости или сайтов социальных сетей и собирает контактные данные физических лиц (номера телефонов, адреса электронной почты) без их согласия для последующего использования в маркетинговых целях, это может быть признано нарушением ФЗ-152 и повлечь за собой административную ответственность по статье 13.11 КоАП РФ (Постановления Пятнадцатого арбитражного апелляционного суда от 25.01.2021 по делу N А32-13961/2020, Решение Арбитражного суда Республики Татарстан от 17.08.2020 по делу N А65-12239/2020).
Дела о нарушении авторских прав при парсинге контента: Существуют прецеденты, когда компании привлекались к ответственности за парсинг защищенного авторским правом контента, такого как тексты новостных статей или фотографии, с последующей публикацией на своих ресурсах без разрешения правообладателя (Решение Арбитражного суда г. Москвы от 28.09.2017 по делу N А40-70888/17). Суды в таких случаях удовлетворяют иски правообладателей о защите исключительных прав и взыскивают компенсацию за нарушение авторских прав (статья 1301 ГК РФ).
Дела о недобросовестной конкуренции, связанной с парсингом: Использование парсинга в целях недобросовестной конкуренции также может стать предметом судебного разбирательства. Например, если компания-агрегатор осуществляет парсинг цен и описаний товаров с сайтов интернет-магазинов конкурентов и использует эту информацию для привлечения клиентов, при этом вводя потребителей в заблуждение относительно происхождения товаров или условий продажи, такие действия могут быть квалифицированы как акт недобросовестной конкуренции (статья 14.2 Федерального закона «О защите конкуренции»).
Вопрос о правомерности парсинга таких популярных картографических сервисов, как Яндекс.Карты и 2ГИС, является более сложным и требует отдельного рассмотрения. Эти сервисы представляют собой не просто наборы открытых данных, а сложные базы данных, защищенные как объекты интеллектуальной собственности.
Яндекс.Карты и 2ГИС как базы данных:Информация, представленная на Яндекс.Картах и 2ГИС, включая карты местности, адреса организаций, контактные данные, время работы, отзывы пользователей и фотографии, является результатом значительных инвестиций в сбор, обработку и организацию данных. В соответствии со статьей 1260 ГК РФ, такие базы данных могут быть защищены авторским правом как составные произведения, а изготовитель базы данных может обладать исключительным правом на использование базы данных (статья 1334 ГК РФ).
Условия использования: И Яндекс.Карты, и 2ГИС имеют свои условия использования, которые, как правило, прямо запрещают автоматизированный сбор данных (парсинг) без предварительного письменного разрешения. Нарушение этих условий может являться основанием для предъявления претензий со стороны владельцев сервисов.
Технические меры защиты:Яндекс.Карты и 2ГИС применяют различные технические меры для предотвращения парсинга, включая ограничение количества запросов с одного IP-адреса, использование CAPTCHA и блокировку подозрительной активности. Обход этих технических мер защиты может быть квалифицирован как неправомерный доступ к компьютерной информации (статья 272 УК РФ).
Таким образом, парсингЯндекс.Карт и 2ГИС без явного разрешения владельцев сервисов является крайне рискованным и, скорее всего, будет признан незаконным. Судебные споры в этой области могут быть основаны на нарушении исключительных прав на базу данных, нарушении условий использования сервиса, неправомерном доступе к компьютерной информации и незаконной обработке персональных данных. Единственным легальным способом получения данных с этих сервисов является использование предоставляемых ими API (Application Programming Interface) на условиях, определенных владельцами сервисов.
Чтобы минимизировать риски и обеспечить законностьпарсинга открытых данных, рекомендуется придерживаться следующих правил:
Внимательно изучите условия использования сайта и файл robots.txt: Перед началом парсинга тщательно ознакомьтесь с условиями использования веб-сайта и файлом robots.txt. Соблюдение этих правил демонстрирует ваше намерение действовать добросовестно.
Определите тип данных и их правовой статус: Убедитесь, что собираемые данные не являются персональными данными, объектами авторских прав или коммерческой тайной. Если это неизбежно, получите необходимые разрешения или согласия.
Используйте API, если они доступны: Вместо прямого парсинга HTML-кода, по возможности используйте официальные API, предоставляемые владельцами веб-сайтов. API обычно предоставляют структурированный доступ к данным на законных условиях.
Ограничьте интенсивность парсинга: Не создавайте чрезмерную нагрузку на серверы веб-сайта. Используйте задержки между запросами, распределяйте нагрузку во времени и идентифицируйте себя (например, через User-Agent).
Избегайте обхода технических мер защиты: Не пытайтесь обходить CAPTCHA, ограничения на количество запросов или другие технические меры, направленные на предотвращение автоматизированного сбора данных.
Соблюдайте этические нормы: Используйте полученные данные в законных и этичных целях. Не используйте парсинг для распространения вредоносного программного обеспечения, сбора персональных данных без согласия или совершения других противоправных действий.
Обеспечьте прозрачность: При использовании полученных данных, по возможности, указывайте источник.
Консультируйтесь с юристом: Если вы планируете осуществлять парсинг данных в коммерческих целях или сомневаетесь в законности своих действий, рекомендуется проконсультироваться с квалифицированным юристом.
7. Перспективы развития законодательства и судебной практики в области парсинга.
В настоящее время наблюдается тенденция к более активному обсуждению вопросов регулирования обработки данных, включая парсинг. С развитием технологий и увеличением объемов собираемых данных, вероятно, в будущем будут разработаны более четкие и специализированные правовые нормы, регулирующие эту сферу. Можно ожидать появления новых судебных прецедентов, которые конкретизируют условия законности парсинга, устанавливают баланс между свободой доступа к информации и защитой прав владельцев веб-сайтов и данных. Актуальным остается вопрос о статусе машиночитаемых данных и необходимости внесения изменений в законодательство для более четкого определения границ допустимого парсинга. Важно следить за изменениями в законодательстве и судебной практике, чтобы своевременно адаптировать свои методы парсинга и минимизировать правовые риски.
Заключение
Парсинг открытых данных в России является законным видом деятельности при условии строгого соблюдения действующего законодательства и этических норм. Ключевым фактором является характер собираемых данных: парсинг общедоступной информации, не содержащей персональных данных и не являющейся объектом авторских прав, как правило, не вызывает юридических претензий. Однако, парсингперсональных данных, объектов интеллектуальной собственности, а также парсинг ресурсов, запрещающих автоматизированный сбор данных в своих условиях использования, требует особой осторожности и соблюдения соответствующих правовых норм. Особое внимание следует уделить парсингу таких сервисов, как Яндекс.Карты и 2ГИС, который без разрешения владельцев сервисов, скорее всего, будет признан незаконным.
Анализ судебной практики подтверждает, что суды, как правило, поддерживают право на сбор и обработку общедоступных данных, но при этом строго следят за соблюдением прав на персональные данные, интеллектуальную собственность и надлежащее функционирование информационных систем. Соблюдение рекомендаций по безопасному и законному парсингу позволит использовать этот мощный инструмент для сбора и анализа информации в рамках правового поля России. Дальнейшее развитие законодательства и судебной практики в этой области будет способствовать формированию более четких правил и стандартов, что сделает практику парсинга более предсказуемой и безопасной.
Ттаблица с примерами судебных дел, связанных с парсингом данных в России, и ссылками на них (где это возможно; стоит учитывать, что прямые ссылки на решения могут быть нестабильны и потребовать поиска на сайтах судов по номеру дела):
ООО «БАНКИ.РУ» обратилось в суд с иском к ООО «Сравни.ру» о защите исключительных прав на базу данных, утверждая, что «Сравни.ру» незаконно извлекало информацию о банковских продуктах с их сайта путем парсинга.
Статья 1260 ГК РФ (право на базу данных), статья 1229 ГК РФ (исключительное право), Федеральный закон «Об информации, информационных технологиях и о защите информации».
Суд первой инстанции удовлетворил иск, но апелляционная и кассационная инстанции отменили решение, указав, что собранная информация являлась общедоступной и не обладала признаками охраноспособной базы данных. Верховный Суд РФ поддержал позицию апелляционной инстанции.
Дело о привлечении к ответственности за DDOS-атаку, связанную с парсингом
Лицо осуществляло интенсивный парсинг сайта конкурента, что привело к перегрузке серверов и нарушению работоспособности сайта, что было квалифицировано как DDOS-атака.
Статья 273 УК РФ (создание, использование и распространение вредоносных компьютерных программ), статья 272 УК РФ (неправомерный доступ к компьютерной информации).
В зависимости от конкретных обстоятельств дела, лицо может быть привлечено к уголовной ответственности.
Поискпо номеру дела на сайтах судов общей юрисдикции или на сайте Следственного комитета РФ.
Компания осуществляла парсинг сайтов объявлений о продаже автомобилей и собирала контактные данные продавцов (физических лиц) без их согласия для последующего использования в маркетинговых целях.
Статья 13.11 КоАП РФ (нарушение установленного законом порядка сбора, хранения, использования или распространения персональных данных), Федеральный закон «О персональных данных».
Поискпо номеру дела в реестре дел Роскомнадзора или в базах арбитражных судов (если дело рассматривалось в арбитражном суде).
Дело о нарушении авторских прав при парсинге контента
Компания осуществляла парсинг новостных статей с сайта информационного агентства и публиковала их на своем сайте без разрешения правообладателя.
Статья 1270 ГК РФ (исключительное право на произведение), статья 1301 ГК РФ (ответственность за нарушение исключительного права на произведение).
Суд удовлетворил иск правообладателя и обязал компанию прекратить нарушение авторских прав и выплатить компенсацию.
Поискпо номеру дела в базе арбитражных судов или судов общей юрисдикции.
Дело о недобросовестной конкуренции, связанной с парсингом
Компания-агрегатор осуществляла парсинг цен и описаний товаров с сайтов интернет-магазинов конкурентов и использовала эту информацию для привлечения клиентов, при этом не всегда корректно отображая информацию или вводя потребителей в заблуждение.
Федеральный закон «О защите конкуренции», статья 14.2 (недобросовестная конкуренция, связанная с приобретением и использованием исключительных прав на средства индивидуализации юридического лица, средства индивидуализации товаров).
Суд может признать действия компании актом недобросовестной конкуренции и обязать ее прекратить нарушение и возместить убытки.
Дело о защите базы данных как объекта интеллектуальных прав
Компания разработала и вела базу данных контрагентов, доступ к которой был ограничен. Конкурент использовал парсинг для получения доступа к этой базе данных.
Статья 1260 ГК РФ (право на базу данных), статья 1334 ГК РФ (исключительное право изготовителя базы данных).
Суд может признать действия конкурента нарушением исключительных прав на базу данных и обязать его прекратить использование данных и выплатить компенсацию.
Динамичность судебной практики: Судебная практика постоянно развивается, и появляются новые решения, которые могут влиять на интерпретацию законности парсинга.
Индивидуальность каждого дела: Каждое дело рассматривается индивидуально, с учетом конкретных обстоятельств, характера собранных данных, методов парсинга и целей использования полученной информации.
Необходимость юридической консультации: При осуществлении парсинга данных, особенно в коммерческих целях, рекомендуется проконсультироваться с юристом для оценки рисков и обеспечения соответствия законодательству.
Доступность судебных решений: Доступ к полным текстам судебных решений может быть ограничен или потребовать регистрации на соответствующих ресурсах (например, kad.arbitr.ru, sudact.ru). Приведенные ссылки являются примерами, и для поиска конкретных дел необходимо использовать номер дела на сайтах судов.
Эта таблица призвана проиллюстрировать разнообразие судебных споров, связанных с парсингом данных, и показать, какие правовые нормы чаще всего применяются в таких делах. Она подтверждает, что законностьпарсинга зависит от множества факторов и требует внимательного анализа конкретной ситуации.