Законно ли парсить сайты в России?

Начнем с самого простого и распространенного вопроса — фотографирование ценников в магазинах, хотя это не имеет прямого отношения к парсингу сайтов, но проблематика схожая (действительно, кажется, что нет разницы фотографировать ценники в магазинах, либо парсить цены с сайтов конкурентов).

Итак, вопрос: Можно ли установить для покупателей правило, запрещающее проводить несанкционированную фото- и видеосъемку в магазине? Если не углубляться в детальное толкование закона, давайте посмотрим на самую важную статью об информации:

В соответствии со статьей №5 Закона «ОБ ИНФОРМАЦИИ, ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЯХ И О ЗАЩИТЕ ИНФОРМАЦИИ»:

1. Информация может являться объектом публичных, гражданских и иных правовых отношений. Информация может свободно использоваться любым лицом и передаваться одним лицом другому лицу, если федеральными законами не установлены ограничения доступа к информации либо иные требования к порядку ее предоставления или распространения.

2. Информация в зависимости от категории доступа к ней подразделяется на общедоступную информацию, а также на информацию, доступ к которой ограничен федеральными законами (информация ограниченного доступа).

3. Информация в зависимости от порядка ее предоставления или распространения подразделяется на:

1) информацию, свободно распространяемую;

2) информацию, предоставляемую по соглашению лиц, участвующих в соответствующих отношениях;

3) информацию, которая в соответствии с федеральными законами подлежит предоставлению или распространению;

4) информацию, распространение которой в Российской Федерации ограничивается или запрещается.

4. Законодательством Российской Федерации могут быть установлены виды информации в зависимости от ее содержания или обладателя.

Таким образом, информация о ценах в магазинах является общедоступной, т.к. нет законодательства ограничивающего доступ к такой информации. В связи с чем переписывать и снимать цены в магазине не запрещается. Действительно, нарушений закона нет.

Более того, в статье 29 Конституции Российской Федерации закреплено право каждого гражданина «свободно искать, получать, передавать, производить и распространять информацию любым законным способом».

Теперь по парсингу сайтов. Вопрос, который мы задали юридической компании («Фрезе и партнеры») перед запуском нашего бизнеса: «Вправе ли организация осуществлять автоматизированный сбор информации, размещенной в открытом доступе на сайтах в сети интернете (парсинг)?»

В соответствии с действующим в Российской Федерации законодательством разрешено всё, что не запрещено законодательством. Парсинг сайтов является законным, в том случае, если при его осуществлении не происходит нарушений установленных законодательством запретов. Таким образом, при автоматизированном сборе информации необходимо соблюдать действующее законодательство. Законодательством Российской Федерации установлены следующие ограничения, имеющие отношение к сети интернет:

  • Не допускается нарушение Авторских и смежных прав.
  • Не допускается неправомерный доступ к охраняемой законом компьютерной информации.
  • Не допускается сбор сведений, составляющих коммерческую тайну, незаконным способом.
  • Не допускается заведомо недобросовестное осуществление гражданских прав (злоупотребление правом).
  • Не допускается использование гражданских прав в целях ограничения конкуренции.

Из вышеуказанных запретов следует, что организация вправе осуществлять автоматизированный сбор информации (парсинг сайтов), размещенной в открытом доступе на сайтах в сети интернет если соблюдаются следующие условия:

  • Информация находится в открытом доступе и не защищается законодательством об авторских и смежных правах.
  • Автоматизированный сбор осуществляется законными способами.
  • Автоматизированный сбор информации не приводит к нарушению в работе сайтов в сети интернет.
  • Автоматизированный сбор информации не приводит к ограничению конкуренции.

Есть рекомендации, которых стоит придерживаться, если используется парсинг:

  • Извлекаемый контент не должен быть защищен авторским правом
  • Процесс парсинга не должен мешать работе сайта, который подвергается парсингу
  • Парсинг не должен нарушать условия использования сайта
  • Парсер не должен извлекать личную (персональную) информацию пользователя
  • Контент, который подвергается парсингу, должен отвечать стандартам правомерного использования

Самый «тонкий» момент — это возможность претензий на то, что «парсинг мешает работе нашего сайта и мы несем убытки». В ответ на такую претензию можно сослаться на то, что поисковые механизмы Google и Yandex занимаются парсингом (индексацией) всего сайта и собирают всю доступную информацию, делая это достаточно регулярно. Соответственно, звучит логично, что аналогичный парсер, который заходит на сайт компании, чтобы собрать информацию о ценах, выполняет тоже самое техническое действие. Доказать то, что аналогичное действие мешает работе сайта, а работа поисковых систем не мешает, может быть затруднительно. Но в любом случае, хороший парсер должен следовать правилам в robots.txt.

Можно ли юридически запретить парсинг сайта в России?

Очень часто на сайтах пишут аналоги фразы “Автоматизированное извлечение информации сайта запрещено”. Имеет ли значимую юридическую силу это предупреждение?

Любые дополнительные юридические ограничения человека (сверх того, что требует государственное законодательство) можно навязать пользователю лишь одним способом – путем ДОБРОВОЛЬНОГО (с обеих сторон) заключения договора. Это обычно реализуется в виде пользовательского соглашения при регистрации на сайте. При этом одна сторона (например, сайт) обязуется предоставить какие-то услуги (например, доступ к некоторой важной информации), в то время как другая сторона (пользователь) добровольно принимает на себя какие-то ограничения (например, не пользоваться никакими автоматизированными средствами для извлечения, предоставляемой ему, информации). Это соглашения вступает в юридическую силу с момента нажатия на кнопку “Принимаю условия” (см. акцепт). Поскольку с анонимным пользователем в принципе невозможно заключить никакой договор (что очевидно, он не акцептует ничего), то на не прошедшего регистрацию пользователя невозможно возложить никакие ограничения (сверх существующих в законе).

Но сказанное выше касается только механизма, которым пользователь взаимодействует с сайтом. Что касается самого контента на сайте, который пользователь получает, то на него распространяется все нормы авторского права (независимо от способа, которым он получен). Поскольку авторское право (как государственный закон и международное соглашение) распространяется на всех без исключения (в том числе и на анонимных пользователей), то не требуется заключать с пользователем никакого договора (и заставлять проходить его регистрацию).

Достаточно упомянуть (желательно на видном местом) запрет на использование данного контента в любых целях (обычно коммерческих), кроме личного ознакомления. Это допустимо на основании того, что владелец исключительных прав на контент может определять любые ограничения на его использование. Что это дает: контент, собранный автоматизированными средствами, в дальнейшем не может быть использован никак без нарушения закона о защите авторских прав (это серьезнее, чем нарушение пользовательского соглашения). Но, если мы говорим про парсинг фактических данных (артикул товара, цена, категория и т.п.), то авторское право на такой контент не распространяется.

Обратите внимание, что создавая сайт на каком-то стеке технологий, разработчик сайта принимает все его возможности и способы использования. Поэтому пользователь, в свою очередь, имеет такое же право пользоваться всеми возможностями и способами для получения информации, которые предоставляет выбранная разработчиком платформа и стек технологий.

Можно ли в России парсить данные пользователей с Авито, ВКонтакте и других социальных сетей?

Методы сбора персональных данных пользователей (телефоны, почта и т.п.) с сайтов объявлений (например АВИТО) и социальных сетей (в том числе автоматические) являются весьма популярными. Чтобы в этом убедиться, достаточно набрать в поисковике запрос вида «парсинг авито» или любой похожий – вы увидите многие десятки предложений подобных услуг.

Выгоды совершенно очевидны: вы быстро и дешево получаете базу потенциальных потребителей товара или услуги с нужными контактными (ФИО, телефон, электронная почта и т.п.). Данные базы могут использоваться по-разному, но главным образом, конечно, для контактов посредством отправки электронных писем, СМС или совершения звонков. Тем не менее, осуществление такого парсинга персональных данных людей – это нарушение федерального закона «О персональных данных», поскольку обработка персональных данных может осуществляться только при наличии согласия на это.

Заинтересованные в парсинге стороны обычно приводят несколько аргументов, которые, по их мнению, доказывают, что нарушения законодательства не происходит.

Они такие:

  • Отдельно взятые данные, например, только номер телефона, не являются сами по себе персональными данными, а, значит, собирать их можно;
  • Пользователи самостоятельно выкладывают свои данные в открытый доступ, тем самым давая согласие на то, что их данные будут обрабатываться, а также на то, что им будут звонить или отправлять сообщения.

Аргументы, разумеется, не имеют ничего общего с действительностью, так как:

  • Персональными данными, согласно ст. 3 федерального закона «О персональных данных», называется «любая информация, относящаяся к прямо или косвенно определенному или определяемому физическому лицу (субъекту персональных данных)». То есть, закон не определяет исчерпывающего списка того, что является персональными данными, а что нет, ограничиваясь констатацией того, что позволяет идентифицировать человека, а что нет. При этом, что важно, нет никакого указания на то, что обязательно наличие, например, ФИО, чтобы данные стали персональными. В этих терминах, личный номер телефона физического лица тоже является персональными данными. Соответственно, если даже парсятся только телефонные номера пользователей (без их согласия), то уже нарушается закон «О персональных данных».
  • Несмотря на то, что пользователи действительно выкладывают свои данные в открытых источниках, статья 6 федерального закона «О персональных данных» все равно обязывает получать согласие на обработку персональных данных: «обработка персональных данных осуществляется с согласия субъекта персональных данных на обработку его персональных данных». А статья 9 того же закона уточняет, что:
  • Субъект персональных данных принимает решение о предоставлении его персональных данных и дает согласие на их обработку свободно, своей волей и в своем интересе.
  • Согласие на обработку персональных данных должно быть конкретным, информированным и сознательным.
  • Согласие на обработку персональных данных может быть дано субъектом персональных данных или его представителем в любой позволяющей подтвердить факт его получения форме, если иное не установлено федеральным законом.

Обязанность предоставить доказательство получения согласия субъекта персональных данных на обработку его персональных данных или доказательство наличия оснований, указанных в пунктах 2 – 11 части 1 статьи 6, части 2 статьи 10 и части 2 статьи 11 настоящего Федерального закона, возлагается на оператора.

Соответственно, парсинг данных пользователей с сайтов объявлений и социальных сетей является незаконным и за это в Кодексе Российской Федерации об административных правонарушениях предусмотрена следующая ответственность (см. статью 13.11): «Нарушение установленного законом порядка сбора, хранения, использования или распространения информации о гражданах (персональных данных) – влечет предупреждение или наложение административного штрафа на граждан в размере от трехсот до пятисот рублей; на должностных лиц – от пятисот до одной тысячи рублей; на юридических лиц – от пяти тысяч до десяти тысяч рублей».

Важно отметить также, что санкции этим могут не ограничиться, поскольку нарушение федерального закона «О персональных данных» может сопровождаться нарушением федерального закона «О рекламе», если по собранной базе, например, рассылались рекламные СМС-сообщения. То есть, парсинг данных пользователей из открытых источников нарушает положения федерального закона «О персональных данных» и может вызвать правовые последствия.