Такой вопрос многие задают постоянно, как только сталкиваются с парсингом и чаще всего интересует следующее:
1. Сайт изначально предназначен для публикации, то есть он открыт.
2. Если вы не хотите чтобы информация была открыта, не публикуйте.
Из 1 пункта выше следует, что нет достаточных средств для защиты от парсеров. Вопрос только в том, на сколько вы готовы и можете усложнить жизнь для парсеров. Все что может прочитать и распознать человек (а ведь именно для людей и делается сайт?) может быть воспроизведено. В части, где парсинг может быть автоматизирован, он будет автоматизирован. Сейчас существуют мощные парсеры Яндекса и Гугла. Если они ваш сайт не смогут разобрать, то и в индексе его не будет, значит полезная информация не дойдет до конечного пользователя! А тот, кто захочет, ее скопирует, если информация очень нужна. Если даже вы представите в виде мозаики из картинок и кусков, даже если зашифруете, но информация на экране должна все равно быть читабельной, а значит простой принтскрин и распознавание в FineReader будет быстрее, чем вы напишите защиту от него… Всякая защита усложняет систему и увеличивает количество ошибок. Пользователь быстрее уйдет с вашего сайта, только потому что из-за ошибки в скрипте полезные данные не получит.
Единственное что может вам помочь, это не раскрывать полностью всю информацию о предмете, или разделить на несколько частей, но при этом не должно быть неудобства для посетителя. К примеру, скройте «количество зубцов в шестеренке», любую ключевую информацию, без которой «самолет не взлетит». А если хотите поиграться, то пришла в голову идея: перемешивание по определенному алгоритму текста, который потом восстанавливается, применение стилей для скрытия «фальшивых» слов или фраз. Например, задать стиль, который скрывает каждое второе предложение или слово. Но к сожалению, это ломается быстро
[su_box title=»Нужны данные для вашего бизнеса?» style=»default» box_color=»#085fc8″]Бесплатно регистрируйтесь на нашем портале https://ru.xmldatafeed.com и используйте ежедневные итоги парсинга крупнейших сайтов России (товары и услуги)!
[/su_box]Но можно усложнить парсинг если реализовать следующие способы:
Введение: краткое резюме текущей ситуации и что ожидать от этого руководства Российский рынок криптовалют представляет…
Краткое саммари: ваш путеводитель по грантам ФСИ от идеи до реализации Получение государственного гранта для…
Краткое содержание Российский SaaS-бизнес, ориентированный на глобальный рынок, столкнулся с фундаментальной проблемой: принимать регулярные платежи…
Введение: «Сколково» — не территория, а идеология Инновационный центр «Сколково» часто воспринимается как географическая точка…
Краткое резюме: зачем вам нужен сервис аналитики и что вы найдете в этой статье Продажи…
Краткое резюме для руководителя В условиях современного цифрового рынка, где цены могут меняться несколько раз…