Парсинг сайтов — законно или нет

Парсинг сайтов — законно или нет
Lena Fisher's Profile Image
Lena Fisher

Content Manager, Octo Browser

Веб-скрейпинг, или веб-парсинг, — это автоматизированный сбор данных. Он широко используется для маркетинга, анализа цен, мониторинга брендов и других задач. Объем информации в интернете ежегодно растет, и парсинг сайтов становится мощным инструментом для работы с массивами цифрового контента. Законно ли это? Да, но есть нюансы. В статье разбираемся, какие правовые нормы США, Евросоюза, Великобритании и России могут влиять на веб-скрейпинг.

Веб-скрейпинг, или веб-парсинг, — это автоматизированный сбор данных. Он широко используется для маркетинга, анализа цен, мониторинга брендов и других задач. Объем информации в интернете ежегодно растет, и парсинг сайтов становится мощным инструментом для работы с массивами цифрового контента. Законно ли это? Да, но есть нюансы. В статье разбираемся, какие правовые нормы США, Евросоюза, Великобритании и России могут влиять на веб-скрейпинг.

Содержание

Законен ли веб-скрейпинг

Простой пример: когда вы ищете товар и сравниваете цены на разных сайтах — по сути, вы занимаетесь ручным скрейпингом. Автоматизированный веб-скрейпинг выполняет ту же задачу быстрее. Он помогает собрать большие объемы данных по заданным критериям и распределить их в файлы для анализа. Таким образом можно скрейпить цены, условия доставки, ассортимент магазинов, контакты и многое другое.

Законно ли это? Да, если мы говорим о сборе публичной информации, аналогично ручному анализу цен на разных площадках. Правовые вопросы возникают, когда парсинг сайтов затрагивает:

  • материалы, защищенные авторским правом;

  • персональные данные (номера телефонов, электронную почту);

  • информацию, которая скрыта от незарегистрированных пользователей. 

Обход технических мер защиты сайтов — капч, логинов, блокировок от ботов — также может быть незаконным. 

Как законы о конфиденциальности влияют на веб-скрейпинг

Большинство стран не имеет прямого регулирования веб-скрейпинга. Однако многие нормы косвенно относятся к нему, если парсинг затрагивает материалы, защищенные авторским правом, или скрытый контент. Также рискованно нарушать условия использования сайтов, безопасность систем или собирать персональные данные.

Любые сведения, по которым можно идентифицировать конкретного человека, считаются персональными. Разные страны формируют собственный набор категорий, но большинство включает такие данные:

  • имя и фамилия;

  • адрес, телефон, электронная почта;

  • идентификационные номера документов;

  • IP-адрес и куки;

  • данные о местоположении;

  • финансовая информация.

Некоторые страны дополнительно выделяют категорию чувствительных данных. Как правило, это информация об этническом происхождении, религиозных и политических взглядах, сексульной жизни и ориентации, а также биометрические и медицинские данные. 

Важно: в этой статье мы рассматриваем потенциальные риски веб-скрейпинга с точки зрения законодательства разных стран. Перед началом парсинга рекомендуем внимательно изучить законы нужного вам региона и оценить возможные риски. Важно учитывать, что если действия выполняются из одной страны, они могут затрагивать пользователей или ресурсы в других регионах и подпадать под законы нескольких государств. Например, если пользователь из Европы собирает данные с американских сайтов, одновременно могут применяться нормы ЕС и США.

Какие законы косвенно касаются веб-скрейпинга в разных странах

США

  • CFAA (Computer Fraud and Abuse Act) — защита от несанкционированного доступа и обхода технических мер.

  • DMCA (Digital Millennium Copyright Act) — защита авторских прав в цифровой среде.

  • FTC Act (Federal Trade Commission Act, section 5) — запрет недобросовестных бизнес-практик.

  • State Data Breach Laws — законы отдельных штатов о персональных данных. 

  • First Amendment и Fair Use Doctrines — принципы добросовестного использования материалов.

  • ToS (Terms of Service) — условия использования сайтов. 

Евросоюз

  • GDPR (General Data Protection Regulation) — защита персональных данных.

  • Database Directive 96/9/EU — охрана баз данных.

  • Copyright Directive — единые стандарты авторских прав.

  • ePrivacy Directive — защита конфиденциальности и правила использования куки.

  • DSA (Digital Services Act) — правила безопасности и контроля контента на платформах.

  • P2B Regulation (Platform-to-Business Regulation) — прозрачные условия для бизнес-пользователей.

Великобритания 

  • UK GDPR (United Kingdom General Data Protection Regulation) — защита персональных данных.

  • DPA 2018 (Data Protection Act 2018) — также защита персональных данных.

  • CDPA (Copyright, Designs and Patents Act 1988) — авторские права на оригинальный контент.

  • Database Right — защита баз данных.

  • CMA (Computer Misuse Act 1990) — запрет на несанкционированный доступ к системам.

Россия 

  • 152‑ФЗ «О персональных данных» — защита персональных данных.

  • Гражданский кодекс РФ, часть IV — авторские права и базы данных.

  • 149-ФЗ «Об информации, информационных технологиях и защите информации» — доступ к информации и защита IT-систем.

  • 135-ФЗ «О защите конкуренции» — недобросовестная конкуренция.

  • Закон о защите прав потребителей — корректность коммерческих сервисов.

  • Закон о связи — защита инфраструктуры и сетей.

Как регулируется веб-скрейпинг в США

Веб-скрейпинг легален, если соблюдать правила доступа к данным, авторские права, честную конкуренцию, приватность и условия использования сайтов. Риски возникают, если скрейпер обходит технические ограничения или нарушает права третьих лиц.

Область

Нормативы

Можно

Нельзя

Примечание

Доступ к данным и защита систем

CFAA, ToS

  • Скрейпить публичные страницы.

  • Выполнять запросы без обхода логинов, капчи, платных подписок и IP-блокировок 

  • Обходить техническую защиту.

  • Взламывать базы данных.

  • Использовать чужие пароли, аккаунты, куки.

  • Нарушать правила сайта или использовать его уязвимости 


Персональные данные и приватность


CCPA, CPRA, локальные законы штатов

  • Собирать обезличенные данные, публичную информацию, отзывы 

  • Скрыто продавать информацию. 

  • Парсить электронные адреса, телефоны, поведенческие профили или геолокации, не уведомляя пользователя и не давая ему возможности отказаться 

Закон требует уведомлять пользователей об утечках. Также человек должен иметь возможность отказаться от сбора и обработки данных

Авторское право и использование контента


DMCA, Fair Use

  • Извлекать факты, цены, каталоги, статистические данные, описания товаров и результаты аналитики. 

  • Преобразовывать информацию в новый формат — например, диаграммы, инфографику. 

  • Ограниченно цитировать собранную информацию 

  • Публиковать чужие тексты, фотографии или обзоры без разрешения.

  • Обходить техническую защиту цифрового контента 


Честная бизнес-практика


Section 5 FTC Act

  • Использовать публичные данные для аналитики, товарных рейтингов или отзывов 


  • Искажать информацию. 

  • Маскировать автоматический доступ под действия реальных пользователей  

FTC может предъявить претензию, если компания скрыто обрабатывает или продает персданные, но заявляет обратное. Также компании обязаны открыто сообщать, какую информацию собирают, с какой целью и кому передают 

Как регулируется веб-скрейпинг в Евросоюзе

В Евросоюзе веб-скрейпинг разрешен. Риски возникают при обходе технических ограничений платформ, доступе к закрытым разделам, подделке куки, токенов или сессий. Также важно соблюдать частоту запросов и условия использования сайтов. Это регулируют GDPR, Database Directive, Copyright Directive, ePrivacy Directive, DSA и P2B Regulation.

Область

Нормативы

Можно

Нельзя

Примечание

Персональные данные и приватность

CDPR, ePrivacy Directive, DSA, P2B Regulation 

  • Собирать неперсональные данные — цены, характеристики товаров, рейтинги, количество отзывов. 

  • Обрабатывать публичные персональные данные, если доказан легитимный интерес 

  • Подменять куки и обходить куки-блокировки.

  • Получать доступ к данным на устройстве пользователя без его согласия. 

  • Собирать персональные данные — электронные адреса, имена, фотографии, профили в соцсетях и другую личную информацию. 

  • Извлекать информацию из закрытых профилей, премиум-зон. 

  • Игнорировать запреты платформ на автоматизированный сбор данных 

Легитимный интерес — обоснованный повод для работы с персональными данными. Если вы работаете с ними, важно соблюдать основные принципы GDPR — минимизировать сбор, обеспечивать прозрачность, иметь конкретную цель, уведомлять пользователя и удалять все по запросу 

Авторское право и использование контента

Copyright Directive

  • Извлекать факты и общие сведения без творческой составляющей — часы работы, цены, количество отзывов, характеристики товаров. 

  • Использовать небольшие фрагменты контента для анализа 

  • Копировать и публиковать тексты и изображения. 

  • Загружать чужие фотографии товаров или размещать статьи без существенной переработки 


Базы данных

Database Directive 96/9/EU

  • Собирать небольшие части или отдельные элементы баз данных 

  • Копировать существенную часть базы — как по объему, так и по значимости. 

  • Массово извлекать контент. 

  • Переопубликовывать контент. 

  • Создавать продукт, который полностью основан на чужой базе данных 


Технические ограничения доступа

Directive 2013/40/EU, Directive 2001/29/EU

  • Посещать публичные страницы через HTTP-запросы. 

  • Использовать официальный API. 

  • Соблюдать лимиты запросов. 

  • Парсить данные по правилам файла robots.txt 

  • Обходить техническую защиту платформы. 

  • Подделывать куки, токены, сессии, User-Agent. 

  • Эмулировать устройство. 

  • Обходить авторизацию. 

  • Получать доступ к премиум-данным и закрытым разделам. 

  • Перегружать сайт запросами 


Правила платформы и рыночные отношения

DSA, P2B Regulation, ToS

  • Собирать публичные данные через официальные API. 

  • Парсить с соблюдением частотных лимитов и технических требований к боту 

  • Избыточно нагружать сервис. 

  • Игнорировать запреты платформ на ботов. 

  • Обходить защиту сайта. 

  • Имитировать действия реального пользователя 


Как регулируется веб-скрейпинг в Великобритании 

В Великобритании нет норм, которые прямо регулируют веб-скрейпинг. Но его законность зависит от того, затрагивает ли он персональные данные, базы данных и материалы, защищенные авторским правом. Также при парсинге важно соблюдать правила сайтов и не обходить техническую защиту платформ.

UK GDPR — британская версия европейского GDPR, адаптированная после Brexit. 

Область

Нормативы

Можно

Нельзя

Примечание

Персональные данные

UK GDPR, Data Protection Act 2018 

  • Парсить неперсональные и обезличенные открытые данные — цены, характеристики товаров, расписания мероприятий 

  • Собирать электронные адреса, имена, фотографии, профили в соцсетях и другие персданные без согласия. 

  • Парсить публичные аккаунты для маркетинга, создания пользовательских портретов или распознавания лиц  

В Великобритании скрейпинг и обработка персональной информации должны иметь законное основание — например, согласие человека на это. За автоматизированный веб-скрейпинг персданных возможна уголовная ответственность

Авторское право

CDPA 1988

  • Собирать факты — цены, рейтинги, характеристики и ассортимент товаров, даты мероприятий или численные данные 

  • Копировать защищенные материалы в неизменном виде — тексты, фото, инфографику, программный код. 

  • Переопубликовать чужие материалы. 

  • Агрегировать статьи на своих площадках. 

  • Создавать каталоги, которые полностью основаны на стороннем контенте 


Базы данных

Database Right

  • Собирать фрагменты для личного использования, статистики, анализа и исследований. 

  • Использовать данные в некоммерческих целях. 

  • Собирать несущественные части базы данных 


  • Копировать существенную часть базы данных. 

  • Создавать конкурирующую базу данных на основе чужой. 

  • Обходить техническую защиту базы данных

Под несущественной частью базы данных понимают не более 30–50% — при условии, что в них не входят ключевые элементы каталога 

Технические меры защиты и доступ

Computer Misuse Act 1990

  • Скрейпить данные на общедоступных страницах 

  • Обходить техническую защиту. 

  • Подменять куки. 

  • Обходить авторизацию и IP-блокировки.  

  • Взламывать капчи. 

  • Маскировать бота под реального пользователя для доступа к закрытым системам 



Как регулируется веб-скрейпинг в России

В России нет закона, который регулирует веб-скрейпинг. Но ряд актов затрагивает парсинг персональных данных, баз данных, коммерческой информации, а также информационных систем либо материалов, защищенных авторским правом.

Область

Нормативы

Можно

Нельзя

Примечание

Персональные данные

152‑ФЗ «О персональных данных»

  • Собирать публичные неперсональные данные — цены, характеристики товаров, расписания событий, новости, статистику. 

  • Парсить обезличенную информацию в соцсетях — количество лайков и репостов, абстрактные никнеймы, ссылки на страницы без идентифицирующей информации 

  • Парсить персональную информацию — имя, телефон, геолокацию, электронный и адрес проживания, фото, ID профиля в соцсетях. 

  • Создавать базы контактов — например, пользователей Avito.

  • Собирать и объединять персданные из множества профилей без согласия. 

  • Передавать личные данные третьим лицам 

 


Любой сбор персональных данных должен иметь правовое основание — согласие субъекта. Либо соответствовать другой цели, предусмотренной законом. Например, чтобы спасти человека в экстренной ситуации, вы можете передать его медицинскую информацию без согласия 

Авторское право и базы данных

Гражданский кодекс РФ, часть IV

  • Парсить фактическую информацию — цены, технические характеристики. 

  • Использовать фактическую информацию для анализа, сбора статистики, исследований 

  • Массово копировать и публиковать чужие материалы — оригинальные тексты, описания, фотографии, статьи, изображения и программный код. 

  • Полностью парсить базы данных. 

  • Извлекать существенные части баз данных, даже если отдельная информация внутри не защищена 

Базы данных защищены как самостоятельные объекты 

Технические меры защиты

149-ФЗ «Об информации, информационных технологиях и защите информации»

  • Парсить общедоступные страницы и собирать расписания вебинаров или характеристики товаров 

  • Обходить техническую защиту. 

  • Автоматизировать доступ к закрытым системам или защищенным внутренним базам. 

  • Подделывать куки. 

  • Использовать чужие токены и пароли. 

  • Обходить авторизацию и капчи. 

  • Чрезмерно нагружать сайт, как при DDoS-атаках 


Недобросовестная конкуренция и защита потребителей 

135-ФЗ «О защите конкуренции», закон о защите прав потребителей

  • Работать с открытыми данными конкурентов для мониторинга рынка 


  • Создавать копии сервисов. 

  • Выдавать чужой контент за свой.

  • Показывать устаревшие или неверные данные — например, на сайтах-агрегаторах 


Инфраструктура и телекоммуникация

Закон о связи

  • Собирать общедоступные данные 



 

  • Запускать массовые запросы, похожие на DDoS-атаку 


Лучшие практики безопасного и этичного веб-скрейпинга

Используйте API, если они доступны

API — это официальный и безопасный способ получать данные с сайта, не нарушая его защиту и правила. С помощью API владелец ресурса сам определяет, какую информацию можно собирать, с какой частотой и в каком формате, поэтому риск нарушений минимален. Многие соцсети и сервисы предоставляют API для получения постов, комментариев, рейтингов или статистики. Найти его можно в разделе API, Developers, Documentation, Integrations или через поисковой запрос «Название сайта + API».

Соблюдайте правила сайта

Перед скрейпингом изучите Terms of Service (ToS). Там есть информация, можно ли автоматизированно собирать данные и как именно. Также проверьте файл robots.txt. Его можно открыть по запросу вида https://домен/robots.txt. Он показывает, какие разделы сайта могут посещать боты-скрейперы. 

Уважайте ресурсы платформы и работайте бережно. Ограничивайте частоту запросов — например, один в секунду. Добавляйте случайные задержки между запросами и реагируйте на коды ответов сервера 429 или 503. Если они появились — уменьшите интенсивность реквестов. Это помогает избежать технических нарушений и снизить вероятность блокировки.

Минимизируйте сбор данных

Собирайте только те данные, которые действительно нужны для вашей задачи. Это снижает риски, упрощает хранение и демонстрирует уважение к владельцам сайта и пользователям.

Для этого перед парсингом определите цель и список необходимых полей. Все, что не помогает выполнить задачу, собирать не стоит. Например, для анализа новостей достаточно заголовка, даты и категории. Автор или ссылки на его соцсети — лишние.

Также избегайте сбора персональных данных: имен, электронных адресов, геолокации, фотографий или отзывов с личной информацией. 

Документируйте собранные данные 

Фиксируйте источники данных и способы их обработки. Это помогает сохранить прозрачность и при необходимости подтвердить законность работы. Если вы собрали больше данных, чем нужно, удалите лишнее.

Трансформируйте данные, чтобы не нарушать авторские права 

Используйте собранные данные для создания нового результата — анализа, статистики, визуализации или собственного контента. Например, если бот собрал цены на MacBook Air из разных магазинов, корректно использовать это в виде графика динамики цен. А вот публиковать чужие описания товаров без изменений не стоит. Это может нарушать авторские права. 

Риски и последствия несоблюдения требований

Уголовные или регуляторные санкции (GDPR, CCPA)

GDPR (ЕС) предусматривает штрафы до 20 млн евро или 4% мирового годового оборота компании. CCPA (США) — до 7 500 долларов за каждое нарушение. Риски возникают даже при работе с публичными данными, если по ним можно идентифицировать человека или они неправомерно обрабатываются.

Регуляторы активно используют эти меры. В 2024 году совокупные штрафы по GDPR превысили 1,2 млрд евро. Среди самых заметных санкций последних лет:

  • Meta* — около 1,2 млрд евро за незаконную передачу данных из ЕС в США.

  • Amazon — 746 млн евро за нарушение принципов GDPR.

  • LinkedIn — 310 млн евро за обработку данных без достаточного правового основания.

  • TikTok — 530 млн евро за передачу данных в Китай и недостаточную прозрачность политики конфиденциальности.

Эти штрафы показывают, что нарушение правил обработки и передачи данных — потенциально дорогостоящий риск для специалистов по скрейпингу и бизнесов.

*Компания Meta признана экстремистской организацией и запрещена в России.

Операционные и бизнес-риски 

Кроме штрафов, доказанные нарушения при веб-скрейпинге влекут за собой серьезные бизнес-угрозы. Компании могут столкнуться с такими последствиями, как:

  • блокировка доступа к ресурсам по IP и запрет на использование данных;

  • судебные иски от конкурентов и пользователей с требованиями компенсаций за незаконное использование личных данных, контента или баз данных;

  • потеря партнерств и репутации, если выяснится, что данные получили или использовали неправомерно.

Нарушение правил ведет и к операционным издержкам. Бизнесу приходится: 

  • пересматривать архитектуру;

  • менять процессы хранения и обработки данных;

  • удалять незаконно собранные массивы информации;

  • внедрять комплаенс-процессы;

  • хранить логи и управлять согласиями пользователей. 

В отдельных случаях бизнесы полностью закрывали продукт после того, как обнаруживали нарушения в сборе ключевого источника данных. 

Иногда компании и специалисты, работающие с автоматизированным сбором данных, используют дополнительные инструменты — например, антидетект‑браузеры, включая Octo Browser. Они помогают точечно управлять сетевыми параметрами — подключать разные IP и подменять цифровой отпечаток устройства. Также с ними можно регулировать частоту запросов при веб-скрейпинге, чтобы распределять нагрузку между сессиями. Все это позволяет работать бережнее. Такая комбинация снижает риск автоматических блокировок со стороны платформ и дополнительных проверок в виде капч. Однако с юридической точки зрения работа с такими инструментами не освобождает от ответственности, если парсинг нарушает правила сайта или закон страны.

Реальные примеры судебных разбирательств по веб-скрейпингу 

LinkedIn против hiQ Labs (США, 2019–2022) 

Это дело — ключевой прецедент в США. Оно определило, что сбор публично доступных данных не нарушает CFAA. hiQ анализировала открытые профили LinkedIn, а соцсеть попыталась заблокировать скрейпинг, считая его несанкционированным доступом. Апелляционный суд девятого округа постановил: если данные публичные и не требуют авторизации, их сбор законен.

Решение установило стандарт: скрейпинг публичных страниц при обычном доступе (как у пользователя без логина) не считается нарушением. Однако суд отметил, что попытка получить доступ к закрытой части сайта уже квалифицируется как несанкционированная. 

Craigslist против 3Taps (США, 2013)

Федеральный суд Северного округа Калифорнии признал веб-скрейпинг нарушением CFAA из-за обхода технических ограничений. 3Taps собирала объявления с Craigslist и публиковала их у себя. Даже после официального запрета и блокировки IP-адресов компания продолжала парсинг страниц через прокси.

Суд постановил: после явного запрета и блокировки любой последующий доступ считается несанкционированным. Кейс показал, что скрейпинг сам по себе не всегда незаконен. Но обход технических мер защиты — серьезное нарушение.

Facebook* против Power Ventures (США, 2009)

Power Ventures парсила данные о друзьях и активности пользователей Facebook* без согласия соцсети. В том числе обходила авторизацию. Более того, Power Ventures проигнорировала уведомления с предупреждениями со стороны Facebook*. 

Суд признал это нарушением CFAA, а также законов о компьютерной безопасности. Даже при согласии пользователя на доступ к данным (которое они дали Facebook*) третья сторона не может обходить технические меры защиты платформы для массового сбора данных. Решение стало ключевым прецедентом для оценки легальности скрейпинга закрытых систем и соблюдения правил платформы. 

*Принадлежит компании Meta, признанной экстремистской организацией и запрещенной в России.

Ryanair против Booking.com (США, 2025)

Ryanair обвинила Booking.com в несанкционированном скрейпинге данных о рейсах и ценах, несмотря на прямые запреты и технические ограничения. Первоначально суд присяжных признал доступ несанкционированным. Но в 2025 году судья пересмотрел решение и отметил, что Ryanair не доказала реальный ущерб. Поэтому в ее случае нельзя применить закон CFAA.

В итоге стороны достигли соглашения. Booking.com может легально перепродавать билеты Ryanair, если будет соблюдать правила доступа и прозрачность цен. Дело показало, что обходить ограничения при скрейпинге не стоит. При этом доказательство ущерба и переговоры часто могут стать решающими.

Заключение

Веб-скрейпинг сам по себе не считается незаконным. При этичном использовании это мощный инструмент для сбора и анализа данных, а также улучшения бизнес-процессов. Однако безопасный парсинг требует внимательности. Чтобы процесс был менее рискован: 

  • используйте официальные API площадок, если они доступны;

  • соблюдайте лимиты и частоту запросов;

  • собирайте только те данные, которые вам нужны;

  • не обходите техническую защиту платформ;

  • не парсите персональные данные;

  • уважайте авторское право. 

Также перед началом работы обязательно изучите законы и требования конкретной страны, условия использования сайта и потенциальные риски. 

FAQ 

Веб-скрейпинг нелегален?

Нет, сам по себе веб-скрейпинг не запрещен. Но его законность зависит от того, какие данные вы собираете и как это делаете. Разрешено собирать общедоступную фактическую информацию. При этом, если парсер нарушает правила сайта, обрабатывает персональные данные без основания или затрагивает материалы, защищенные авторским правом, могут возникнуть проблемы. Также важно использовать открытые методы без обхода технической защиты.  

Законен ли веб-скрейпинг в США?

Легальность парсинга сайтов в США зависит от того, разрешен ли доступ к ним без нарушения CFAA. Публичные страницы можно анализировать. А вот обход логина, платных подписок, IP-блокировок и других барьеров могут стать нарушением. Громкий пример — судебное разбирательство между LinkedIn и hiQ Labs. Суд разрешил собирать данные из открытых профилей, но подчеркнул, что любые попытки проникнуть в закрытые разделы превращают скрейпинг в незаконное действие. 

Можно ли использовать веб-скрейпинг в коммерческих или исследовательских целях?

Да, и такие цели — одни из самых популярных. Тут есть несколько условий. Коммерческие проекты должны учитывать авторские права, правила площадки и не собирать персональные данные. Для исследовательских целей важно работать с публичной или обезличенной информацией, избегать доступа к защищенным блокам, а также трансформировать материал в анализ при публикации. Ключевое требование в обоих случаях — не нарушать технические ограничения и не извлекать данные, на которые у вас нет прав или законного основания.

Законен ли веб-скрейпинг

Простой пример: когда вы ищете товар и сравниваете цены на разных сайтах — по сути, вы занимаетесь ручным скрейпингом. Автоматизированный веб-скрейпинг выполняет ту же задачу быстрее. Он помогает собрать большие объемы данных по заданным критериям и распределить их в файлы для анализа. Таким образом можно скрейпить цены, условия доставки, ассортимент магазинов, контакты и многое другое.

Законно ли это? Да, если мы говорим о сборе публичной информации, аналогично ручному анализу цен на разных площадках. Правовые вопросы возникают, когда парсинг сайтов затрагивает:

  • материалы, защищенные авторским правом;

  • персональные данные (номера телефонов, электронную почту);

  • информацию, которая скрыта от незарегистрированных пользователей. 

Обход технических мер защиты сайтов — капч, логинов, блокировок от ботов — также может быть незаконным. 

Как законы о конфиденциальности влияют на веб-скрейпинг

Большинство стран не имеет прямого регулирования веб-скрейпинга. Однако многие нормы косвенно относятся к нему, если парсинг затрагивает материалы, защищенные авторским правом, или скрытый контент. Также рискованно нарушать условия использования сайтов, безопасность систем или собирать персональные данные.

Любые сведения, по которым можно идентифицировать конкретного человека, считаются персональными. Разные страны формируют собственный набор категорий, но большинство включает такие данные:

  • имя и фамилия;

  • адрес, телефон, электронная почта;

  • идентификационные номера документов;

  • IP-адрес и куки;

  • данные о местоположении;

  • финансовая информация.

Некоторые страны дополнительно выделяют категорию чувствительных данных. Как правило, это информация об этническом происхождении, религиозных и политических взглядах, сексульной жизни и ориентации, а также биометрические и медицинские данные. 

Важно: в этой статье мы рассматриваем потенциальные риски веб-скрейпинга с точки зрения законодательства разных стран. Перед началом парсинга рекомендуем внимательно изучить законы нужного вам региона и оценить возможные риски. Важно учитывать, что если действия выполняются из одной страны, они могут затрагивать пользователей или ресурсы в других регионах и подпадать под законы нескольких государств. Например, если пользователь из Европы собирает данные с американских сайтов, одновременно могут применяться нормы ЕС и США.

Какие законы косвенно касаются веб-скрейпинга в разных странах

США

  • CFAA (Computer Fraud and Abuse Act) — защита от несанкционированного доступа и обхода технических мер.

  • DMCA (Digital Millennium Copyright Act) — защита авторских прав в цифровой среде.

  • FTC Act (Federal Trade Commission Act, section 5) — запрет недобросовестных бизнес-практик.

  • State Data Breach Laws — законы отдельных штатов о персональных данных. 

  • First Amendment и Fair Use Doctrines — принципы добросовестного использования материалов.

  • ToS (Terms of Service) — условия использования сайтов. 

Евросоюз

  • GDPR (General Data Protection Regulation) — защита персональных данных.

  • Database Directive 96/9/EU — охрана баз данных.

  • Copyright Directive — единые стандарты авторских прав.

  • ePrivacy Directive — защита конфиденциальности и правила использования куки.

  • DSA (Digital Services Act) — правила безопасности и контроля контента на платформах.

  • P2B Regulation (Platform-to-Business Regulation) — прозрачные условия для бизнес-пользователей.

Великобритания 

  • UK GDPR (United Kingdom General Data Protection Regulation) — защита персональных данных.

  • DPA 2018 (Data Protection Act 2018) — также защита персональных данных.

  • CDPA (Copyright, Designs and Patents Act 1988) — авторские права на оригинальный контент.

  • Database Right — защита баз данных.

  • CMA (Computer Misuse Act 1990) — запрет на несанкционированный доступ к системам.

Россия 

  • 152‑ФЗ «О персональных данных» — защита персональных данных.

  • Гражданский кодекс РФ, часть IV — авторские права и базы данных.

  • 149-ФЗ «Об информации, информационных технологиях и защите информации» — доступ к информации и защита IT-систем.

  • 135-ФЗ «О защите конкуренции» — недобросовестная конкуренция.

  • Закон о защите прав потребителей — корректность коммерческих сервисов.

  • Закон о связи — защита инфраструктуры и сетей.

Как регулируется веб-скрейпинг в США

Веб-скрейпинг легален, если соблюдать правила доступа к данным, авторские права, честную конкуренцию, приватность и условия использования сайтов. Риски возникают, если скрейпер обходит технические ограничения или нарушает права третьих лиц.

Область

Нормативы

Можно

Нельзя

Примечание

Доступ к данным и защита систем

CFAA, ToS

  • Скрейпить публичные страницы.

  • Выполнять запросы без обхода логинов, капчи, платных подписок и IP-блокировок 

  • Обходить техническую защиту.

  • Взламывать базы данных.

  • Использовать чужие пароли, аккаунты, куки.

  • Нарушать правила сайта или использовать его уязвимости 


Персональные данные и приватность


CCPA, CPRA, локальные законы штатов

  • Собирать обезличенные данные, публичную информацию, отзывы 

  • Скрыто продавать информацию. 

  • Парсить электронные адреса, телефоны, поведенческие профили или геолокации, не уведомляя пользователя и не давая ему возможности отказаться 

Закон требует уведомлять пользователей об утечках. Также человек должен иметь возможность отказаться от сбора и обработки данных

Авторское право и использование контента


DMCA, Fair Use

  • Извлекать факты, цены, каталоги, статистические данные, описания товаров и результаты аналитики. 

  • Преобразовывать информацию в новый формат — например, диаграммы, инфографику. 

  • Ограниченно цитировать собранную информацию 

  • Публиковать чужие тексты, фотографии или обзоры без разрешения.

  • Обходить техническую защиту цифрового контента 


Честная бизнес-практика


Section 5 FTC Act

  • Использовать публичные данные для аналитики, товарных рейтингов или отзывов 


  • Искажать информацию. 

  • Маскировать автоматический доступ под действия реальных пользователей  

FTC может предъявить претензию, если компания скрыто обрабатывает или продает персданные, но заявляет обратное. Также компании обязаны открыто сообщать, какую информацию собирают, с какой целью и кому передают 

Как регулируется веб-скрейпинг в Евросоюзе

В Евросоюзе веб-скрейпинг разрешен. Риски возникают при обходе технических ограничений платформ, доступе к закрытым разделам, подделке куки, токенов или сессий. Также важно соблюдать частоту запросов и условия использования сайтов. Это регулируют GDPR, Database Directive, Copyright Directive, ePrivacy Directive, DSA и P2B Regulation.

Область

Нормативы

Можно

Нельзя

Примечание

Персональные данные и приватность

CDPR, ePrivacy Directive, DSA, P2B Regulation 

  • Собирать неперсональные данные — цены, характеристики товаров, рейтинги, количество отзывов. 

  • Обрабатывать публичные персональные данные, если доказан легитимный интерес 

  • Подменять куки и обходить куки-блокировки.

  • Получать доступ к данным на устройстве пользователя без его согласия. 

  • Собирать персональные данные — электронные адреса, имена, фотографии, профили в соцсетях и другую личную информацию. 

  • Извлекать информацию из закрытых профилей, премиум-зон. 

  • Игнорировать запреты платформ на автоматизированный сбор данных 

Легитимный интерес — обоснованный повод для работы с персональными данными. Если вы работаете с ними, важно соблюдать основные принципы GDPR — минимизировать сбор, обеспечивать прозрачность, иметь конкретную цель, уведомлять пользователя и удалять все по запросу 

Авторское право и использование контента

Copyright Directive

  • Извлекать факты и общие сведения без творческой составляющей — часы работы, цены, количество отзывов, характеристики товаров. 

  • Использовать небольшие фрагменты контента для анализа 

  • Копировать и публиковать тексты и изображения. 

  • Загружать чужие фотографии товаров или размещать статьи без существенной переработки 


Базы данных

Database Directive 96/9/EU

  • Собирать небольшие части или отдельные элементы баз данных 

  • Копировать существенную часть базы — как по объему, так и по значимости. 

  • Массово извлекать контент. 

  • Переопубликовывать контент. 

  • Создавать продукт, который полностью основан на чужой базе данных 


Технические ограничения доступа

Directive 2013/40/EU, Directive 2001/29/EU

  • Посещать публичные страницы через HTTP-запросы. 

  • Использовать официальный API. 

  • Соблюдать лимиты запросов. 

  • Парсить данные по правилам файла robots.txt 

  • Обходить техническую защиту платформы. 

  • Подделывать куки, токены, сессии, User-Agent. 

  • Эмулировать устройство. 

  • Обходить авторизацию. 

  • Получать доступ к премиум-данным и закрытым разделам. 

  • Перегружать сайт запросами 


Правила платформы и рыночные отношения

DSA, P2B Regulation, ToS

  • Собирать публичные данные через официальные API. 

  • Парсить с соблюдением частотных лимитов и технических требований к боту 

  • Избыточно нагружать сервис. 

  • Игнорировать запреты платформ на ботов. 

  • Обходить защиту сайта. 

  • Имитировать действия реального пользователя 


Как регулируется веб-скрейпинг в Великобритании 

В Великобритании нет норм, которые прямо регулируют веб-скрейпинг. Но его законность зависит от того, затрагивает ли он персональные данные, базы данных и материалы, защищенные авторским правом. Также при парсинге важно соблюдать правила сайтов и не обходить техническую защиту платформ.

UK GDPR — британская версия европейского GDPR, адаптированная после Brexit. 

Область

Нормативы

Можно

Нельзя

Примечание

Персональные данные

UK GDPR, Data Protection Act 2018 

  • Парсить неперсональные и обезличенные открытые данные — цены, характеристики товаров, расписания мероприятий 

  • Собирать электронные адреса, имена, фотографии, профили в соцсетях и другие персданные без согласия. 

  • Парсить публичные аккаунты для маркетинга, создания пользовательских портретов или распознавания лиц  

В Великобритании скрейпинг и обработка персональной информации должны иметь законное основание — например, согласие человека на это. За автоматизированный веб-скрейпинг персданных возможна уголовная ответственность

Авторское право

CDPA 1988

  • Собирать факты — цены, рейтинги, характеристики и ассортимент товаров, даты мероприятий или численные данные 

  • Копировать защищенные материалы в неизменном виде — тексты, фото, инфографику, программный код. 

  • Переопубликовать чужие материалы. 

  • Агрегировать статьи на своих площадках. 

  • Создавать каталоги, которые полностью основаны на стороннем контенте 


Базы данных

Database Right

  • Собирать фрагменты для личного использования, статистики, анализа и исследований. 

  • Использовать данные в некоммерческих целях. 

  • Собирать несущественные части базы данных 


  • Копировать существенную часть базы данных. 

  • Создавать конкурирующую базу данных на основе чужой. 

  • Обходить техническую защиту базы данных

Под несущественной частью базы данных понимают не более 30–50% — при условии, что в них не входят ключевые элементы каталога 

Технические меры защиты и доступ

Computer Misuse Act 1990

  • Скрейпить данные на общедоступных страницах 

  • Обходить техническую защиту. 

  • Подменять куки. 

  • Обходить авторизацию и IP-блокировки.  

  • Взламывать капчи. 

  • Маскировать бота под реального пользователя для доступа к закрытым системам 



Как регулируется веб-скрейпинг в России

В России нет закона, который регулирует веб-скрейпинг. Но ряд актов затрагивает парсинг персональных данных, баз данных, коммерческой информации, а также информационных систем либо материалов, защищенных авторским правом.

Область

Нормативы

Можно

Нельзя

Примечание

Персональные данные

152‑ФЗ «О персональных данных»

  • Собирать публичные неперсональные данные — цены, характеристики товаров, расписания событий, новости, статистику. 

  • Парсить обезличенную информацию в соцсетях — количество лайков и репостов, абстрактные никнеймы, ссылки на страницы без идентифицирующей информации 

  • Парсить персональную информацию — имя, телефон, геолокацию, электронный и адрес проживания, фото, ID профиля в соцсетях. 

  • Создавать базы контактов — например, пользователей Avito.

  • Собирать и объединять персданные из множества профилей без согласия. 

  • Передавать личные данные третьим лицам 

 


Любой сбор персональных данных должен иметь правовое основание — согласие субъекта. Либо соответствовать другой цели, предусмотренной законом. Например, чтобы спасти человека в экстренной ситуации, вы можете передать его медицинскую информацию без согласия 

Авторское право и базы данных

Гражданский кодекс РФ, часть IV

  • Парсить фактическую информацию — цены, технические характеристики. 

  • Использовать фактическую информацию для анализа, сбора статистики, исследований 

  • Массово копировать и публиковать чужие материалы — оригинальные тексты, описания, фотографии, статьи, изображения и программный код. 

  • Полностью парсить базы данных. 

  • Извлекать существенные части баз данных, даже если отдельная информация внутри не защищена 

Базы данных защищены как самостоятельные объекты 

Технические меры защиты

149-ФЗ «Об информации, информационных технологиях и защите информации»

  • Парсить общедоступные страницы и собирать расписания вебинаров или характеристики товаров 

  • Обходить техническую защиту. 

  • Автоматизировать доступ к закрытым системам или защищенным внутренним базам. 

  • Подделывать куки. 

  • Использовать чужие токены и пароли. 

  • Обходить авторизацию и капчи. 

  • Чрезмерно нагружать сайт, как при DDoS-атаках 


Недобросовестная конкуренция и защита потребителей 

135-ФЗ «О защите конкуренции», закон о защите прав потребителей

  • Работать с открытыми данными конкурентов для мониторинга рынка 


  • Создавать копии сервисов. 

  • Выдавать чужой контент за свой.

  • Показывать устаревшие или неверные данные — например, на сайтах-агрегаторах 


Инфраструктура и телекоммуникация

Закон о связи

  • Собирать общедоступные данные 



 

  • Запускать массовые запросы, похожие на DDoS-атаку 


Лучшие практики безопасного и этичного веб-скрейпинга

Используйте API, если они доступны

API — это официальный и безопасный способ получать данные с сайта, не нарушая его защиту и правила. С помощью API владелец ресурса сам определяет, какую информацию можно собирать, с какой частотой и в каком формате, поэтому риск нарушений минимален. Многие соцсети и сервисы предоставляют API для получения постов, комментариев, рейтингов или статистики. Найти его можно в разделе API, Developers, Documentation, Integrations или через поисковой запрос «Название сайта + API».

Соблюдайте правила сайта

Перед скрейпингом изучите Terms of Service (ToS). Там есть информация, можно ли автоматизированно собирать данные и как именно. Также проверьте файл robots.txt. Его можно открыть по запросу вида https://домен/robots.txt. Он показывает, какие разделы сайта могут посещать боты-скрейперы. 

Уважайте ресурсы платформы и работайте бережно. Ограничивайте частоту запросов — например, один в секунду. Добавляйте случайные задержки между запросами и реагируйте на коды ответов сервера 429 или 503. Если они появились — уменьшите интенсивность реквестов. Это помогает избежать технических нарушений и снизить вероятность блокировки.

Минимизируйте сбор данных

Собирайте только те данные, которые действительно нужны для вашей задачи. Это снижает риски, упрощает хранение и демонстрирует уважение к владельцам сайта и пользователям.

Для этого перед парсингом определите цель и список необходимых полей. Все, что не помогает выполнить задачу, собирать не стоит. Например, для анализа новостей достаточно заголовка, даты и категории. Автор или ссылки на его соцсети — лишние.

Также избегайте сбора персональных данных: имен, электронных адресов, геолокации, фотографий или отзывов с личной информацией. 

Документируйте собранные данные 

Фиксируйте источники данных и способы их обработки. Это помогает сохранить прозрачность и при необходимости подтвердить законность работы. Если вы собрали больше данных, чем нужно, удалите лишнее.

Трансформируйте данные, чтобы не нарушать авторские права 

Используйте собранные данные для создания нового результата — анализа, статистики, визуализации или собственного контента. Например, если бот собрал цены на MacBook Air из разных магазинов, корректно использовать это в виде графика динамики цен. А вот публиковать чужие описания товаров без изменений не стоит. Это может нарушать авторские права. 

Риски и последствия несоблюдения требований

Уголовные или регуляторные санкции (GDPR, CCPA)

GDPR (ЕС) предусматривает штрафы до 20 млн евро или 4% мирового годового оборота компании. CCPA (США) — до 7 500 долларов за каждое нарушение. Риски возникают даже при работе с публичными данными, если по ним можно идентифицировать человека или они неправомерно обрабатываются.

Регуляторы активно используют эти меры. В 2024 году совокупные штрафы по GDPR превысили 1,2 млрд евро. Среди самых заметных санкций последних лет:

  • Meta* — около 1,2 млрд евро за незаконную передачу данных из ЕС в США.

  • Amazon — 746 млн евро за нарушение принципов GDPR.

  • LinkedIn — 310 млн евро за обработку данных без достаточного правового основания.

  • TikTok — 530 млн евро за передачу данных в Китай и недостаточную прозрачность политики конфиденциальности.

Эти штрафы показывают, что нарушение правил обработки и передачи данных — потенциально дорогостоящий риск для специалистов по скрейпингу и бизнесов.

*Компания Meta признана экстремистской организацией и запрещена в России.

Операционные и бизнес-риски 

Кроме штрафов, доказанные нарушения при веб-скрейпинге влекут за собой серьезные бизнес-угрозы. Компании могут столкнуться с такими последствиями, как:

  • блокировка доступа к ресурсам по IP и запрет на использование данных;

  • судебные иски от конкурентов и пользователей с требованиями компенсаций за незаконное использование личных данных, контента или баз данных;

  • потеря партнерств и репутации, если выяснится, что данные получили или использовали неправомерно.

Нарушение правил ведет и к операционным издержкам. Бизнесу приходится: 

  • пересматривать архитектуру;

  • менять процессы хранения и обработки данных;

  • удалять незаконно собранные массивы информации;

  • внедрять комплаенс-процессы;

  • хранить логи и управлять согласиями пользователей. 

В отдельных случаях бизнесы полностью закрывали продукт после того, как обнаруживали нарушения в сборе ключевого источника данных. 

Иногда компании и специалисты, работающие с автоматизированным сбором данных, используют дополнительные инструменты — например, антидетект‑браузеры, включая Octo Browser. Они помогают точечно управлять сетевыми параметрами — подключать разные IP и подменять цифровой отпечаток устройства. Также с ними можно регулировать частоту запросов при веб-скрейпинге, чтобы распределять нагрузку между сессиями. Все это позволяет работать бережнее. Такая комбинация снижает риск автоматических блокировок со стороны платформ и дополнительных проверок в виде капч. Однако с юридической точки зрения работа с такими инструментами не освобождает от ответственности, если парсинг нарушает правила сайта или закон страны.

Реальные примеры судебных разбирательств по веб-скрейпингу 

LinkedIn против hiQ Labs (США, 2019–2022) 

Это дело — ключевой прецедент в США. Оно определило, что сбор публично доступных данных не нарушает CFAA. hiQ анализировала открытые профили LinkedIn, а соцсеть попыталась заблокировать скрейпинг, считая его несанкционированным доступом. Апелляционный суд девятого округа постановил: если данные публичные и не требуют авторизации, их сбор законен.

Решение установило стандарт: скрейпинг публичных страниц при обычном доступе (как у пользователя без логина) не считается нарушением. Однако суд отметил, что попытка получить доступ к закрытой части сайта уже квалифицируется как несанкционированная. 

Craigslist против 3Taps (США, 2013)

Федеральный суд Северного округа Калифорнии признал веб-скрейпинг нарушением CFAA из-за обхода технических ограничений. 3Taps собирала объявления с Craigslist и публиковала их у себя. Даже после официального запрета и блокировки IP-адресов компания продолжала парсинг страниц через прокси.

Суд постановил: после явного запрета и блокировки любой последующий доступ считается несанкционированным. Кейс показал, что скрейпинг сам по себе не всегда незаконен. Но обход технических мер защиты — серьезное нарушение.

Facebook* против Power Ventures (США, 2009)

Power Ventures парсила данные о друзьях и активности пользователей Facebook* без согласия соцсети. В том числе обходила авторизацию. Более того, Power Ventures проигнорировала уведомления с предупреждениями со стороны Facebook*. 

Суд признал это нарушением CFAA, а также законов о компьютерной безопасности. Даже при согласии пользователя на доступ к данным (которое они дали Facebook*) третья сторона не может обходить технические меры защиты платформы для массового сбора данных. Решение стало ключевым прецедентом для оценки легальности скрейпинга закрытых систем и соблюдения правил платформы. 

*Принадлежит компании Meta, признанной экстремистской организацией и запрещенной в России.

Ryanair против Booking.com (США, 2025)

Ryanair обвинила Booking.com в несанкционированном скрейпинге данных о рейсах и ценах, несмотря на прямые запреты и технические ограничения. Первоначально суд присяжных признал доступ несанкционированным. Но в 2025 году судья пересмотрел решение и отметил, что Ryanair не доказала реальный ущерб. Поэтому в ее случае нельзя применить закон CFAA.

В итоге стороны достигли соглашения. Booking.com может легально перепродавать билеты Ryanair, если будет соблюдать правила доступа и прозрачность цен. Дело показало, что обходить ограничения при скрейпинге не стоит. При этом доказательство ущерба и переговоры часто могут стать решающими.

Заключение

Веб-скрейпинг сам по себе не считается незаконным. При этичном использовании это мощный инструмент для сбора и анализа данных, а также улучшения бизнес-процессов. Однако безопасный парсинг требует внимательности. Чтобы процесс был менее рискован: 

  • используйте официальные API площадок, если они доступны;

  • соблюдайте лимиты и частоту запросов;

  • собирайте только те данные, которые вам нужны;

  • не обходите техническую защиту платформ;

  • не парсите персональные данные;

  • уважайте авторское право. 

Также перед началом работы обязательно изучите законы и требования конкретной страны, условия использования сайта и потенциальные риски. 

FAQ 

Веб-скрейпинг нелегален?

Нет, сам по себе веб-скрейпинг не запрещен. Но его законность зависит от того, какие данные вы собираете и как это делаете. Разрешено собирать общедоступную фактическую информацию. При этом, если парсер нарушает правила сайта, обрабатывает персональные данные без основания или затрагивает материалы, защищенные авторским правом, могут возникнуть проблемы. Также важно использовать открытые методы без обхода технической защиты.  

Законен ли веб-скрейпинг в США?

Легальность парсинга сайтов в США зависит от того, разрешен ли доступ к ним без нарушения CFAA. Публичные страницы можно анализировать. А вот обход логина, платных подписок, IP-блокировок и других барьеров могут стать нарушением. Громкий пример — судебное разбирательство между LinkedIn и hiQ Labs. Суд разрешил собирать данные из открытых профилей, но подчеркнул, что любые попытки проникнуть в закрытые разделы превращают скрейпинг в незаконное действие. 

Можно ли использовать веб-скрейпинг в коммерческих или исследовательских целях?

Да, и такие цели — одни из самых популярных. Тут есть несколько условий. Коммерческие проекты должны учитывать авторские права, правила площадки и не собирать персональные данные. Для исследовательских целей важно работать с публичной или обезличенной информацией, избегать доступа к защищенным блокам, а также трансформировать материал в анализ при публикации. Ключевое требование в обоих случаях — не нарушать технические ограничения и не извлекать данные, на которые у вас нет прав или законного основания.

Следите за последними новостями Octo Browser

Нажимая кнопку, вы соглашаетесь с нашей политикой конфиденциальности.

Следите за последними новостями Octo Browser

Нажимая кнопку, вы соглашаетесь с нашей политикой конфиденциальности.

Следите за последними новостями Octo Browser

Нажимая кнопку, вы соглашаетесь с нашей политикой конфиденциальности.

Присоединяйтесь к Octo Browser сейчас

Вы можете обращаться за помощью к нашим специалистам службы поддержки в чате в любое время.

Присоединяйтесь к Octo Browser сейчас

Вы можете обращаться за помощью к нашим специалистам службы поддержки в чате в любое время.

Присоединяйтесь к Octo Browser сейчас

Вы можете обращаться за помощью к нашим специалистам службы поддержки в чате в любое время.

©

2026

Octo Browser

©

2026

Octo Browser

©

2026

Octo Browser