Метаданные: почему «данные о данных» представляют угрозу для конфиденциальности

Когда большинство людей думают о конфиденциальности в интернете, они представляют себе защиту содержимого своих сообщений, писем или файлов. Однако существует ещё один пласт информации, которому зачастую не уделяют должного внимания: метаданные. И во многих отношениях они способны раскрыть о вас не меньше, чем само содержимое.

Что такое метаданные?

Метаданные — это, по сути, информация об информации. Они не показывают, что именно было передано, но фиксируют всё, что окружает эту передачу: кто, когда, где и каким образом.

Представьте себе письмо, отправленное по почте. Содержимое конверта остаётся личным, однако на самом конверте указаны обратный адрес отправителя, адрес получателя, дата почтового штемпеля и использованная марка. Это и есть метаданные. Любой, кто работает с конвертом, может узнать о вас немало ещё до того, как вскроет его.

В цифровом мире метаданные включают такие сведения, как:

  • временна́я метка электронного письма (когда оно было отправлено и получено);
  • IP-адреса отправителя и получателя;
  • размер файла или сообщения;
  • тип вашего устройства и операционная система;
  • посещённые вами сайты и время, проведённое на них;
  • частота и продолжительность ваших телефонных звонков.

Как метаданные работают на практике

Каждый раз, когда вы пользуетесь интернетом, ваше устройство автоматически генерирует и передаёт метаданные. Интернет-провайдер (ISP) фиксирует, к каким серверам вы подключаетесь и когда. Почтовые провайдеры записывают заголовки писем, содержащие информацию о маршрутизации. Сайты устанавливают файлы cookie и собирают данные браузера. Приложения отправляют статистику использования разработчикам.

Даже зашифрованные коммуникации порождают метаданные. Мессенджеры со сквозным шифрованием, например Signal, защищают содержимое сообщений, однако ваш оператор или сетевой провайдер всё равно может фиксировать сам факт контакта с определённым человеком, его частоту и время. Шифрование скрывает письмо внутри конверта — но не сам конверт.

Правительства и спецслужбы давно утверждают, что сбор метаданных менее invasive, чем чтение содержимого. Однако исследователи в области безопасности с этим не согласны. Исследования показали, что на основе одних лишь метаданных можно делать выводы о конфиденциальных сведениях — состоянии здоровья, политических взглядах, личных отношениях и даже распорядке дня.

Почему метаданные важны для пользователей VPN

VPN шифрует ваш интернет-трафик и скрывает ваш IP-адрес, устраняя тем самым значительную часть угроз, связанных с раскрытием метаданных. Когда вы подключаетесь к VPN, ваш ISP больше не видит, какие сайты вы посещаете и какими сервисами пользуетесь. Он видит лишь то, что вы подключены к VPN-серверу.

Тем не менее VPN не устраняет все метаданные. Важно понимать ряд ограничений:

Что VPN помогает скрыть:

  • историю браузера от вашего ISP;
  • ваш реальный IP-адрес от сайтов и сервисов;
  • DNS-запросы от записи в вашей сети.

От чего VPN не защищает в полной мере:

  • метаданные, собираемые сайтами и приложениями, которыми вы пользуетесь после подключения;
  • поведенческое отслеживание через файлы cookie и цифровой отпечаток браузера;
  • журналы метаданных, которые ведёт сам VPN-провайдер (если он регистрирует активность).

Последний пункт особенно важен. Если VPN-провайдер ведёт журналы подключений — временны́е метки, продолжительность сессий, использованный трафик, — это и есть метаданные о вашей активности. Подлинная политика no-log означает, что провайдер не должен сохранять даже этот пласт информации. Всегда проверяйте политику конфиденциальности провайдера и ищите независимые аудиты, подтверждающие его заявления.

Примеры из реальной жизни

Журналистика: репортёр, общающийся с информатором, может использовать шифрование, однако частые контакты в нестандартное время между конкретными устройствами способны раскрыть их взаимосвязь исключительно через метаданные.

Судебные дела: правоохранительные органы использовали метаданные телефонных звонков — не записи разговоров — для установления поведенческих закономерностей в ходе уголовных расследований.

Таргетированная реклама: рекламные сети формируют поведенческие профили на основе метаданных: времени просмотра, категорий посещаемых сайтов, времени, проведённого на страницах.

Корпоративная слежка: работодатели, осуществляющие мониторинг корпоративной сети, могут использовать метаданные для отслеживания продуктивности сотрудников — даже не читая личные сообщения.

Общая картина

Метаданные невидимы для большинства пользователей — именно это делает их столь мощным инструментом слежки. Для защиты недостаточно просто скрыть содержимое сообщений. Использование надёжного VPN с проверенной политикой no-log в сочетании с браузерами, ориентированными на конфиденциальность, и минимизация излишних разрешений для приложений — всё это элементы многоуровневого подхода к снижению степени раскрытия ваших метаданных.