В московском метро бесплатный Wi-Fi работает с 2013 года
На своем сайте "МаксимаТелеком" уверяет, что все данные "агрегированы, обезличены и зашифрованы. "Максима не знает точный возраст, ФИО, адрес, сексуальные предпочтения, расовую принадлежность, религиозные или какие-либо другие данные, которые считаются конфиденциальными", - говорится в политике обработки данных.
Но может ли мэрия при желании вычленить конкретного человека в том массиве данных, который поставляет "МаксимаТелеком"? Для этого важно понимать, в каком виде, согласно контракту, в систему персональных коммуникаций поступают номера телефонов.
В каком виде в систему поступает телефон?
Социально-демографическая информация от "МаксимаТелеком" может поставляться в систему персональных коммуникаций в привязке к номеру телефона. Такой вывод можно сделать из госконтракта от января 2018 года.
Однако речь идет не о самом номере в привычном нам десятизначном формате, а о его зашифрованных варианте - hash'е.
Hash-функция - это математическое преобразование информации, которое позволяет зашифровать ее. Именно в таком виде принято использовать телефонные номера на коммерческом рынке пользовательских данных - как из соображений безопасности, так и по юридическим причинам, говорит руководитель data-компании, сотрудничающей с "МаксимаТелеком".
Например, в 2017 году "МаксимаТелеком" была поставщиком данных для рекламной компании сети меховых салонов, следует из презентации рекламного агентства Dentsu Aegis Network. Внутри торговых точек были установлены специальные роутеры, которые фиксировали физические адреса (mac-адреса) смартфонов с включенной функцией поиска сети Wi-Fi.
Далее эти mac-адреса в хэшированном виде поступали в систему "МаксимаТелеком" для поиска совпадений по связке "mac - номер телефона". Так формировалась база клиентов для отправки рекламных эсэмэсок, но номера все время использовались в виде хэшей, подчеркивается в презентации.
Однако, согласно госконтракту, в системе персональных коммуникаций транспортного комплекса Москвы телефонные номера от "МаксимаТелеком" могут расшифровываться до своего первозданного вида.
В разделе, посвященном отправке сообщений о закрытии станций, указано: после сопоставления данных о подключениях к Wi-Fi и валидаций по проездным картам hash нужно расхэшировать "по маршрутам до телефона".
Такая возможность существует, если "хэши передаются без соли", то есть дополнительных мер защиты, рассказывает собственник крупной data-компании, сотрудничающей с мэрией ("соль" - международный криптографический термин).
Его коллега по этому рынку уверен: из контракта следует, что внутри системы телефоны действительно могут расшифровываться.
Оба были сильно удивлены, прочитав по просьбе Би-би-си документацию на сайте госзакупок.
"Нехорошо все это: отдавать данные в открытом виде, хэшировать телефоны с возможностью восстановления. Я вообще не понимаю, как это все оказалось в контракте!" - говорит один из них.
Как указано в документации госконтракта, после расхэширования должна сформироваться "витрина" из следующих данных: идентификатор пассажира - телефон - идентификатор станции начала маршрута - идентификатор станции окончания маршрута - популярный день поездки - количество поездок по маршруту.
В связке с телефоном в систему могут также поступать данные об использовании парковки и велопроката, где сотовый используется для идентификации клиента. Причем в их случае в государственном контракте отсутствует пометка hash, означающая, что номер передается в зашифрованном виде.
Таким образом, при наличии общего идентификатора в виде телефона у системы есть возможность привязать разрозненные поездки к конкретному пассажиру, отмечает руководитель data-компании, сотрудничающей с "МаксимаТелеком".
В документации также есть скрин из прототипа системы, в котором указаны десять телефонных номеров в привязке к поездкам в общественном транспорте в конце 2017 года.
Комментарии 3