День защиты персональных данных, Минск, 2019 год. Организатор: правозащитная организация Human Constanta.
Ведущий (далее – В): – Артур Хачуян занимается… Можно сказать «на тёмной стороне» в контексте нашей конференции?
Артур Хачуян (далее – АХ): – На стороне корпораций – да.
В: – Он собирает ваши данные, продаёт их корпорациям.
АХ: – На самом деле нет…
В: – И он как раз расскажет, как корпорации могут использовать ваши данные, что происходит с данными, когда они попадают в онлайн. Он не будет, наверное, рассказывать, что с этим делать. Мы подумаем дальше…
АХ: – Расскажу, расскажу. На самом деле долго рассказывать не буду, но на предыдущем мероприятии мне представили человека, которому «Фейсбук» даже аккаунт собаки заблокировал.
Всем привет! Меня зовут Артур. Я действительно занимаюсь обработкой и сбором данных. Конечно же, я не продаю никому никакие персональные данные в открытом доступе. Шучу. Моя сфера деятельности – это извлечение знаний из данных, находящихся в открытых источниках. Когда что-то юридически является не персональными данными, но из этого можно извлечь знания и сделать их такими же по значимости, как если бы эти данные были получены из персональных данных. Ничего на самом деле страшного рассказывать не буду. Здесь, правда, про Россию, но про Белоруссию у меня тоже есть цифры.
Каковы реальные масштабы?
Буквально позавчера я был в Москве в одной из руководящих, правящих партий (не буду говорить в какой), и мы обсуждали внедрение какого-то проекта. И значит, IT-директор этой партии встаёт и говорит: «Вот вы говорили, – числа и так далее, – знаете, мне 2-е управление ФСБ подготовило тут записку, где написано, что россиян в социальных сетях 24 миллиона человек. А вы говорите – 120 с чем-то. У нас вообще-то более тридцати [миллионов] интернетом не пользуются». Я говорю: «Да? Ну, окей».
Люди на самом деле не осознают масштаб. Это необязательно государственные органы, которые до конца, наверное, не понимают, как интернет работает, но и на самом деле моя мама, например. Она только сейчас начала понимать, что карточку в «Перекрёстке» ей дают не просто так, не за жалкие скидки, которые этот «Перекрёсток» предлагает, а за то, что потом её данные используют в ОФД, покупках, прогнозных моделях и так далее.
В общем, жителей вот столько, и о стольких есть информация в открытых источниках. О ком-то известна только фамилия, о ком-то известно всё, вплоть до порно, которое он лайкает (я всегда про это шучу, но это действительно так); и всевозможная информация: как часто люди путешествуют, с кем встречаются, какие покупки делают, с кем живут, как перемещаются – много всякой информации, которую могут использовать плохие, не очень плохие и хорошие ребята (я даже не знаю, какую шкалу сейчас придумать, но тем не менее).
Есть соцсети, которые, естественно, являются гигантским набором открытых данных, играя на слабости людей, которые вроде как кричат о приватности. А на самом деле так: если вы представите себе график за последние 5 лет – уровень истерии по поводу персональных данных растёт, но при этом количество закрытых аккаунтов в соцсетях снижается из года в год. Может быть, выводы из этого делать не совсем правильно, но: первое, что останавливает любую компанию, которая собирает данные – это тупо закрытый аккаунт в социальных сетях, потому что мнение человека внутри своего закрытого аккаунта, если у него не 100 тысяч подписчиков, оно на самом деле не очень интересно для какого-то анализа; но бывают и такие случаи.
Откуда берут информацию о нас?
Когда-нибудь к вам стучались ваши друзья старые школьные, с которыми вы давно не общались, а потом этот аккаунт исчезал? Есть такое среди плохих ребят, которые собирают телефоны: они анализируют друзей (а список друзей почти всегда открыт, даже если человек закрывает свой профиль, либо список друзей можно восстановить «в обратную сторону», собрав всех остальных пользователей), берут какого-нибудь неактивного вашего друга, делают копию его странички, стучатся к вам в друзья, вы его добавляете и через две секунды аккаунт удаляется; но при этом копия вашей странички осталась. Так, собственно, делали ребята недавно, когда 68 миллионов профилей из «Фейсбука» улетели куда-то – они примерно так же ко всем в друзья добавлялись, копировали эту информацию, даже кому-то писали в личные сообщения, что-то делали…
Соцсети – огромный источник информации, практически в 80 % случаев информация берётся о каком-то конкретном человеке не напрямую, а из ближайшего окружения – это всевозможные косвенные знания, признаки (у нас это называется «алгоритм «Злой бывшей»), потому что одна моя знакомая подтолкнула меня на эту абсолютно гениальную мысль. Она никогда не следила за своим парнем – она всегда следила за пятью его друзьями и всегда знала, где он находится. Это на самом деле повод целую научную статью написать.
Есть огромное количество ботов, которые делают тоже всякие хорошие и нехорошие вещи. Есть безобидные, которые тупо подписываются на вас, чтобы потом вам косметику рекламировать; а есть серьёзные сетки, которые пытаются мнение своё навязать, особенно перед выборами. Не знаю, как в Белоруссии, а вот в Москве перед муниципальными выборами у меня почему-то появилось огромное количество друзей каких-то непонятных, причём каждый за разного кандидата агитирует, то есть они абсолютно не анализируют контент, который я потребляю – они просто пытаются навязать какую-то непонятную реформу, с учётом того, что я в Москве вообще не прописан и голосовать не пойду.
Помойка – источник опасной информации
Плюс, есть «Тор», который не то чтобы недооценивают – все считают, что туда нужно зайти только, чтобы купить наркотики или узнать, как собирается Орудие. Но на самом деле там есть очень много источников данных. Они практически все незаконные (такие, околозаконные), потому что кто-то мог на каком-то хакерском сайте взломать базу авиаперевозчиков и выкинуть туда. Юридически вы эти данные использовать не можете, но если вы получите оттуда какое-то знание (как в американском суде), – например, запись аудиоразговора, сделанную без ордера, вы не можете использовать, но знания, которые вы из этой аудиозаписи получили, вы уже не забудете, – и здесь примерно то же самое.
Это на самом деле очень опасная штука, поэтому я всегда шучу, но это правда. Я заказываю еду всегда в соседний дом, потому что «Деливери Клаб» очень часто ломают, и у него реально есть такие проблемы. А недавно я очень удивился: заказывал продукты, и на коробке, которую относил на мусорку, был наклеен стикер, на котором написано – «Артур Хачуян», номер телефона, адрес квартиры, код от домофона и e-mail. Мы даже на самом деле пытались договориться с московским муниципалитетом, чтобы дали доступ на помойку: в общем, приехать на склад отходов и попробовать чисто ради интереса попробовать найти какое-нибудь упоминание данных персональных – сделать что-то вроде мини-исследования. Но нам отказали, когда узнали, что мы хотим с сотрудниками Роскомнадзора прийти.
Но это на самом деле так и есть. Вы смотрели офигенский фильм «Хакеры»? Они в мусоре ковырялись для того, чтобы какой-то участок вируса найти. Это тоже популярная штука – люди же когда выкинули что-то в открытые источники, они забыли об этом. Это может быть какой-то школьный сайт, на котором они писали диссертацию о превосходстве белой расы, а потом они пошли в Госдуму и забыли об этом. Такие случаи на самом деле были.
Что лайкают «единороссы»?
Если зайдёте в «топчик» на сайте «Лайфньюс»… Мне студенты два года назад делали исследование: они взяли всех участников праймериз «Единой России» (они все официально подали во ВЦИК свои аккаунты в соцсетях), посмотрели, что они вообще лайкают – порно детское, трэш, непонятные объявления от странных взрослых женщин… В общем, люди как бы забыли об этом.
Потом они написали письмо о том, что у двадцати человек аккаунты украли. Но аккаунты у них украли две недели назад, 8 месяцев назад они их в избирком подали, а лайки были два года назад… В общем, понимаете, да? Там есть реально огромное количество информации, которую даже в исследовательских целях можно всегда использовать.
Миниофтопчик: вчера новость увидел, что Роскомнадзор заблокировал исследования студентов «вышки» двухлетней давности. Может, кто-то видел эту новость, нет? Это мои студенты делали исследование: они из «Тора», с сайта «Гидра», где продаются наркотики (прошу прощения – с «Рампа»), собрали информацию, сколько, что, в каком регионе России стоит, и сделали исследование. Называлось оно «Потребительская корзина тусовщика». Это, конечно, смешная штука, но с точки зрения дата-анализа на самом деле дата-сет интересный – потом ещё года два по всяким «хакатонам» ходил. Это реальная штука – там много чего интересного есть.
Как Get Contact «купил души» любопытных юзеров и почему нужно читать пользовательское соглашение
Обычно, когда у человека спрашиваешь, какой утечки данных ты боишься (особенно, если у человека заклеена веб-камера), он всегда структуру приоритетов вот так ставит: хакеры, государство, корпорации.
Это, конечно, шутка. Но на самом деле активные дата-аналитики, всевозможные исследователи данных понаворовали гораздо больше, чем, мне кажется, страшные русские, американские или какие-нибудь другие хакеры (подставьте любое, в зависимости от ваших политических убеждений). В общем, обычно все боятся этого – у вас же у всех наверняка веб-камера заклеена? Можете даже руки не поднимать.
Но если хакеры делают что-то незаконное, а государству нужно разрешение судебное на получение данных, то последним ребятам [корпорациям] вообще ничего не нужно, потому что у них есть такая штука, как пользовательское соглашение, которое никто никогда в жизни не читает. И я очень надеюсь, что подобные мероприятия всё-таки заставят людей читать соглашения. Я не знаю, как в Белоруссии, но в Москве в середине того года волна приложения «ГетКонтакт» (вы, наверное, были в курсе), когда появилось непонятно откуда приложение, которое говорит: ты дай-ка приложению доступ ко всем своим контактам, а мы тебе покажем, как ты у кого был смешно записан.
В СМИ не всплыло, но мне очень много высокопоставленных сотрудников жаловалось, что им начали все звонить постоянно. Видимо, администраторы решили в этой базе телефон Шойгу найти, ещё кого-нибудь… Волочковой… Безобидная штука. Но те, кто читал лицензионное соглашение «ГетКонтакта» – там написано: спам в неограниченном количестве в неограниченное время, продажи ваших данных бесконтрольно третьим лицам, без ограничения прав, срока давности и вообще всего, чего только можно. И это на самом деле не такая супер-редкая история. Вот мне «Фейсбук», пока я там был, по 15 раз в день показывал уведомления: «А синхронизируй-ка контакты, а я тебе найду всех твоих друзей, которые у тебя есть!».
Корпорациям всё равно. ФЗ 152 и GDPR
Но на самом деле приоритеты – в обратную сторону, потому что корпорации защищает частное право и поэтому практически во всех случаях невозможно доказать, что она не права. А с учётом того, что она большая, страшная и очень дорогая, то это практически невозможно. А если вы ещё и в России, с устаревшим законодательством, то как-то всё совсем печально.
Знаете, чем отличается российский закон (а он практически белорусский) от, например, GDPR’а? Российский 152-й ФЗ защищает данные (это пережиток советского прошлого) – документ, который защищает данные от утечки куда-то. А GDPR защищает права пользователей – права на то, что они лишатся каких-то свобод, привилегий или ещё чего-то, потому что их данные куда-то утекут (они прямо в «дата-ли» ввели такое понятие). А у нас всё, что тебе могут вменить – штраф за то, что у тебя нет сертифицированного «опен»-«Экселя» для обработки персональных данных. Надеюсь, что это когда-нибудь поменяется, но, думаю, что не в ближайшее время.
Каковые реальные возможности таргетинга сегодня?
Первая, наверное, страшная история, про которую все постоянно думали – это чтение личных сообщений. Наверняка среди вас есть человек, который когда-нибудь что-нибудь вслух говорил, а потом получал таргетированную рекламу. Да, были такие? Руки поднимите.
Я на самом деле не верю в историю того, что условный «Яндекс Навигатор» распознаёт прям аудио в потоке для всех пользователей, потому что те, кто немного сталкивались с распознаванием голоса, они понимают, что: во-первых, дата-центр «Яндекса» в пять раз больше должен быть; но самое главное, стоимость привлечения такого человека стоила бы огромные деньги (чтобы в потоке распознавать аудио и понимать, о чём человек говорит). Но! Реально есть алгоритмы, которые тегируют вас по определённым ключевым словам, для того чтобы потом делать какую-то рекламную коммуникацию.
Таких исследований проводили массу, и я 100 раз делал чистые аккаунты, что-то кому-то писал в сообщениях, а потом внезапно получал рекламу, казалось бы, никак не связанную с этим. Вывода здесь на самом деле два. Против такой истории – считается, что человек просто попадает в какую-то статистическую выборку; скажем, вы – мужчина 25 лет, который именно в этот момент должен был столкнуться с курсами английского языка как раз в тот момент, когда вы кому-то написали. По крайней мере, «Фейсбук» всегда так в суде говорит: что есть некая модель поведения, которую мы вам не покажем, которая была построена на данных, которые мы вам не покажем, у нас есть внутренние исследования, которые мы вам точно не покажем (потому что всё коммерческая тайна); в общем, вы попали в некую статистическую выборку, поэтому мы вам это показали.
Как «Фейсбук» приватность пользователей взбесила
К сожалению, это вообще невозможно доказать, если у вас нет человека внутри компании, который как-то подтвердит эти действия. Но в американском праве в таком случае соглашение о неразглашении этого сотрудника стоит выше, нежели его желание вам помочь, поэтому никто этого не сделает. Ещё интересно – было где-то год или полтора назад – начал развиваться тренд в Америке, когда люди ставили расширение для браузера для того, чтобы оно шифровало сообщения «Фейсбука»: пишешь что-нибудь человеку, он ключом на устройство его шифрует и отправляет белиберду в открытый доступ.
Вот «Фейсбук» в течение полутора лет судился с этой компанией и таки непонятно на каких основаниях (потому что я плохо разбираюсь в американском праве) заставил их удалить это приложение и потом сделал поправку в пользовательском соглашении: если вы посмотрите, там есть такой пункт, что вам нельзя передавать в зашифрованном виде сообщения – там как-то это так хитро описано, что нельзя использовать криптографические алгоритмы для того, чтобы видоизменять сообщения – ну, есть такое. То есть они сказали: либо ты пользуешься нашей платформой, пишешь в открытом доступе, либо не пишешь. И отсюда возникает вопрос: а нафига им вообще нужны личные сообщения?
Личные сообщения – источник стопроцентно достоверной информации
Здесь очень простая штука. Все, кто занимается анализом цифрового следа, активности человека, пытаются использовать как-то эти данные для маркетинга или ещё чего-то, – у них есть такая метрика, как достоверность. То есть некий образ человека – вы понимаете прекрасно, это не сам человек – этот образ всегда чуть успешнее, чуть лучше. Личные сообщения – это реальные знания, которые можно получить о человеке, они практически всегда на 100% достоверны. Ну потому что редко кто-то будет в личных сообщениях что-то кому-то писать, обманывать, и это всё проверяется очень легко – соответственно, по другим сообщениям (вы поняли, о чём я говорю). Суть в том, что знания, извлечённые подобным образом, они почти на 100% достоверны, поэтому все всегда пытаются их заполучить.
Но тем не менее это всё, опять же, очень сложно доказуемая история. А те, кто верят в то, что у условного «Вконтакте» есть такой доступ у правоохранительных органов для личных сообщений – это не совсем правда. Если вы просто посмотрите историю судебных запросов на раскрытие информации – как «Вконтакте» очень хитро (в данном случае Mail.ru) отбивается от этих запросов.
У них главный всегда аргумент: по закону правоохранительные органы должны аргументировать, почему именно нужен доступ к личным сообщениям. Как правило, если это убийство, всегда следователь говорит, что скорее всего человек сказал, где он спрятал Орудие (в личных сообщениях). Но мы-то с вами понимаем, что ни один здравомыслящий преступник никогда в жизни во «Вконтакте» своим подельникам не напишет о том, где он спрятал огнестрельное Орудие. Но это один из распространённых вариантов, чем отчитываются чиновники.
А вот ещё один такой страшный пример (меня просили сегодня страшные примеры приводить) – про Россию (надеюсь, в Белоруссии такого не будет): по закону следователю необходимо иметь достаточно веские основания для оператора, чтобы раскрыть эту информацию. Естественно, нигде эти достоверные параметры не описаны (какие, в каком виде они должны быть), но в России существует сейчас всё большее количество прецедентов, когда для суда такое основание появляется, если есть некая модель, которая спрогнозировала определённое, хорошее или плохое, поведение.
То есть у нас никого не могут посадить (и это хорошо) за то, что вы попали в некую статистическую выборку чистокровных убийц – и это хорошо, потому что нарушает презумпцию невиновности; но есть прецеденты, когда результаты подобных прогнозов использовались для получения судебного разрешения на получение данных. Не только в России, кстати. В Америке тоже такая штука есть. Там «Палантир» всех уже давно тоже скорил, подобные штуки используют. Страшная история.
Это у меня исследование. Мы проводили такое: по Питеру гуляли, в местах зелёных точек мы писали какие-то ключевые моменты друзьям с «чистых» аккаунтов – типа «хочу-ка я выпить кофе», «а где купить стиральный порошок?» и так далее. А потом, соответственно, получали гео-привязанную рекламу. Каким магическим образом… Или как там говорили: «Совпадение? Не думаю!» Это личные сообщения «Вконтакте». Да простит меня Mail.ru, но это так. Любой желающий может подобный эксперимент повторить.
Кстати, на это, когда писали заявление в поддержку, Mail сказал, что там стояли wi-fi-точки, который ваш мак-адрес захватили. Такое тоже есть.
Способы получения и распространённые варианты «слива» личных данных
Следующая история – это извлечение дополнительных знаний, кусочка которого я на самом деле коснулся. На самом деле заполненный профиль человека в соцсетях реально несёт в себе 15–20% реальных знаний, которые оператор данных хранит о нём. Вся остальная история получается из очень интересных вещей. Почему, думаете, «Гугл» развивает очень сильно библиотеки для компьютерного зрения? В частности, они были одними из первых, кто развивал библиотеки собственно для анализа и категоризации объектов – на заднем фоне, на переднем плане, не важно где. Потому что это огромный источник дополнительной информации о том, какая у человека квартира, машина, где он живёт, предметы роскоши…
Была куча «хакерских» вбросов, когда сливались обученные нейросетки «Гугла» (не знаю, чьи они были, но тем не менее). Там было много интересного на тему размера груди, объёма талии – что только люди не пытались узнать о людях других на основании анализа фотографий. Потому что, когда человек фотку делает, он же не всегда думает о том, сколько всего интересного можно с неё узнать? А сколько уж в России выкладывают паспортов новорождённых?.. Или: «Ура, мой ребёночек получил визу»! Это вообще боль современного общества.
Такой ещё офтоп (я сегодня буду делиться с вами фактами): в Москве самый частый слив персональных данных – это ЖКХ, когда на дверь вешают список должников, а эти должники потом подают в суд, потому что их персональные данные в открытый доступ попали без их разрешения. Вдруг с вами такое случится… Суть в том, что человек, когда делает что-то, он же не знает, что было на той фотографии, чего не было. Номеров автомобилей сейчас много.
Мы как-то проводили исследование – пытались понять, какое количество людей с открытыми фотками машин (у них есть, соответственно, правонарушения и так далее) – это, к сожалению, можно было только по слитым базам ГИБДД сделать, где есть только номер (не очень достоверная информация), но тоже было интересно.
Ваша следующая реклама зависит от того, как вы «потребили» предыдущую
Это первая история. Вторая история – это модели поведения, контент, который потребляет человек, потому что одна из самых главных метрик, которую соцсети пытаются о вас построить – это то, как вы взаимодействуете с рекламой. Какими бы точными, «офигенскими» алгоритмы ни были, как бы замечательно ни работали искусственные интеллекты и всё прочее, но реальный приоритет социальной сети всегда – это зарабатывать деньги. Поэтому, если придёт условная «Кока-Кола» и скажет – «Хочу, чтобы мой пост увидели все жители Белоруссии» – они его увидят, вне зависимости от того, что об этом человеке думают алгоритмы, как его там таргетировать. Вы же наверняка получали рекламу, помимо супер-супертаргетированной, чушь совершенно никак не связанную. Потому что за эту чушь несвязанную очень много денег заплатили.
Но одна из главных метрик – это понять, с каким контентом вы взаимодействуете лучше всего, именно – как на него реагируете, для того чтобы вам показывать подобную рекламную историю. И соответственно, это метрика того, как вы взаимодействуете с рекламой: кто её банит, кто – нет, как человек кликает, читает ли он только заголовки или полностью проваливается в материал; а потом на основании этого продолжать вас удерживать в этом, как это сейчас называется, «пузыре фильтров», для того чтобы вы продолжали взаимодействовать с этим контентом.
Если вдруг вам когда-нибудь будет интересно, вы попробуйте долгое время, в течение недели, может быть месяца, просто всю подряд рекламу банить из соцсетей: вам показывают какое-то объявление – вы его закрываете. Если это анализировать и наложить на график, будет интересная история: если вы неделю будете банить рекламу, следующую неделю она будет показывать вам в усиленном варианте и вообще из разных категорий; то есть, условно, вы любите собак, и вам показывается реклама с собаками – вы всех собак забанили, и дальше они вам начнут показывать всевозможную разностороннюю чушь из разных вариантов, для того чтобы попытаться понять, что вам нужно.
А потом, в конце концов, плюнут, пометят вас как человека, который с рекламой не взаимодействует, поставят на вас условный крестик и в этот момент вам начнут показывать рекламу исключительно богатых брендов. То есть в этот момент вы будете видеть рекламу только «Кока-Колы», «Кит-Кита», «Юнилевера» и всех людей, которые «башляют» огромное бабло, потому что нужно накручивать просмотры. В течение месяца проведите эксперимент: одну-две недели баните всю рекламу, потом видите всё подряд, и баните её, – в конце концов, будете видеть только рекламу, как потом оказывается (и говорят рекламные агентства), только клиентов, которые платят за просмотры, потому что невозможно понять, как вы с этой рекламой взаимодействуете.
Порно чаще смотрят те, кто склонен глубоко погружаться в контент
Соответственно, здесь история про всевозможное отслеживание поведения. У меня примерчик такой интересный – посетители одного государственного веб-сайта. Самое смешное, что чем больше глубина просмотра у людей, тем больше из этих людей предпочитает просмотр порно традиционным отношениям. «Сори», что я всё время про эту тему говорю, но у меня на самом деле очень хорошие отношения с «Порнохабом», и это всегда очень интересные исследования, потому что это тема, которая вроде запретная, но она очень много о человеке рассказывает. И вытекающие отсюда следующие пункты про отдачу трафика… Мы ещё про «Порнохаб» вспомним!
Что считается персональными данными и можно ли разблокировать «Айфон» 3D-моделью лица?
Моё любимое – это обход закона о персональных данных. Если почитать техническую документацию того же «Фейсбука», который предоставлял какие-то внутренние документы (например, в суд), вы там не найдёте упоминания ни о распознавании лиц, ни об анализе голоса. Там будут очень сложные формулировки, которые ни один квалифицированный юрист не найдёт внутри законодательства. У нас в России примерно так же работает – я вам такую сейчас штуку покажу.
Вот вы здесь что видите? Любой нормальный человек скажет, что лицо. Это, кстати, Саша Грей, по-моему. А юридически это – матрица неких трёхмерных точек, которых здесь 300 тысяч штук. Хорошо это или плохо, но по закону это не считается персональными данными. Вообще, РКН российский не считает одну фотографию персональными данными – он считает персональными данными, если рядом есть ещё что-то (например, ФИО или номер телефона), а сама по себе фотография эта – вообще ничто. Как только ввели закон о биометрии, и биометрические данные приравняли к персональным (так, очень грубо), все сразу начали говорить: это не биометрические данные, это массив точек! Особенно, если от этого массива точек взять прямое или обратное преобразование Фурье, вроде как деанонимизировать человека назад вы из этого преобразования не можете, но идентифицировать его вы можете. Чисто теоретически закон эта штука не нарушает.
Ещё я делал другое исследование: это алгоритм, который строит трёхмерную реконструкцию лица по открытым источникам – берём аккаунт в «Инстаграме» и можно потом личико на 3D-принтере распечатать. Кому, кстати, интересно, у меня есть ссылка в открытом доступе; если вдруг кто-то захочет чей-то «Айфон» разблокировать… Шутка – «Айфон» нельзя разблокировать, там качество снижено.
Закрытый профиль – это плюс для безопасности
Это первая штука, а вторая… Я касался уже того, что информацию в основном получают из окружения пользователя. Эту картинку в 17-м году я рисовал: среднестатистический пользователь российских социальных сетей – он внутри, у него в среднем 200–300 друзей, его друзья друзей и его друзья друзей друзей.
Спасибо социальным сетям за то, что ввели алгоритмы «умных» e-лент, интегральных лент якобы для увеличения вероятности вашего столкновения с каким-то интересным контентом. Вот это количество людей может в любой случайный момент увидеть контент, который вы производите, даже если аккаунт у вас ограничен только верхними уровнями приватности (только для друзей друзей и так далее). Вот это – друзья друзей:
Если кто-то думает, что когда он в ВК выбирает в «Моих постах» видеть «друзья друзей», то три рукопожатия – это примерно 800 тысяч человек, что в принципе не так мало, но зависит от вашего контента. Может быть, вы какие-то стримы неприличные ведёте, и все эти друзья друзей могут с этим контентом провзаимодействовать. Кто-нибудь из них может куда-то что-то перепостить, у всех людей есть лента лайков, которую на самом деле скорее всего отменят, потому что это не очень лицеприятная штука. Поэтому в любой момент контент может куда-то попасть.
ВК в том году запустили ещё суперзакрытые профили, но ими пока воспользовалось ещё очень малое количество людей (не буду говорить какое, но малое!). Возможно, когда-то люди додумаются до этого – я на самом деле искренне на это надеюсь. Все исследования постоянно направлены на то, чтобы дать людям понять масштаб проблем. Потому что, пока кого-то конкретно не коснутся какие-то страшные вещи, они никогда об этом не подумают. Идём дальше.
В госорганах не знают, что такое персональные данные и не спешат давать определение
Любой специалист по праву в области персональных данных всегда говорит следующее: никогда не нужно объединять различные источники данных, потому что тут у вас лежат e-mail’ы (это одни персональные данные с какими-нибудь обезличенными идентификаторами), тут – ФИО… Если это всё объединить, вроде как они станут персональными данными. Вообще, было бы правильно сначала коснуться этой темы, но я думаю, что вы уже погружены в неё и в курсе, может, как закон работает.
На самом деле никто не знает, что такое персональные данные. Важная концепция! Когда я прихожу в государственные органы, говорю: «Бутылку коньяка тому, кто скажет, что такое персональные данные». И никто сказать не может. Почему? Не потому, что они глупые, а потому, что никто не хочет брать ответственность на себя. Потому что, если Роскомнадзор скажет, что вот это персональные данные, завтра кто-то что-то сделает, а они будут виноваты; а они – органы исполнительной власти и вообще не должны ни за что отвечать.
Суть в том, что в законе чётко прописано, что персональные данные – это те данные, по которым можно идентифицировать человека. И там дан пример: ФИО, адрес домашний, номер телефона. Но мы-то с вами знаем, что идентифицировать человека можно и по тому, как он на кнопки нажимает, и по тому, как он взаимодействует с интерфейсом, и по другим косвенным параметрам. Если кому-то интересно: практически в каждой сфере есть огромное количество лазеек.
Идентификаторы, которые нас раскрывают
Вот, например, начали все ставить точки для захвата мак-адресов (сталкивались наверняка?) – умные (или не знаю, жадные) производители мобильного оборудования, типа Apple и Google, быстро ввели алгоритмы, которые выдают случайный мак-адрес, чтобы вас нельзя было идентифицировать, когда вы по городу идёте и всем отправляете свой мак-адрес. Но умные ребята ещё дальше додумались до следующей истории.
Например, вы можете получить лицензию мобильного оператора; получив лицензию мобильного оператора, вы получите доступ к такой штуке – называется протокол SS7, по которому вы будете видеть некий эфир мобильных операторов; там есть куча всевозможных идентификаторов, которые не являются персональными данными. До этого это было IMEI, а сейчас – прям буквально кто-то снял с языка и решил вести в России (инициатива такая) единую базу этих «имэев». Она вроде как есть, но тем не менее.
Есть ещё, например, куча идентификаторов – например, IMSI (идентификатор мобильного оборудования), который не является ни персональными данными, ни привязан к каким-то другим вещам и, соответственно, его можно сохранить без какого-либо законодательного преследования, а потом с кем-нибудь обменяться этими идентификаторами, чтобы с человеком потом прокоммуницировать.
Культура работы с персональными данными находится на низком уровне
В общем, суть в том, что все сейчас очень сильно озабочены объединением данных одного с другим, и большинство компаний, которые делают это объединение, иногда даже не задумываются об этом. Например, банк пришёл, заключил соглашение о неразглашении с компанией, которая делает скоринг, свалил ей 100 тысяч своих клиентов…
И не всегда у этого банка в соглашении есть пункт о передаче данных третьим лицам. Эти клиенты что-то там отскорили, и непонятно, куда потом эта база пошла, не пошла – в большинстве компаний в России нет культуры удаления данных… – обязательно этот «эксель» где-нибудь у секретаря потом на компьютере и повиснет.
Наши данные могут продаваться с каждой покупкой в магазине
Есть очень много схем, которые вроде как околозаконны (то есть законны). Например, история следующая: из 15 крупнейших российских банков только два являются собственно смс-шлюзом – «Тинькофф» и «Альфа», то есть они сами шлют свои смс-ки. Остальные банки используют смс-шлюзы для отправки смс-ок конечным клиентам. Эти смс-шлюзы почти всегда имеют право анализировать контент (типа, на предмет безопасности и каких-то своих выводов) для того, чтобы потом продавать агрегированную статистику. Эти смс-шлюзы «дружат» с операторами фискальных данных, которые оперируют чеки.
И получается следующее: вы пришли на кассу, оператор фискальных данных (дали, не дали свой номер телефона – каким-то образом там привязан)… вам на номер телефона приходит смс-ка, шлюз этих смс-ок видит последние 4 цифры карты и номер телефона. Мы знаем, в какой момент вы совершили транзакцию от оператора фискальных данных, а в смс-ках мы знаем (теперь уже), на какой номер пришла информация о списании такой-то денежной суммы с такими-то четырьмя последними цифрами карты. Четыре последние цифры карты идентификаторами вас не являются, не нарушают закон, потому что по ним нельзя вас деанонимизировать, сумма транзакции – тоже нет.
Но если вы договорились с оператором фискальных данных – вы знаете, в какое временное окно (плюс-минус 5 минут) вам эта смс-ка должна прийти. Таким образом, вас быстренько в ОФД привязали к вашему номеру телефона, а ваш номер телефона привязан к рекламным идентификаторам, вообще ко всему-всему-всему. Поэтому вас можно потом догнать: пришли в магазин, а вам потом ещё какую-то чушь присылают без разрешения. Я думаю, в этом зале вряд ли есть хоть кто-то, кто хоть раз писал заявление в ФАС на спам. Вряд ли есть… Кроме меня, наверное.
Бумажки – архаичный, но эффективный способ борьбы за свои права
Это очень круто работает. Правда, придётся полтора года подождать, но ФАС реально проведёт проверку: кто, как, кому передал данные, почему куда и так далее.
Вопрос из зала (далее – З): – В Белоруссии нет ФАСа. Это другая страна.
АХ: – Да, я понимаю. Аналог же наверняка есть какой-то…
Из зала поступают возражения
АХ: – Хорошо, плохой пример, «сори». Не суть важно. Среди моих друзей я никого не знаю, кто вообще в принципе о существовании подобной истории знает – что можно пойти написать, и они потом год ещё будут работать.
Вторая история, которая в России тоже очень развивается, но я думаю, что вы аналог у себя найдёте. Я очень люблю так делать, когда госорган с тобой плохо общается, какой-то банк или ещё что-то – ты говоришь: «Дайте бумажку». И пишешь на бумажке: «Согласно пункту 14 152-го ФЗ прошу вести обработку персональных данных в бумажном виде». Я не знаю, как точно это в Белоруссии делается, но наверняка это делается. По российским законам вам не имеют права отказать на основании этого в услуге.
Я даже знаю много людей, которые в Mail.ru подобное отсылали и просили вести учёт их персональных данных в бумажном виде. Mail.ru очень долго отбивался от этого. Я даже знаю одного разработчика «Яндекса», над которым пошутили: они удалили его аккаунт в ВК и прислали ему пачку распечатанных скриншотов, и сказали, что они будут присылать ему скриншоты каждый раз, когда он захочет обновить свою страницу.
Смешно, но тем не менее это реальная альтернатива, если кто-то реально переживает за данные, с одной стороны… А с другой стороны, тот же РКН мне говорил, что это соглашение об обработке персональных данных – оно формальное, и закон предусматривает ещё несколько вариантов дать это согласие. И что, например, меня пригласили сюда на мероприятие, и если, например, Human Constanta может не заключать в рамках российских законов со мной соглашение об обработке персональных данных (потому что сам факт того, что я приехал и согласился выступить, и является согласием на обработку персональных данных), – все всё равно берут эти бумажные разрешения. Но вот РКН подобную штуку мне говорил, что как бы это вообще не факт, что скорее всего они когда-то отпадут.
Я надеюсь, что в России никогда не создадут единого оператора, прости Господи, персональных данных, потому что хуже того, чем сложить все персональные данные в одну корзину, может быть только сложить их в государственную корзину. Потому что фиг знает, что потом получится с этим всем.
Компании обмениваются персональными данными, и законы слабо регулируют это
Большинство компаний между собой обмениваются какими-то данными, идентификаторами. Это может быть магазин с банком, а потом – банк с соцсетью, соцсеть – ещё с чем-то… И в конце концов, у этих людей появляется некая критическая масса знаний, которые можно каким-то образом использовать, и все эти знания, правда, сейчас пытаются сохранить на своей стороне. Но тем не менее потом это всё равно попадает в какой-нибудь рекламный трафик или ещё куда-то.
Передача данных третьим лицам – это самое весёлое, что может быть, потому что в законах не описано, что это за третьи лица, кому они вообще «третьими» должны считаться. Это, кстати, очень распространённая фраза американских адвокатов – у них это там Third parties – кто, кого вы считаете третьими лицами: бабушку, прабабушку?.. Даже был в Америке такой прецедент, когда чьи-то данные раскрыты были, человек подал в суд, и они доказали, что этот человек через несколько друзей знаком с владельцем данных – какое-то количество рукопожатий, привели какие-то странные социологические исследования – таким образом доказали, что эти люди не могут считаться третьими лицами друг другу. Смешно. Но факт передачи таких данных очень распространён.
Даже если вы заходите на сайт, где стоит счётчик для идентификации – этот счётчик имеет право передавать данные этого трафика куда-нибудь («Кликстриму», владельцам рекламных платформ чего угодно, «Порнохабу», например). «Порнохаб», если кто-то из вас веб-разработчик, – вы зайдите посмотрите, какое количество пикселей отслеживания стоит на сайте «Порнохаба». Просто заходишь – там огромное количество java-скрипта загружается, типа для улучшения работы сайта. На самом деле там и кроссдоменные «куки» ставятся, чего там только нету, потому что эта информация всегда высоко ценится на рынке «кликстрима».
«Фейсбук» виляет и маску срывать не собирается
Естественно, никто из крупных игроков никогда никому не рассказывает, кому и как он продаёт данные. Из-за этого, например, Европа сейчас пытается судиться с «Фейсбуком». Как раз-таки после введения GDPR Европейский союз пытается с «Фейсбука» стрясти собственное раскрытие алгоритмов перепродажи данных третьим лицам.
«Фейсбук» этого не делает и заявляет во всеуслышание, что он этого не делает, потому что они – «корпорация мира» (это я цитирую из письма, которое они мне прислали), они «против зловредного применения технологий» (особенно, если вы распознавание лиц Кремлю продаёте). В общем, суть в том, что «Фейсбук» делает это не совсем честно: главная его цель и главное, что произойдёт, как только такой механизм раскроется – можно будет реально подсчитать маржинальность рекламы, можно будет понять реальную стоимость рекламных объявлений.
Условно, если вам «Фейсбук» сейчас говорит, что стоимость рекламного показа – 5 рублей, и мы вам продаём его за 3 (и, типа, два рубля нам остаётся), и они, условно, 5% прибыли получают с этих рекламных показов. На самом деле это не 5%, а 505, потому что, если этот алгоритм всплывёт наружу (кому и как «Фейсбук» сколько раз передал «кликстрим», данные о посещениях, данные пикселя всевозможным рекламным сетям), окажется, что они денег зарабатывают гораздо больше, чем говорят об этом. И дело здесь не в самих деньгах, а в том, что стоимость клика не рубль, а на самом деле – сотые копеек.
В общем, суть в том, что все пытаются сокрыть подобную передачу, неважно – рекламного, нерекламного трафика, но она есть. К сожалению, нельзя никак юридически узнать это, потому что компании – частные, и всё, что у них внутри – это их частное право и их коммерческая тайна. Но подобные истории там очень часто всплывали.
Наркобарыги предсказуемы и «палятся» на «Авито»
Последняя картинка из этой презентации. Она смешная, и суть её в том, что есть некие категории людей, которые очень сильно переживают за свои персональные данные. И это хорошо, на самом деле! Этот пример – про такую категорию людей как наркобарыги. Казалось бы, люди, которые должны очень сильно переживать за свои персональные данные…
Это – исследование, которые проводилось в начале того года под надзором компетентных органов. Да, это скрипт, которому дали денег, чтобы он купил в «Телеграме», в «Торе» наркотики, но только у тех людей, которых можно было идентифицировать.
На самом деле почти все наркобарыги московские горят на том, что их номер телефона, вообще ни в каких открытых источниках, но рано или поздно на «Авито» они что-нибудь продадут, по чему можно будет понять примерное местоположение этих людей. Суть в том, что красные точки – это где люди живут, а зелёные – это куда они ездят оставлять сами знаете что. Это была одна из частей алгоритма, который прогнозировал расстановку патрульно-постовых служб, но эти московские ребята всегда стараются как-то по диагонали поехать, подальше.
Они считают, что если они сверху слева живут, то они должны сверху справа поехать и там их точно никогда не найдут. Это я вам говорю к тому, что, если вы пытаетесь скрыться от вездесущих алгоритмов, реальный самый крутой вариант – это менять модель поведения: установить какой-то там «Гостери» для рандомизации посещений, владений и так далее. Да господи, есть даже алгоритмы, плагины, которые размеры браузера на пару пикселей меняют, чтобы нельзя было подпись, «фингерпринт» браузера посчитать и как-то вас идентифицировать.
У меня всё. Если у вас есть вопросы – давайте. Вот, есть ссылочка на презентацию.
Вопрос из зала (З): – Скажите, пожалуйста, а с точки зрения использования «Тора», с точки зрения отслеживания трафика… Рекомендуете ли вы?
Скрыться тяжело, но можно
АХ: – «Тор»? «Тор» нет, вообще ни в каком виде. Я, правда, не знаю, как в Белоруссии – в России вообще ни в коем случае туда не заходить, потому что практически большинство «грейснод» верифицированные внезапно добавляют некие пакеты к вашему трафику. Не знаю какие, но если вы посмотрите: есть «ноды», которые маркируют трафик, – непонятно, кто это делает, в каких целях, – но кто-то его маркирует в заголовке для того, чтобы потом можно было понять. В России сейчас же весь трафик хранится, пусть он и хранится в зашифрованном виде, и все троллят «Пакет Яровой» на тему того, что хранится зашифрованный трафик, но он остаётся промаркированный, то есть использовать, расшифровать его нельзя…
З: – В Европе он уже давно хранится, лет десять, наверное.
АХ: – Да, я понимаю. Все смеются над этим – типа, вы храните https, которые невозможно прочитать. Контент прочитать нельзя, но понять, откуда пакеты шли определёнными алгоритмами можно – по весу пакетов, по длине и так далее. А когда у тебя есть под колпаком все провайдеры, есть, соответственно, всё магистральное оборудование и все паспорта… В общем, вы поняли о чём я говорю?
З: – Каким браузером рекомендуете пользоваться?
АХ: – Для «Тора»?
З: – Нет, вообще.
АХ: – Ну, я не знаю. Я на самом деле «Хромом» пользуюсь, но исключительно потому, что там панель разработчика самая удобная. Если вдруг мне понадобится куда-то зайти, я пойду в какую-нибудь кафешку. Правда, там не стоит авторизовываться на настоящую сим-карту.
З: – Вы говорили о каких-то студентах. Вы где-то преподаёте либо какие-то курсы ведёте?
АХ: – Да, у нас есть магистратуры по журналистике данных. Мы обучаем журналистов собирать данные, анализировать – вот они подобные исследования периодически делают.
Безопасных приложений нет
З: – В «Фейсбуке, «Вконтакте» небезопасно с друзьями общаться, чтобы потом не получить контекстную рекламу. А как повысить безопасность?
АХ: – Вопрос в том, что вы считаете допустимым уровнем безопасности. В принципе слова «безопасный» нет. Вопрос в том, что вы считаете допустимым. Некоторые считают допустимым через «Фейсбук» интимными фотографиями обмениваться, а какие-нибудь сотрудники спецслужб считают, что всё, что было сказано через рот, даже самому близкому человеку – оно уже по факту небезопасно. Если вы не хотите, чтобы соцсеть что-то узнала об этом, то да – лучше не писать об этом. Безопасных приложений я не знаю. Я боюсь, их нет. И это нормально с точки зрения того, что любому владельцу любого приложения его нужно как-то монетизировать, даже если это приложение бесплатное или это СМИ какое-то. Оно вроде как бесплатное, но ему всё равно нужно жить на что-то. Поэтому безопасного нет ничего. Вы должны только для себя решить, так сказать, что вас устраивает.
З: – А чем вы пользуетесь?
АХ: – Соцсетями?
З: – Из мессенджеров.
АХ: – Из мессенджеров я пользуюсь главным государственным мессенджером Российской Федерации – «Телеграмом».
З: – «Вайбер». Он безопасен?
АХ: – Слушайте, я не очень разбираюсь в мессенджерах. Честно говоря, я ни в защищённость, ни во что не верю, потому что это было бы, наверное, очень странно. Хотя «Телеграм» – это вроде как и open source, и его алгоритмы шифрования раскрыты. Но это тоже такая хитрая штука, потому что «опен-сорсный» там клиент, а серверов никто не видел. Думаю, что нет: в «Вайбере» очень много спама, ботов и так далее. Фиг знает. Мне кажется, это всё не очень хорошо работает.
Кто опаснее – корпорации или государство?
Ведущий (В): – А у меня к тебе вот какой вопрос. Смотри, ты пару раз вскользь об этом говорил – о том, что государство… Слишком много данных – это не очень хорошо… У корпорации слишком много данных. Ну, это просто жизнь, да? Так кого бояться больше – корпораций или государства? Где подводные камни?
АХ: – Это очень сложный вопрос. Он граничит. Сложный этический барьер. Человеку, если ему нечего бояться, если он не нарушал закон, в принципе ему зачем нужна приватность? Хотя я так не считаю – это государство так считает. Может быть, в этом есть какое-то зерно правды. Слушай, я боюсь больше всего хакеров – какую-то вот такую жесть. На самом деле самая большая жесть, которую я видел в жизни своей (из всей этой темы): где-то полтора-два года назад в Подмосковье поймали педофила и во время следственных действий у него на компьютере нашли несколько самоучителей по «Питону», скрипты, Api VK. Он собирал аккаунты девочек, анализировал, кто из них находится поблизости, собирал, контент, который они… Короче, ты понял. Вот это самая большая жесть, которую я видел. И этого я на самом деле боюсь, что в один прекрасный момент кто-то что-то подобное учудит.
Ещё один маленький «офтопчик»: Европейская организация государственной безопасности в том году делала доклад, что процентов где-то на 20, на 25 что ли увеличилось количество краж с банковских счетов, когда взламывали секретный вопрос. Подумайте просто сейчас о своём секретном вопросе в банке, и подумайте, смогу ли я узнать на него ответ из открытых источников. Если у вас там девичья фамилия матери стоит или любимое блюдо… В общем, люди анализировали аккаунты, на основании этого понимали кличку любимого питомца – как-то так…
З: – Вы говорили, что компании, корпорации собирают с помощью алгоритмов нужную информацию? Вы наверняка знаете как?
АХ: – Была движуха людей, которые одно время через специальный фильтр прогоняли фотографии, чтобы этот фильтр ломал анализ изображений, чтобы нельзя было потом как-то этих людей потом идентифицировать. Вот я вам приводил пример, что «Фейсбук» боролся с криптографией сообщений. И если эта штука появится и приобретёт массовый характер, наверняка соцсети будут с этим бороться. Плюс, распознавание образов сейчас работает очень хорошо, и это граничит с тем, что тот достаточный уровень, чтобы «сломать» эту фотографию (для того, чтобы «сломать» алгоритм, который распознаёт эти образы) – скорее всего, на ней уже ничего понятно не будет.
Всевозможные глич-фильтры хорошо работают, если это сильное прям смещение по половине фотографии. Ваш аккаунт тогда приобретёт все цвета ЛСД. Чисто теоретически я не считаю очень страшным, если «Фейсбук», например, узнает, какая у меня машина – наверное, если я в машине не буду авторизовываться через «Фейсбук».
Закон о забвении работает, но не в интернете
З: – Сталкивались ли вы с пользователем, который заставлял бы вас уважать его, удалить, получить доступ. Вы большими массивами данных оперируете, наверняка уведомляете об этом. Люди могут к вам обратиться. Сколько процентов?
АХ: – Сейчас расскажу. Вот сейчас будет на самом деле интересно. Сейчас посчитаю, сколько людей зайдёт, потому что после мероприятия всегда 15-20 % заходит, заполняет форму на удаление данных — есть такое. Реально это где-то 7-8 % закрытых аккаунтов, которые мы не анализируем, и примерно 5 человек из тысячи, которые просят свои данные удалить. Это очень мало, даже на мой скромный взгляд.
Проблема здесь в следующем: есть такая штука, как закон о забвении. Но закон о забвении, по крайней мере в России, юридически применяется только к поисковым системам. Там прям написано: поисковые системы. И то — это удаление только ссылок на материалы, а не самих материалов. Реально чтобы что-то удалить из интернета, придётся все эти источники обходить, поэтому я в это в принципе не верю. Мы стараемся пользователей предупредить о том, что нужно сначала подумать, прежде чем публиковать.
Пока этот процент очень мал — 5-7 человек из тысяч. К слову, о законе о забвении: все знают такой крутой кейс «Сечин против РБК». Закон о забвении сработал, статью удалили, но она есть везде. Понимаете, что если что-то когда-то попало в интернет, то оно оттуда уже никогда не пропадёт.
Пользователи удаляются, но их идентифицируют по типовому поведению
З: – Не считаете ли вы, что люди, которые удаляют свои аккаунты и пытаются стать «чёрной дырой», будут находиться в более невыгодном положении относительно остальных экономических агентов?
АХ: – Скорее всего, да — это положение будет невыгодно для них самих. Есть же куча всяких скидок, предложений, которые от них зависят. Но, чисто теоретически, если человек удаляет аккаунт сейчас… Популярно у всяких экстремистов, когда они удаляют аккаунт и делают фейк, но продолжают с тем же контентом взаимодействовать — этого человека, опять же, можно идентифицировать (особенно, если это в рамках одной социальной сети, с одного компьютера — это вообще вопрос); элементарно по модели потребления контента можно будет этого человека найти, если стоит такая задача.
Я надеюсь, что в ближайшие 5 лет появится какая-то технология монетизации этих данных, когда человеку реально можно будет заплатить деньги — ты сам заплатишь и мы твои данные использовать не будем. А я думаю, что если в каком-нибудь «Инстаграме» введут платную подписку, ею никто не воспользуется, поэтому альтернатива в том, чтобы платить пользователям за их данные. Но это не очень скоро, потому что лобби страшных корпоративных ребят не даст такой закон провести, хотя было бы прикольно. Но тут дело в том, что невозможно оценить реальную стоимость данных одного человека в какой-то конкретный момент времени.
«Фейсбук» – дырявые ребята
З: – Добрый день. Совсем недавно появилась новость о том, что «Фейсбук» намерен все свои проекты интегрировать, включая «Инстаграм» и «Фейсбук», «Воцапп» и так далее. Как, на ваш взгляд, с точки зрения персональных данных, когда сейчас у меня на смартфоне эти программы висят как бы отдельно, но они всё равно принадлежат Фейсбуку?.. Что будет дальше?
АХ: – Я понял. Юридически они итак принадлежат «Фейсбуку», и он может их бесконтрольно внутри себя объединять, поэтому думаю, что ничего не изменится. Единственное, что теперь достаточно взломать одно приложение для того, чтобы сразу всё получить. А «Фейсбук»… Я надеюсь, они смотрят. Страшно дырявые ребята вообще во всех местах.
В последнее время появилось очень много информации об этом — об утечках данных из «Фейсбука». Это же появилось не потому, что «Фейсбук» начал внезапно эти данные терять, а потому, что GDPR теперь заставляет компанию заранее предупредить. И самый огромный штраф — в том случае, если утечка произошла, а компания это умолчала, и поэтому «Фейсбук» сейчас сам об этом рассказывает. Это не говорит о том, что до этого этих утечек данных не было.
З: – Здравствуйте. У меня вопрос по поводу хранения данных. Сейчас каждое государство вводит закон по поводу того, чтобы данные граждан хранились на территории этого государства. Какое условие достаточно соблюсти для того, чтобы этот закон выполнять, для какого-то интернационального приложения?.. Вот, например, «Фейсбук»: база данных одна…
Каким образом, чтобы соблюдать эти условия?
АХ: – Слушайте, юридически вам достаточно просто сервер арендовать в этой стране и на него что-то положить. Проблема в том, что нет компетентного контролирующего органа. Данные «Фейсбука» в России не лежат. Роскомнадзор с ними борется-борется, борется-борется… У «Фейсбука» есть часть серверов, где лежит интерфейс этого самого «Фейсбука», и проверить невозможно, где по факту данные лежат, как они синхронизируются.
З: – Трафик проверить?
АХ: – Трафик проверить? Да. Но трафик же потом может в какую-то магистральную точку уйти. Плюс, между серверами может быть что-то типа VPN или ещё что-то. Чисто теоретически, никак невозможно проконтролировать, что, скажем, системный администратор в один прекрасный момент на этот сервер не зайдёт и что-то оттуда не заберёт. То есть этот закон сделан не ради защиты данных, а чтобы компании открывали представительства, платили налоги и хранили железо на территории страны. Но на мой взгляд, это какая-то очень странная инициатива, честно говоря.
З: – То есть достаточно фактически интерфейс проверить?
АХ: К вам может кто-то прийти и проверить, что у вас там данные лежат. Но вы можете показать какой-то «эксель», и никто не сможет это проверить, вряд ли кто-то это будет проверять. Сейчас просто по IP-адресам смотрят: что IP-адрес, привязанный к домену, находится на территории страны — дальше не проверяют. Теперь, наверное, ко мне придут проверять.
Нет сервисов, которым можно довериться на 100%, но порядочным людям бояться нечего
З: – Такая новость, много где перепечатанная: из «Майкрософта» чувак выложил, сделал сервис для проверки своих…
АХ: – Что-то типа: не утекли ли ваши пароли? На самом деле после тех же утечек в «Фейсбуке» тот же «Фейсбук» всегда запускает какие-то резервные сайты, на которых можно проверить, что он не попал в эту базу — опять же, GDPR это требует. То есть, если ты такую штуку не сделаешь, то тебе будет не очень хорошо. Поэтому все сейчас представляют эти проекты, как «это наша инициатива»; на самом деле закон это требует. На самом деле это очень крутая штука, но я бы не очень доверял подобным сервисам по проверке, если туда нужно отправлять что-то сложнее твоего пароля, потому что много у кого пароли одинаковые.
З: – Там просто e-mail вводишь, и уже говорят, сколько раз он был скомпрометирован…
АХ: – Я на самом деле не доверяю таким штукам, потому что привязать потом вас к этому браузеру, к реальному аккаунту очень легко. Особенно, если вы пользуетесь сервисами тех же людей, которые этот сайт запустили. Это как было в том году, когда «Фейсбук» прислал: если ваши интимные фотографии утекли в «Фейсбук», вы их нам отправьте, и мы проверим, где они упоминались.
Я не знаю, что это за пиар-кошмар и кто в «Фейсбуке» это придумал, но реально такое было. Они хотели сравнить, никто ли не пересылал в личных сообщениях вашу обнажёнку. В принципе это преследует благие цели, но максимально странно. Я бы этому не доверял.
З: – И ещё один вопрос. Для обычного пользователя насколько высоки риски утечки? Риски ущерба от утечек.
АХ: – Я вас понял. Смотря что за данные хранить. Я думаю, что не очень высокие. Самое страшное – если утекут куда-то e-mail’ы и пароли, а у вас этот пароль стоит везде – тогда да. Я вообще считаю, что пользователям мало чего стоит бояться. Но если они, конечно, не какую-нибудь расчленёнку хранят в гугл-почте. Очень много примеров было.
Самая известная история – в «Гугле», когда в Юте девочку похитили, её не могли найти, и в один прекрасный момент похитители прислали её фотки во вложении архивированном. И «Гугл», сканируя это вложение, обнаружил признаки детской порнографии. Всех нашли. А они ещё ухитрились на «Гугл» в суд подать за то, что они тайну переписки нарушили. Это разбирательство достаточно долго проходило. Но тем не менее я считаю, что обычному пользователю бояться нечего, если он не выкладывает, скажем, паспорт свой в открытый доступ. Это двойная история – смотря что за данные и что за пользователь. Может, сейчас – ничего страшного, а через 15 лет, когда он станет каким-нибудь чиновником, то его какие-то материалы всплывут.
Как работается с государством?
З: – Спасибо. Вы говорили немножко о том, что делаете исследования для государства, государственных органов, служб, работаете с ними. Может, немножко подробнее расскажете о каких-то актуальных проектах. Даже больше, если можете, про… Два вопроса: первый – актуальные проекты, а второй – были ли какие-то такие предложения от государственных служб…
АХ: – Неприличные!
З: – Да. Когда вы думали: может быть, не стоит этого делать.
АХ: – Я вам расскажу. Я это всем рассказываю. Мы с этим человеком в «Твиттере» долго ругались. Из команды Милонова в «Твиттере» мне как-то пришёл вопрос на поиск учителей, которые гей-порно смотрят. Мы сразу сказали, что нет. Но есть такие, письма часто приходят, и очень часто это связано с какими-то оппозиционерами, митингами. Мы такой ерундой не занимаемся, нас и так все говном обливают. Я этого не стесняюсь.
У нас по поводу «госов» следующая политика: мы разрабатываем софт, софт по трёхмерной реконструкции, распознаванию лиц, анализу данных. Что конкретно они делают, очень сложно сказать, но из моделей – это прогнозирование преступлений, то, что связано с госбезопасностью внутри города, перемещения людей, геомаркетинг и так далее. От размещения объектов внутригородской среды до идентификации педофилов, насильников, маньяков и всяких нехороших ребят.
Честное слово, никакими оппозиционерами мы не занимались. Может, нам не говорят об этом в лицо. На самом деле это очень большая проблема – сотрудничество с «госами», потому что не всегда же объясняют, что за задача. Тебе говорят: сделайте софт для идентификации домохозяек, а они на самом деле что-нибудь другое с ним собираются делать – у них там всё ломается.
Плюс, государство – это очень интересный и странный клиент, который постоянно пытается какие-то три копейки вставить в твоё исследование, и зачастую их подходы и понимание машинного обучения очень поверхностные. Например, у меня есть отдельная лекция об ошибках машинного обучения. Я там всегда привожу в пример, когда мы делали систему прогнозирования преступности в Подмосковье, заказчик сказал: там, где продают арбузы, увеличьте, пожалуйста, коэффициент раза в четыре. А потом на самом деле оказалось, что места продажи арбузов нифига некриминальные. Это просто ошибки того, что человек вносит свои мысли.
Короче, государство – прикольный клиент, там очень много интересных задач. Большинство сводится к подобным моделям прогнозирования чего-нибудь. Чаще всего это какая-то городская инфраструктура.
З: – А есть ли источники, где можно проследить за вашими исследованиями? Много информации. Как я понимаю, много её ещё за бортом осталось. Ваши страницы, ещё что-то…
АХ: – У меня нет личных страниц.
З: – Наверное, в «Фейсбук» уже закрыли?
АХ: – Где-то четыре месяца назад была история: они нам всем прислали такие большие письма, что «вы – уроды, Кремлю продаёте всё, нарушаете все правила «Фейсбука». Даже собаке моей прислали письмо: «Hello, Марс блу-корги, ты данные собираешь!» и так далее. Слушайте, у нас ребрендинг сейчас. Недели через две-три у нас сайт и всё обновится. За этим можно будет смотреть. Но мы очень ленивые просто в этом плане.
Как можно определить надёжность VPN?
З: – Вы когда говорили, что зашли бы в кафе, не идентифицируясь там под своим номером телефона. А под каким?
АХ: – Нельзя говорить – под чужим, потому что это призыв к нарушению регламенту идентификации. Нет-нет-нет. Я шучу. Сейчас практически все кафе идентифицируют всё подряд – там не только номер телефона, там есть куча пикселей, там идентификация устройства, мак-адрес и чего там только нет, для того чтобы потом это использовать – от рекламных целей до оперативно-розыскных мероприятий. Поэтому с такими штуками нужно быть очень осторожными. Вы не только можете что-то написать, а с вашего устройства могут написать, а потом что-то произойдёт.
Вы, может, видели историю о том, что сейчас делают расследование, как (в Белоруссии, кстати, тоже) сдают аккаунты «Фейсбука» в аренду, типа для реклам казино. А по факту неизвестно для чего, ещё и доступ к компьютеру дают. Вот таких штук нужно максимально опасаться. Если вы решите откуда-то что-то анонимно написать… Я пришёл бы в кафе и врубил бы VPN какой-нибудь крутой. Но на самом деле (опять же, ни на кого не показываю пальцем), когда будете аккаунт создавать в VPN’е, вы проверьте, кому принадлежит этот VPN, какой компании, кому эта компания принадлежит и так далее. Потому что большинство игроков рынка VPN не совсем хорошие ребята.
Ну ладно, в Белоруссии это неважно. В России хороший VPN проверяют по тому, заблокирован ли там azino777, или нет. Потому что, если нет, то велика вероятность, что в течение недели этот VPN-сервис закроют. В общем, проверяйте всё.
Об автоудалении сообщений
З: – Вы так много говорили про личные сообщения, что их социальные сети читают… А вот, например, у «Фейсбука» есть секретные личные сообщения, которые можно поставить (кроме того, что они ещё и шифруются) на уничтожение. Как вы это можете прокомментировать?
АХ: – Никак. Я, во-первых, не суперпрофессионал в криптографии, а во-вторых, проблема здесь в том, что сервера «Фейсбука» никто не видел, никто не знает, как это там всё работает. Условно, в какой-нибудь спецификации написано, что это end-to-end шифрование, а оно может не такое быть, или оно end-to-end, но с какими-то там погрешностями или ещё с чем-нибудь. Такой штукой есть смысл воспользоваться, если вы боитесь, что тот человек, которому вы это отправили, в какой-то момент попытается что-то сделать.
В «Телеграме» есть удобная функция для отправки интимных фотографий, которые самоудаляются: когда ты пытаешься сделать скриншот, она автоматически удаляется. В «Айфоне» же появилась функция записи видео с экрана, и записать видео с экрана можно и так далее… Мне просто очень часто присылают материалы с этой функцией (автоудаление) – я никогда не понимаю зачем. Я же могу сразу скачать! Это всё на ваше усмотрение.
Социальный рейтинг в Китае: мифы, реальность, перспективы
В: – Я на самом деле немножко злоупотребляю, хотя мне VPN не нужен (кстати, VPN у нас проверенный). А вопрос про этику. У нас есть прекрасный друг из Казахастана, мы его тоже привозили с лекцией. Как-то с ним сидели на какой-то конференции, где рассказывали про разные вещи, и он говорит (а он занимается кибербезопасностью, то есть в чистом виде инженерной безопасностью, человек, которому интересны технические решения): «Вот, вернулся из Китая. Они там такую классную штуку делают – социальный рейтинг». Ты, кстати, что-нибудь исследовал по этому вопросу, как это работает у них?
АХ: – Мы в России скоринг продаём, я много про это знаю.
В: – Вот у меня и вопрос, что бы ты об этом побольше рассказал – о том, что нас, возможно, всех ждёт в будущем. Но ещё вопрос про этику. Он так радостно говорил: «Интересное инженерное решение!» У тебя есть свой кодекс этики?
АХ: – Да, кстати, есть. Два года назад мы его ввели – как раз после истории с Милоновым мы решили как-то ранжировать эти проекты. Возвращаясь к рейтингу: это один из суперпопулярных вопросов, потому что СМИ очень сильно демонизируют всю эту историю – что людей за границу не выпускают, убивают лазером с Луны. Я вам привожу, опять же, инженерные штуки…
Если вы начнёте копать эту историю, посмотрите, что за параметры входят в этот социальный рейтинг, вы поймёте: в него входят закрытые алименты, судимости, кредитная история, то есть штука с инженерной точки зрения реально офигенная. Ты живёшь, не нарушая закон, живёшь хорошо – тебе дают низкую ставку по кредиту. У тебя важная социальная работа (например, учитель) – тебе дают годное жильё. Всех сначала это смутило, потому что просочились сначала историю, что если ты будешь плохо писать про президента, то тебе этот рейтинг снизят. Хотя доказательств не было. В защиту рейтинга скажу, против рейтинга скажу, что и алгоритма никто не видел, какие параметры там по факту используются.
Потом появилась история, что более миллиона человек не выпустили за границу, запретили выезд. На самом деле это не совсем точная формулировка. Вы когда визу получаете (например, в Европу), вам виза даётся из расчёта «70 евро в день» (что-то такое); если вы справку о доходах не дадите, то вам визу не дадут. В Китае местный МИД решил пойти чуть дальше: он просто сразу предупредил людей, у которых недостаточно денег, о том, что, если вы захотите поехать за рубеж, денег у вас не хватит. Соответственно, это всё потом направили в концепцию, что бедных не выпускают за рубеж. Это сложная этическая штука, она граничит на некой презумпции виновности-невиновности, но по факту я не могу дать оценку.
Убивают люди, а не Орудие
Главное, что нужно понимать: все эти алгоритмы, которые осуждает общество – проблема не в алгоритмах. Алгоритмы просто позволили очень быстро анализировать большой «объём» людей, и эту проблему социальную подняли наверх. То есть бот «Майкрософта», который обучился на твитах и стал расистом – это же не бот виноват, а твиты, которые он читал. Или компания, которая решает построить модель идеального сотрудника, проанализировав текущих, и оказывается, что это белый, гендерно – мужчина с высшим образованием.
Это же не модель – расист, сексист или ещё что-то; это – люди, которые наняли этих людей (правы, не правы были – неважно). Всё просто граничит с тем, что искусственный интеллект – злой, плохой, и он мир уничтожит, но на самом деле… Если условно сейчас, например, российское правительство примет закон о том, что оппозиционерам не давать бесплатное образование, и там напишут софт, который идентифицирует и лишит их этого образования бесплатного – это ж не алгоритм будет виноват. Хотя никто эту мою концепцию не поддерживает, потому что, – когда я говорю, что не Орудие убивает людей, а люди, – «ты фашист» и так далее.
В общем, это реально очень крутое инженерное решение. Нужно понимать, почему этого, например, в России не будет. У вас [в Белоруссии] этого не будет, потому что вы – европейское государство, у вас всё хорошо. В России этого не будет по многим причинам: во-первых, у нас не такой уровень доверия к правоохранительной системе, как в Китае; у нас далеко не такой уровень цифровизации. В Китае почему всё получилось? Потому что правительство: у них – цифровая медицина, цифровое страхование, цифровая полиция. И кто-то умный додумался: давайте это всё сложим и сделаем – по сути это программа лояльности. Там больше плюшек, нежели «не плюшек».
Поэтому да – я думаю, что в России это не введут. Нужно сначала отцифровать весь Минздрав (а это задача на 50 лет) – кто-то должен жизнь положить, чтобы это сделать, а никто, естественно, делать этого не будет. С другой стороны, банки российские – передовые в мире по скорингу людей, они чего только не делают: «Ага, мужик? Девушек молодых лайкаешь? Вот тебе карта кредитная на любовницу». Там очень всё продвинуто. Например, в Америке практически везде скоринг подобный запрещён, потому что там есть законы, по которым банк тебе обязан объяснить, почему: «Ага! Потому что компания Social Data Hub за 10 лет хранит историю, и вот – то-то и то-то выдало о тебе»! И давай-ка ты засудишь и одних, и других! А у нас подобных историй нет.
Почему замалчивают статистику?
Я в принципе поддерживаю скоринг, если это не какая-то «тоталитарная» история. Но весь вопрос в том, что его невозможно предугадать, оценить. Это самая сложная история в этике больших данных – предугадать социальный эффект, который будет там через 15 лет. Вот я, например, очень долго умоляю прокуратуру открыть информацию о преступности. Данные криминальной статистики – это один из краеугольных камней любой статистики; все этого очень хотят. Но, например, в России криминальную статистику не открывают по очень простой причине: боятся нарушить демографию внутри городов. Считают, что люди перестанут жить в каких-то городах, даже внутри города всё как-то перераспределится. По этой же причине не раскрывают статистику ЕГЭ – сами понимаете, что в какие-то школы люди пойдут, в какие-то не пойдут.
Возможно, это правильно, возможно, и нет, но было много проектов… Например, «Яндекс» одно время (опять же, по «жёлтым» слухам, не видел, не знаю) решил в модель прогнозирования «недвижки» добавить количество атак на таксистов, то есть некий такой подход к уровню криминала, посчитав количество жалоб таксистов на то что их кто-то домогался, угрожал и так далее. Быстро свернули внутри компании, чтобы подобные вещи не делать.
З: – Вы общаетесь со студентами, общаетесь с аудиторией в своей стране, у нас в стране. Вы заметили по числу вопросов из зала, что мы ещё на той стадии развития, когда мы думаем, что нам нужна конфиденциальность, что мы можем спрятаться от кого-то, свои данные защитить, не предоставив их, спрятав, зашифровав. Если Европейский союз уже перешёл к следующей стадии, стадии приватности, которая подразумевает контроль над данными – заставить всех, кто твои данные собирает, предоставить тебе действенный контроль над ними… По выборкам по регионам, по социальным слоям – какая из категорий граждан, людей, больше уже перешла на второй этап, либо кто ещё сидит на первом в основном?
Кто больше всего озабочен безопасностью персональных данных?
АХ: – Тотальное большинство… Я бы сказал: всем насрать! Это волнует сейчас топ-менеджеров. По городам в России – это Москва и Санкт-Петербург. Активный центр – это айтишники, дизайнеры, креативные профессии, все, кто умеет фильтровать контент, получать новые знания, с высоким уровнем интереса к международным проблемам. В основном это топ-менеджеры; да, айтишники (не считая специалистов по безопасности); банкиры – то есть все люди, на которых утечка данных может как-то повлиять.
Если, например, украдут данные какого-нибудь домохозяина из какой-нибудь Калуги: вряд ли у него в жизни что-то серьёзно поменяется, если у него кто-то украдёт, например, доступ к gmail’у, где он доступ к сериалам хранит. Вопрос в том, что закон всех равно защищает, и это правильно, потому что… с точки зрения закона все равны – ха-ха… но самое главное, что невозможно понять, чьи данные сколько будут стоить, пока эти данные не пропадут – к сожалению, очень сложно спрогнозировать. Но в основном такая категория граждан.
Телефон – в фольгу!
Я единственный раз в жизни видел поголовное хранение всего и вся в двух компаниях. Одна – это крупнейший интегратор по информационной безопасности: там всё, вплоть до USB, клеем заклеено внутри офиса; и люди там такие же ходят – я там встретил человека, у которого телефон в мешочке из фольги. Я узнал, что есть компании, которые торгуют специальными такими мешочками. А второй раз я увидел подобную историю в «Блумберге» у сотрудников: мы стояли в курилке, и кто-то где-то фотографировался, и один из них – «Так, чтобы нас там видно не было на заднем фоне!» Я такой думаю: «О, ничего себе»!
«Лучше мы, чем ФСБ»
Не хотелось бы говорить, что это менее одного процента населения, но, к сожалению, в общей массе практически всем всё равно. Но с другой стороны, у меня есть скандальный сервис по контролю действий несовершеннолетних (давно мы его запускали под слоганом «Лучше мы, чем ФСБ»), чтобы предупредить родителя о том, что несовершеннолетний творит трэш, перед тем как наш же алгоритм, установленный где-то там, к нему кого-то отправит.
При верификации ребёнка нужно присылать скан паспорта (это в принципе нормальная практика), но мы написали, что вы можете обрезать номер паспорта, потому что нас он не интересует; нас интересует только ваша фотка, голограммка и имя-фамилия. И практически 100 % людей – ну, где-то 95 паспортов из 100 – люди в «Фотошопе» аккуратно вырезали эти номера и отправляли только нужную часть. То есть они поняли – ага, раз им не нужно, то не нужно это и присылать. На мой взгляд, это прям какая-то реальная подвижка, на которую их подтолкнуло недоверие к нам.
З: – Выборка такая – определённая. Там же люди, которые обращаются, они уже продвинутые.
Люди не хотят, чтобы за ними следили, но не читают соглашения
АХ: – Да. А вторая такая же штука: мы в тест в конце того года запускали приложение для знакомств (скоро его перезапустим). Там была контрольная группа в 100 тысяч человек. И там по подходам GDPR в личном кабинете было 15 галочек – я даю разрешение на анализ взаимодействия с интерфейсом, на доступ к моей демографии, на доступ к трёхмерной реконструкции лица, на доступ к моим личным сообщениям и так далее. Мы максимально расписали всевозможные доступы. Даже где-то есть статистика, кто на что ставил галочки. 98 % оставили по умолчанию проставленными все галочки (притом что они заходили на эту страничку и видели это всё, но им наплевать было), а вот эти 2 % интересно было проанализировать на то, что для людей было приоритетно.
Все убрали разрешение на доступ к личным сообщениям и практически все убрали разрешение доступ к данным сексуального теста (что им там нравится, что они там заполняли, свои извращения – шучу). Но это людей пнули в эту, ткнули: им интерфейс говорит – внимательно прочитай это, даёт возможность проскролить это соглашение до конца. Но это было сделано исключительно потому, что это был исследовательский проект, и все были предупреждены. Ни одна компания, включая нас, когда выпустят это приложение в открытый доступ, не будет заставлять человека читать это сообщение до конца, потому что… ну, извините, так это всё работает.
При условии того, что они зашли к нам, зная, чем занимается компания, зная, что они зашли в сервис, который будет тебе предлагать кандидатов на основании того, какое ты порно лайкаешь – даже на основании этого только 2 % прочитали эти галочки и вообще что-то сделали. И то практически никто из них не снял галочку «Доступ к трафику и данным о посещении других веб-страниц». В основном всех волновали личные сообщения.
Обнажёнка и посадки за лайки – интересные законы братских республик
З: – У меня вопрос по защите данных. Можно носить телефон в фольге, делать вид, что их нет… Потом оказывается, что ты вроде как сохраняешь, сохраняешь, но потом ты должен свои данные отдать государству, потому что оно с тебя требует, и ты никак не можешь… И тут получается, что господрядчики все насквозь дырявые. А в Белоруссии ещё такая норма есть: если я проверю безопасность своих личных данных (кое-что подправлю и получу доступ к ним), то я сразу уголовник. Та же самая статья использовалась, чтобы журналистов по «делу БелТа» обвинить в том, что они получили несанкционированный доступ к данным (можете сами почитать). Вот, собственной, и вопрос: является ли эффективной мерой для приватности, вообще для безопасности частных данных такие ограничения?
АХ: – Я понял. В Белоруссии есть много очень интересных законов. Я буквально недавно узнал… Я вот всё шучу про передачу обнажёнки, а у вас это, оказывается, запрещено.
З: – Демонстрация запрещена!
АХ: – Это вообще как-то странно.
З: – Смотреть можно, передавать нельзя, лайкать нельзя. Смотреть вместе нельзя!
АХ: – Я на ваш вопрос отвечу. Вернусь к теме «сидят за лайки» в Москве. В России это тема номер один. Не знаю, как в Белоруссии, но, честно говоря, государство… Если статистику анализировать, в Москве 95 посадок за лайки из 100 – это когда люди нажаловались на людей, кто-то пишет на прокуратуру на другого человека. Государство очень редко возбуждает подобные дела. Мне кажется, что этот закон – абсолютно абсурдный. Не знаю ни одного реального преступника, которого за этого посадили. Но эту меру используют, чтобы хоть что-то человеку вменить. Мне кажется, что это максимально странно. Думаю, что когда-нибудь это отменят.
З: – Это называется под колпаком держать.
АХ: – Ну-у-у, окей… Не могу сказать. Я не совсем прям прогосударственное чудовище, но моё восприятие немного изменено, знаете, людьми, которые приходят к нам и говорят: «У меня ребёнок пропал, помогите найти». Я говорю: «Я не могу ничего сделать без разрешения суда». Ты смотришь на этих родителей, которые всё в своей жизни отдали бы, любой доступ к любым данным дали – только чтобы решили их проблему. Поэтому мне очень сложно подобную дискуссию вести: с одной стороны, я считаю, что и государство правильные вещи делает, когда реальных каких-то людей ловит, а с другой стороны, давать бесконтрольный доступ – это вообще жуткая история.
Возвращаюсь к вашей штуке, «сори», что отвлёкся. Я в пакетики из фольги не верю вообще. Иметь мобильный телефон и оборачивать его в фольгу – это какая-то глупость. Ради чего это делать? Ради того, чтобы телефон к «вай-фаю» не подключался? Проще его выключить. Чтобы мобильный оператор тебя не идентифицировал? Они итак всё равно могут сигнал триангулировать, как-то посчитать это. Для меня единственные эффективные меры безопасности – это хранилище, защищённое, типа локальной сети – может, в квартире, где можно что-то хранить.
З: – Тут вопрос по законодательству. Является ли законодательство репрессивным по отношению к человеку, которые хочет проверить свои данные?
АХ: – Я понял, да. Я даже не знал про эту штуку, поэтому не могу вам точно сказать. В России такого нет, хотя там всё очень сложно. Наверное, можно проконсультироваться с квалифицированными юристами и, возможно, есть какая-то лазейка – может, в какой-то Европейский суд подать… Нет? Не могу вам про это сказать. Мои знания в праве поверхностны, на уровне руководителя компании. Я знаю, чего делать нельзя, чтобы тебе никто ничего не сказал. Это, конечно, очень печально.
З: – Я к тому, что в других странах (например, в Штатах) нормальная практика, что ты можешь протестировать какую-то уязвимость, а потом о ней заявить, но не разглашать.
АХ: – Да, «баг-баунти». Я понял, есть такое.
З: – И у компаний нет механизма, чтобы тебя убрать, потому что это дешевле.
АХ: – Эта штука тоже граничит на уровне закона. Смотря как вы эту уязвимость найдёте. Мне кажется, что большое количество денег, выплаченных за эту уязвимость, в Америке были выплачены под соглашение о неразглашении и под угрозами засудить этого человека. Тоже как бы свечку не держал. Мы всегда рискуем такой штукой. У меня сотрудники пару раз находили подобные уязвимости во всяких госприложениях – я всегда говорю: «Отправьте анонимное письмо лучше, чем вы им скажете, что дырка там». А потом какой-нибудь НИИ придёт, который этот сервис поставил… В общем, дальше продолжать не буду.
Проверить бизнес на честность не получится: не нравится – не пользуйся
З: – Такой вопрос. Вы сказали, что провели опыт – 15 галочек надо было поставить… Допустим, пользователь отменяет все галочки. Кто и как проконтролирует это? Как это проверить вообще?
АХ: – Честно вам скажу: никто и никак. Серьёзно. То, что вы у «Гугла» поставили-сняли галочку «Запрет рекламного отслеживания», вообще это ничего не значит. К сожалению, даже когда вы во «Вконтакте» ставите запрет индексации поисковиков, поисковики всё равно это индексируют, а потом просто не выдают эти результаты определённым людям. Это всё на уровне отсутствия компетентных органов, которые не могут это проверить. Плюс, компании, которые это делают, – частные. У «Фейсбука» правильная или неправильная позиция, она у них одна: не нравится – не пользуйся.
О регулировании
З: – У меня только один простой вопрос. А как вы относитесь к вопросу регулирования в обработке данных, саморегуляции?
АХ: – Я, как представитель компании, считаю, что рынку, бизнесу нужно саморегулирование. Я верю в то, что ассоциация больших данных может сама всё зарегулировать сама, без государства. Я очень не доверяю государственному регулированию и очень не доверяю всем историям, когда государство что-то хочет хранить у себя, потому что каждый кейс показывал, что это очень плохо. Обязательно кто-нибудь приклеит логин и пароль на жёлтый стикер на монитор и так далее.
В общем, я верю в саморегуляцию. Плюс ко всему верю, что в ближайшие 5 лет мы придём к некой открытости. Даже сейчас вы это уже видите по новостным инфоповодам, что государству очень сложно врать пользователям, пользователям очень сложно врать системе. И это, в принципе, наверное, хорошо. Раз уж у нас сотрудников разведок по фоткам публичным вычисляют
Всё это ведёт к снижению, наверное, уровня преступности. Ну, чисто математически. Если кому-то интересно будет проговорить о снижении уровня преступности – там очень много есть всевозможных выводов, которые можно сделать. В общем, я за саморегуляцию рынка. Спасибо!
Ведущий (далее – В): – Артур Хачуян занимается… Можно сказать «на тёмной стороне» в контексте нашей конференции?
Артур Хачуян (далее – АХ): – На стороне корпораций – да.
В: – Он собирает ваши данные, продаёт их корпорациям.
АХ: – На самом деле нет…
В: – И он как раз расскажет, как корпорации могут использовать ваши данные, что происходит с данными, когда они попадают в онлайн. Он не будет, наверное, рассказывать, что с этим делать. Мы подумаем дальше…
АХ: – Расскажу, расскажу. На самом деле долго рассказывать не буду, но на предыдущем мероприятии мне представили человека, которому «Фейсбук» даже аккаунт собаки заблокировал.
Всем привет! Меня зовут Артур. Я действительно занимаюсь обработкой и сбором данных. Конечно же, я не продаю никому никакие персональные данные в открытом доступе. Шучу. Моя сфера деятельности – это извлечение знаний из данных, находящихся в открытых источниках. Когда что-то юридически является не персональными данными, но из этого можно извлечь знания и сделать их такими же по значимости, как если бы эти данные были получены из персональных данных. Ничего на самом деле страшного рассказывать не буду. Здесь, правда, про Россию, но про Белоруссию у меня тоже есть цифры.
Каковы реальные масштабы?
Буквально позавчера я был в Москве в одной из руководящих, правящих партий (не буду говорить в какой), и мы обсуждали внедрение какого-то проекта. И значит, IT-директор этой партии встаёт и говорит: «Вот вы говорили, – числа и так далее, – знаете, мне 2-е управление ФСБ подготовило тут записку, где написано, что россиян в социальных сетях 24 миллиона человек. А вы говорите – 120 с чем-то. У нас вообще-то более тридцати [миллионов] интернетом не пользуются». Я говорю: «Да? Ну, окей».
Люди на самом деле не осознают масштаб. Это необязательно государственные органы, которые до конца, наверное, не понимают, как интернет работает, но и на самом деле моя мама, например. Она только сейчас начала понимать, что карточку в «Перекрёстке» ей дают не просто так, не за жалкие скидки, которые этот «Перекрёсток» предлагает, а за то, что потом её данные используют в ОФД, покупках, прогнозных моделях и так далее.
В общем, жителей вот столько, и о стольких есть информация в открытых источниках. О ком-то известна только фамилия, о ком-то известно всё, вплоть до порно, которое он лайкает (я всегда про это шучу, но это действительно так); и всевозможная информация: как часто люди путешествуют, с кем встречаются, какие покупки делают, с кем живут, как перемещаются – много всякой информации, которую могут использовать плохие, не очень плохие и хорошие ребята (я даже не знаю, какую шкалу сейчас придумать, но тем не менее).
Есть соцсети, которые, естественно, являются гигантским набором открытых данных, играя на слабости людей, которые вроде как кричат о приватности. А на самом деле так: если вы представите себе график за последние 5 лет – уровень истерии по поводу персональных данных растёт, но при этом количество закрытых аккаунтов в соцсетях снижается из года в год. Может быть, выводы из этого делать не совсем правильно, но: первое, что останавливает любую компанию, которая собирает данные – это тупо закрытый аккаунт в социальных сетях, потому что мнение человека внутри своего закрытого аккаунта, если у него не 100 тысяч подписчиков, оно на самом деле не очень интересно для какого-то анализа; но бывают и такие случаи.
Откуда берут информацию о нас?
Когда-нибудь к вам стучались ваши друзья старые школьные, с которыми вы давно не общались, а потом этот аккаунт исчезал? Есть такое среди плохих ребят, которые собирают телефоны: они анализируют друзей (а список друзей почти всегда открыт, даже если человек закрывает свой профиль, либо список друзей можно восстановить «в обратную сторону», собрав всех остальных пользователей), берут какого-нибудь неактивного вашего друга, делают копию его странички, стучатся к вам в друзья, вы его добавляете и через две секунды аккаунт удаляется; но при этом копия вашей странички осталась. Так, собственно, делали ребята недавно, когда 68 миллионов профилей из «Фейсбука» улетели куда-то – они примерно так же ко всем в друзья добавлялись, копировали эту информацию, даже кому-то писали в личные сообщения, что-то делали…
Соцсети – огромный источник информации, практически в 80 % случаев информация берётся о каком-то конкретном человеке не напрямую, а из ближайшего окружения – это всевозможные косвенные знания, признаки (у нас это называется «алгоритм «Злой бывшей»), потому что одна моя знакомая подтолкнула меня на эту абсолютно гениальную мысль. Она никогда не следила за своим парнем – она всегда следила за пятью его друзьями и всегда знала, где он находится. Это на самом деле повод целую научную статью написать.
Есть огромное количество ботов, которые делают тоже всякие хорошие и нехорошие вещи. Есть безобидные, которые тупо подписываются на вас, чтобы потом вам косметику рекламировать; а есть серьёзные сетки, которые пытаются мнение своё навязать, особенно перед выборами. Не знаю, как в Белоруссии, а вот в Москве перед муниципальными выборами у меня почему-то появилось огромное количество друзей каких-то непонятных, причём каждый за разного кандидата агитирует, то есть они абсолютно не анализируют контент, который я потребляю – они просто пытаются навязать какую-то непонятную реформу, с учётом того, что я в Москве вообще не прописан и голосовать не пойду.
Помойка – источник опасной информации
Плюс, есть «Тор», который не то чтобы недооценивают – все считают, что туда нужно зайти только, чтобы купить наркотики или узнать, как собирается Орудие. Но на самом деле там есть очень много источников данных. Они практически все незаконные (такие, околозаконные), потому что кто-то мог на каком-то хакерском сайте взломать базу авиаперевозчиков и выкинуть туда. Юридически вы эти данные использовать не можете, но если вы получите оттуда какое-то знание (как в американском суде), – например, запись аудиоразговора, сделанную без ордера, вы не можете использовать, но знания, которые вы из этой аудиозаписи получили, вы уже не забудете, – и здесь примерно то же самое.
Это на самом деле очень опасная штука, поэтому я всегда шучу, но это правда. Я заказываю еду всегда в соседний дом, потому что «Деливери Клаб» очень часто ломают, и у него реально есть такие проблемы. А недавно я очень удивился: заказывал продукты, и на коробке, которую относил на мусорку, был наклеен стикер, на котором написано – «Артур Хачуян», номер телефона, адрес квартиры, код от домофона и e-mail. Мы даже на самом деле пытались договориться с московским муниципалитетом, чтобы дали доступ на помойку: в общем, приехать на склад отходов и попробовать чисто ради интереса попробовать найти какое-нибудь упоминание данных персональных – сделать что-то вроде мини-исследования. Но нам отказали, когда узнали, что мы хотим с сотрудниками Роскомнадзора прийти.
Но это на самом деле так и есть. Вы смотрели офигенский фильм «Хакеры»? Они в мусоре ковырялись для того, чтобы какой-то участок вируса найти. Это тоже популярная штука – люди же когда выкинули что-то в открытые источники, они забыли об этом. Это может быть какой-то школьный сайт, на котором они писали диссертацию о превосходстве белой расы, а потом они пошли в Госдуму и забыли об этом. Такие случаи на самом деле были.
Что лайкают «единороссы»?
Если зайдёте в «топчик» на сайте «Лайфньюс»… Мне студенты два года назад делали исследование: они взяли всех участников праймериз «Единой России» (они все официально подали во ВЦИК свои аккаунты в соцсетях), посмотрели, что они вообще лайкают – порно детское, трэш, непонятные объявления от странных взрослых женщин… В общем, люди как бы забыли об этом.
Потом они написали письмо о том, что у двадцати человек аккаунты украли. Но аккаунты у них украли две недели назад, 8 месяцев назад они их в избирком подали, а лайки были два года назад… В общем, понимаете, да? Там есть реально огромное количество информации, которую даже в исследовательских целях можно всегда использовать.
Миниофтопчик: вчера новость увидел, что Роскомнадзор заблокировал исследования студентов «вышки» двухлетней давности. Может, кто-то видел эту новость, нет? Это мои студенты делали исследование: они из «Тора», с сайта «Гидра», где продаются наркотики (прошу прощения – с «Рампа»), собрали информацию, сколько, что, в каком регионе России стоит, и сделали исследование. Называлось оно «Потребительская корзина тусовщика». Это, конечно, смешная штука, но с точки зрения дата-анализа на самом деле дата-сет интересный – потом ещё года два по всяким «хакатонам» ходил. Это реальная штука – там много чего интересного есть.
Как Get Contact «купил души» любопытных юзеров и почему нужно читать пользовательское соглашение
Обычно, когда у человека спрашиваешь, какой утечки данных ты боишься (особенно, если у человека заклеена веб-камера), он всегда структуру приоритетов вот так ставит: хакеры, государство, корпорации.
Это, конечно, шутка. Но на самом деле активные дата-аналитики, всевозможные исследователи данных понаворовали гораздо больше, чем, мне кажется, страшные русские, американские или какие-нибудь другие хакеры (подставьте любое, в зависимости от ваших политических убеждений). В общем, обычно все боятся этого – у вас же у всех наверняка веб-камера заклеена? Можете даже руки не поднимать.
Но если хакеры делают что-то незаконное, а государству нужно разрешение судебное на получение данных, то последним ребятам [корпорациям] вообще ничего не нужно, потому что у них есть такая штука, как пользовательское соглашение, которое никто никогда в жизни не читает. И я очень надеюсь, что подобные мероприятия всё-таки заставят людей читать соглашения. Я не знаю, как в Белоруссии, но в Москве в середине того года волна приложения «ГетКонтакт» (вы, наверное, были в курсе), когда появилось непонятно откуда приложение, которое говорит: ты дай-ка приложению доступ ко всем своим контактам, а мы тебе покажем, как ты у кого был смешно записан.
В СМИ не всплыло, но мне очень много высокопоставленных сотрудников жаловалось, что им начали все звонить постоянно. Видимо, администраторы решили в этой базе телефон Шойгу найти, ещё кого-нибудь… Волочковой… Безобидная штука. Но те, кто читал лицензионное соглашение «ГетКонтакта» – там написано: спам в неограниченном количестве в неограниченное время, продажи ваших данных бесконтрольно третьим лицам, без ограничения прав, срока давности и вообще всего, чего только можно. И это на самом деле не такая супер-редкая история. Вот мне «Фейсбук», пока я там был, по 15 раз в день показывал уведомления: «А синхронизируй-ка контакты, а я тебе найду всех твоих друзей, которые у тебя есть!».
Корпорациям всё равно. ФЗ 152 и GDPR
Но на самом деле приоритеты – в обратную сторону, потому что корпорации защищает частное право и поэтому практически во всех случаях невозможно доказать, что она не права. А с учётом того, что она большая, страшная и очень дорогая, то это практически невозможно. А если вы ещё и в России, с устаревшим законодательством, то как-то всё совсем печально.
Знаете, чем отличается российский закон (а он практически белорусский) от, например, GDPR’а? Российский 152-й ФЗ защищает данные (это пережиток советского прошлого) – документ, который защищает данные от утечки куда-то. А GDPR защищает права пользователей – права на то, что они лишатся каких-то свобод, привилегий или ещё чего-то, потому что их данные куда-то утекут (они прямо в «дата-ли» ввели такое понятие). А у нас всё, что тебе могут вменить – штраф за то, что у тебя нет сертифицированного «опен»-«Экселя» для обработки персональных данных. Надеюсь, что это когда-нибудь поменяется, но, думаю, что не в ближайшее время.
Каковые реальные возможности таргетинга сегодня?
Первая, наверное, страшная история, про которую все постоянно думали – это чтение личных сообщений. Наверняка среди вас есть человек, который когда-нибудь что-нибудь вслух говорил, а потом получал таргетированную рекламу. Да, были такие? Руки поднимите.
Я на самом деле не верю в историю того, что условный «Яндекс Навигатор» распознаёт прям аудио в потоке для всех пользователей, потому что те, кто немного сталкивались с распознаванием голоса, они понимают, что: во-первых, дата-центр «Яндекса» в пять раз больше должен быть; но самое главное, стоимость привлечения такого человека стоила бы огромные деньги (чтобы в потоке распознавать аудио и понимать, о чём человек говорит). Но! Реально есть алгоритмы, которые тегируют вас по определённым ключевым словам, для того чтобы потом делать какую-то рекламную коммуникацию.
Таких исследований проводили массу, и я 100 раз делал чистые аккаунты, что-то кому-то писал в сообщениях, а потом внезапно получал рекламу, казалось бы, никак не связанную с этим. Вывода здесь на самом деле два. Против такой истории – считается, что человек просто попадает в какую-то статистическую выборку; скажем, вы – мужчина 25 лет, который именно в этот момент должен был столкнуться с курсами английского языка как раз в тот момент, когда вы кому-то написали. По крайней мере, «Фейсбук» всегда так в суде говорит: что есть некая модель поведения, которую мы вам не покажем, которая была построена на данных, которые мы вам не покажем, у нас есть внутренние исследования, которые мы вам точно не покажем (потому что всё коммерческая тайна); в общем, вы попали в некую статистическую выборку, поэтому мы вам это показали.
Как «Фейсбук» приватность пользователей взбесила
К сожалению, это вообще невозможно доказать, если у вас нет человека внутри компании, который как-то подтвердит эти действия. Но в американском праве в таком случае соглашение о неразглашении этого сотрудника стоит выше, нежели его желание вам помочь, поэтому никто этого не сделает. Ещё интересно – было где-то год или полтора назад – начал развиваться тренд в Америке, когда люди ставили расширение для браузера для того, чтобы оно шифровало сообщения «Фейсбука»: пишешь что-нибудь человеку, он ключом на устройство его шифрует и отправляет белиберду в открытый доступ.
Вот «Фейсбук» в течение полутора лет судился с этой компанией и таки непонятно на каких основаниях (потому что я плохо разбираюсь в американском праве) заставил их удалить это приложение и потом сделал поправку в пользовательском соглашении: если вы посмотрите, там есть такой пункт, что вам нельзя передавать в зашифрованном виде сообщения – там как-то это так хитро описано, что нельзя использовать криптографические алгоритмы для того, чтобы видоизменять сообщения – ну, есть такое. То есть они сказали: либо ты пользуешься нашей платформой, пишешь в открытом доступе, либо не пишешь. И отсюда возникает вопрос: а нафига им вообще нужны личные сообщения?
Личные сообщения – источник стопроцентно достоверной информации
Здесь очень простая штука. Все, кто занимается анализом цифрового следа, активности человека, пытаются использовать как-то эти данные для маркетинга или ещё чего-то, – у них есть такая метрика, как достоверность. То есть некий образ человека – вы понимаете прекрасно, это не сам человек – этот образ всегда чуть успешнее, чуть лучше. Личные сообщения – это реальные знания, которые можно получить о человеке, они практически всегда на 100% достоверны. Ну потому что редко кто-то будет в личных сообщениях что-то кому-то писать, обманывать, и это всё проверяется очень легко – соответственно, по другим сообщениям (вы поняли, о чём я говорю). Суть в том, что знания, извлечённые подобным образом, они почти на 100% достоверны, поэтому все всегда пытаются их заполучить.
Но тем не менее это всё, опять же, очень сложно доказуемая история. А те, кто верят в то, что у условного «Вконтакте» есть такой доступ у правоохранительных органов для личных сообщений – это не совсем правда. Если вы просто посмотрите историю судебных запросов на раскрытие информации – как «Вконтакте» очень хитро (в данном случае Mail.ru) отбивается от этих запросов.
У них главный всегда аргумент: по закону правоохранительные органы должны аргументировать, почему именно нужен доступ к личным сообщениям. Как правило, если это убийство, всегда следователь говорит, что скорее всего человек сказал, где он спрятал Орудие (в личных сообщениях). Но мы-то с вами понимаем, что ни один здравомыслящий преступник никогда в жизни во «Вконтакте» своим подельникам не напишет о том, где он спрятал огнестрельное Орудие. Но это один из распространённых вариантов, чем отчитываются чиновники.
А вот ещё один такой страшный пример (меня просили сегодня страшные примеры приводить) – про Россию (надеюсь, в Белоруссии такого не будет): по закону следователю необходимо иметь достаточно веские основания для оператора, чтобы раскрыть эту информацию. Естественно, нигде эти достоверные параметры не описаны (какие, в каком виде они должны быть), но в России существует сейчас всё большее количество прецедентов, когда для суда такое основание появляется, если есть некая модель, которая спрогнозировала определённое, хорошее или плохое, поведение.
То есть у нас никого не могут посадить (и это хорошо) за то, что вы попали в некую статистическую выборку чистокровных убийц – и это хорошо, потому что нарушает презумпцию невиновности; но есть прецеденты, когда результаты подобных прогнозов использовались для получения судебного разрешения на получение данных. Не только в России, кстати. В Америке тоже такая штука есть. Там «Палантир» всех уже давно тоже скорил, подобные штуки используют. Страшная история.
Это у меня исследование. Мы проводили такое: по Питеру гуляли, в местах зелёных точек мы писали какие-то ключевые моменты друзьям с «чистых» аккаунтов – типа «хочу-ка я выпить кофе», «а где купить стиральный порошок?» и так далее. А потом, соответственно, получали гео-привязанную рекламу. Каким магическим образом… Или как там говорили: «Совпадение? Не думаю!» Это личные сообщения «Вконтакте». Да простит меня Mail.ru, но это так. Любой желающий может подобный эксперимент повторить.
Кстати, на это, когда писали заявление в поддержку, Mail сказал, что там стояли wi-fi-точки, который ваш мак-адрес захватили. Такое тоже есть.
Способы получения и распространённые варианты «слива» личных данных
Следующая история – это извлечение дополнительных знаний, кусочка которого я на самом деле коснулся. На самом деле заполненный профиль человека в соцсетях реально несёт в себе 15–20% реальных знаний, которые оператор данных хранит о нём. Вся остальная история получается из очень интересных вещей. Почему, думаете, «Гугл» развивает очень сильно библиотеки для компьютерного зрения? В частности, они были одними из первых, кто развивал библиотеки собственно для анализа и категоризации объектов – на заднем фоне, на переднем плане, не важно где. Потому что это огромный источник дополнительной информации о том, какая у человека квартира, машина, где он живёт, предметы роскоши…
Была куча «хакерских» вбросов, когда сливались обученные нейросетки «Гугла» (не знаю, чьи они были, но тем не менее). Там было много интересного на тему размера груди, объёма талии – что только люди не пытались узнать о людях других на основании анализа фотографий. Потому что, когда человек фотку делает, он же не всегда думает о том, сколько всего интересного можно с неё узнать? А сколько уж в России выкладывают паспортов новорождённых?.. Или: «Ура, мой ребёночек получил визу»! Это вообще боль современного общества.
Такой ещё офтоп (я сегодня буду делиться с вами фактами): в Москве самый частый слив персональных данных – это ЖКХ, когда на дверь вешают список должников, а эти должники потом подают в суд, потому что их персональные данные в открытый доступ попали без их разрешения. Вдруг с вами такое случится… Суть в том, что человек, когда делает что-то, он же не знает, что было на той фотографии, чего не было. Номеров автомобилей сейчас много.
Мы как-то проводили исследование – пытались понять, какое количество людей с открытыми фотками машин (у них есть, соответственно, правонарушения и так далее) – это, к сожалению, можно было только по слитым базам ГИБДД сделать, где есть только номер (не очень достоверная информация), но тоже было интересно.
Ваша следующая реклама зависит от того, как вы «потребили» предыдущую
Это первая история. Вторая история – это модели поведения, контент, который потребляет человек, потому что одна из самых главных метрик, которую соцсети пытаются о вас построить – это то, как вы взаимодействуете с рекламой. Какими бы точными, «офигенскими» алгоритмы ни были, как бы замечательно ни работали искусственные интеллекты и всё прочее, но реальный приоритет социальной сети всегда – это зарабатывать деньги. Поэтому, если придёт условная «Кока-Кола» и скажет – «Хочу, чтобы мой пост увидели все жители Белоруссии» – они его увидят, вне зависимости от того, что об этом человеке думают алгоритмы, как его там таргетировать. Вы же наверняка получали рекламу, помимо супер-супертаргетированной, чушь совершенно никак не связанную. Потому что за эту чушь несвязанную очень много денег заплатили.
Но одна из главных метрик – это понять, с каким контентом вы взаимодействуете лучше всего, именно – как на него реагируете, для того чтобы вам показывать подобную рекламную историю. И соответственно, это метрика того, как вы взаимодействуете с рекламой: кто её банит, кто – нет, как человек кликает, читает ли он только заголовки или полностью проваливается в материал; а потом на основании этого продолжать вас удерживать в этом, как это сейчас называется, «пузыре фильтров», для того чтобы вы продолжали взаимодействовать с этим контентом.
Если вдруг вам когда-нибудь будет интересно, вы попробуйте долгое время, в течение недели, может быть месяца, просто всю подряд рекламу банить из соцсетей: вам показывают какое-то объявление – вы его закрываете. Если это анализировать и наложить на график, будет интересная история: если вы неделю будете банить рекламу, следующую неделю она будет показывать вам в усиленном варианте и вообще из разных категорий; то есть, условно, вы любите собак, и вам показывается реклама с собаками – вы всех собак забанили, и дальше они вам начнут показывать всевозможную разностороннюю чушь из разных вариантов, для того чтобы попытаться понять, что вам нужно.
А потом, в конце концов, плюнут, пометят вас как человека, который с рекламой не взаимодействует, поставят на вас условный крестик и в этот момент вам начнут показывать рекламу исключительно богатых брендов. То есть в этот момент вы будете видеть рекламу только «Кока-Колы», «Кит-Кита», «Юнилевера» и всех людей, которые «башляют» огромное бабло, потому что нужно накручивать просмотры. В течение месяца проведите эксперимент: одну-две недели баните всю рекламу, потом видите всё подряд, и баните её, – в конце концов, будете видеть только рекламу, как потом оказывается (и говорят рекламные агентства), только клиентов, которые платят за просмотры, потому что невозможно понять, как вы с этой рекламой взаимодействуете.
Порно чаще смотрят те, кто склонен глубоко погружаться в контент
Соответственно, здесь история про всевозможное отслеживание поведения. У меня примерчик такой интересный – посетители одного государственного веб-сайта. Самое смешное, что чем больше глубина просмотра у людей, тем больше из этих людей предпочитает просмотр порно традиционным отношениям. «Сори», что я всё время про эту тему говорю, но у меня на самом деле очень хорошие отношения с «Порнохабом», и это всегда очень интересные исследования, потому что это тема, которая вроде запретная, но она очень много о человеке рассказывает. И вытекающие отсюда следующие пункты про отдачу трафика… Мы ещё про «Порнохаб» вспомним!
Что считается персональными данными и можно ли разблокировать «Айфон» 3D-моделью лица?
Моё любимое – это обход закона о персональных данных. Если почитать техническую документацию того же «Фейсбука», который предоставлял какие-то внутренние документы (например, в суд), вы там не найдёте упоминания ни о распознавании лиц, ни об анализе голоса. Там будут очень сложные формулировки, которые ни один квалифицированный юрист не найдёт внутри законодательства. У нас в России примерно так же работает – я вам такую сейчас штуку покажу.
Вот вы здесь что видите? Любой нормальный человек скажет, что лицо. Это, кстати, Саша Грей, по-моему. А юридически это – матрица неких трёхмерных точек, которых здесь 300 тысяч штук. Хорошо это или плохо, но по закону это не считается персональными данными. Вообще, РКН российский не считает одну фотографию персональными данными – он считает персональными данными, если рядом есть ещё что-то (например, ФИО или номер телефона), а сама по себе фотография эта – вообще ничто. Как только ввели закон о биометрии, и биометрические данные приравняли к персональным (так, очень грубо), все сразу начали говорить: это не биометрические данные, это массив точек! Особенно, если от этого массива точек взять прямое или обратное преобразование Фурье, вроде как деанонимизировать человека назад вы из этого преобразования не можете, но идентифицировать его вы можете. Чисто теоретически закон эта штука не нарушает.
Ещё я делал другое исследование: это алгоритм, который строит трёхмерную реконструкцию лица по открытым источникам – берём аккаунт в «Инстаграме» и можно потом личико на 3D-принтере распечатать. Кому, кстати, интересно, у меня есть ссылка в открытом доступе; если вдруг кто-то захочет чей-то «Айфон» разблокировать… Шутка – «Айфон» нельзя разблокировать, там качество снижено.
Закрытый профиль – это плюс для безопасности
Это первая штука, а вторая… Я касался уже того, что информацию в основном получают из окружения пользователя. Эту картинку в 17-м году я рисовал: среднестатистический пользователь российских социальных сетей – он внутри, у него в среднем 200–300 друзей, его друзья друзей и его друзья друзей друзей.
Спасибо социальным сетям за то, что ввели алгоритмы «умных» e-лент, интегральных лент якобы для увеличения вероятности вашего столкновения с каким-то интересным контентом. Вот это количество людей может в любой случайный момент увидеть контент, который вы производите, даже если аккаунт у вас ограничен только верхними уровнями приватности (только для друзей друзей и так далее). Вот это – друзья друзей:
Если кто-то думает, что когда он в ВК выбирает в «Моих постах» видеть «друзья друзей», то три рукопожатия – это примерно 800 тысяч человек, что в принципе не так мало, но зависит от вашего контента. Может быть, вы какие-то стримы неприличные ведёте, и все эти друзья друзей могут с этим контентом провзаимодействовать. Кто-нибудь из них может куда-то что-то перепостить, у всех людей есть лента лайков, которую на самом деле скорее всего отменят, потому что это не очень лицеприятная штука. Поэтому в любой момент контент может куда-то попасть.
ВК в том году запустили ещё суперзакрытые профили, но ими пока воспользовалось ещё очень малое количество людей (не буду говорить какое, но малое!). Возможно, когда-то люди додумаются до этого – я на самом деле искренне на это надеюсь. Все исследования постоянно направлены на то, чтобы дать людям понять масштаб проблем. Потому что, пока кого-то конкретно не коснутся какие-то страшные вещи, они никогда об этом не подумают. Идём дальше.
В госорганах не знают, что такое персональные данные и не спешат давать определение
Любой специалист по праву в области персональных данных всегда говорит следующее: никогда не нужно объединять различные источники данных, потому что тут у вас лежат e-mail’ы (это одни персональные данные с какими-нибудь обезличенными идентификаторами), тут – ФИО… Если это всё объединить, вроде как они станут персональными данными. Вообще, было бы правильно сначала коснуться этой темы, но я думаю, что вы уже погружены в неё и в курсе, может, как закон работает.
На самом деле никто не знает, что такое персональные данные. Важная концепция! Когда я прихожу в государственные органы, говорю: «Бутылку коньяка тому, кто скажет, что такое персональные данные». И никто сказать не может. Почему? Не потому, что они глупые, а потому, что никто не хочет брать ответственность на себя. Потому что, если Роскомнадзор скажет, что вот это персональные данные, завтра кто-то что-то сделает, а они будут виноваты; а они – органы исполнительной власти и вообще не должны ни за что отвечать.
Суть в том, что в законе чётко прописано, что персональные данные – это те данные, по которым можно идентифицировать человека. И там дан пример: ФИО, адрес домашний, номер телефона. Но мы-то с вами знаем, что идентифицировать человека можно и по тому, как он на кнопки нажимает, и по тому, как он взаимодействует с интерфейсом, и по другим косвенным параметрам. Если кому-то интересно: практически в каждой сфере есть огромное количество лазеек.
Идентификаторы, которые нас раскрывают
Вот, например, начали все ставить точки для захвата мак-адресов (сталкивались наверняка?) – умные (или не знаю, жадные) производители мобильного оборудования, типа Apple и Google, быстро ввели алгоритмы, которые выдают случайный мак-адрес, чтобы вас нельзя было идентифицировать, когда вы по городу идёте и всем отправляете свой мак-адрес. Но умные ребята ещё дальше додумались до следующей истории.
Например, вы можете получить лицензию мобильного оператора; получив лицензию мобильного оператора, вы получите доступ к такой штуке – называется протокол SS7, по которому вы будете видеть некий эфир мобильных операторов; там есть куча всевозможных идентификаторов, которые не являются персональными данными. До этого это было IMEI, а сейчас – прям буквально кто-то снял с языка и решил вести в России (инициатива такая) единую базу этих «имэев». Она вроде как есть, но тем не менее.
Есть ещё, например, куча идентификаторов – например, IMSI (идентификатор мобильного оборудования), который не является ни персональными данными, ни привязан к каким-то другим вещам и, соответственно, его можно сохранить без какого-либо законодательного преследования, а потом с кем-нибудь обменяться этими идентификаторами, чтобы с человеком потом прокоммуницировать.
Культура работы с персональными данными находится на низком уровне
В общем, суть в том, что все сейчас очень сильно озабочены объединением данных одного с другим, и большинство компаний, которые делают это объединение, иногда даже не задумываются об этом. Например, банк пришёл, заключил соглашение о неразглашении с компанией, которая делает скоринг, свалил ей 100 тысяч своих клиентов…
И не всегда у этого банка в соглашении есть пункт о передаче данных третьим лицам. Эти клиенты что-то там отскорили, и непонятно, куда потом эта база пошла, не пошла – в большинстве компаний в России нет культуры удаления данных… – обязательно этот «эксель» где-нибудь у секретаря потом на компьютере и повиснет.
Наши данные могут продаваться с каждой покупкой в магазине
Есть очень много схем, которые вроде как околозаконны (то есть законны). Например, история следующая: из 15 крупнейших российских банков только два являются собственно смс-шлюзом – «Тинькофф» и «Альфа», то есть они сами шлют свои смс-ки. Остальные банки используют смс-шлюзы для отправки смс-ок конечным клиентам. Эти смс-шлюзы почти всегда имеют право анализировать контент (типа, на предмет безопасности и каких-то своих выводов) для того, чтобы потом продавать агрегированную статистику. Эти смс-шлюзы «дружат» с операторами фискальных данных, которые оперируют чеки.
И получается следующее: вы пришли на кассу, оператор фискальных данных (дали, не дали свой номер телефона – каким-то образом там привязан)… вам на номер телефона приходит смс-ка, шлюз этих смс-ок видит последние 4 цифры карты и номер телефона. Мы знаем, в какой момент вы совершили транзакцию от оператора фискальных данных, а в смс-ках мы знаем (теперь уже), на какой номер пришла информация о списании такой-то денежной суммы с такими-то четырьмя последними цифрами карты. Четыре последние цифры карты идентификаторами вас не являются, не нарушают закон, потому что по ним нельзя вас деанонимизировать, сумма транзакции – тоже нет.
Но если вы договорились с оператором фискальных данных – вы знаете, в какое временное окно (плюс-минус 5 минут) вам эта смс-ка должна прийти. Таким образом, вас быстренько в ОФД привязали к вашему номеру телефона, а ваш номер телефона привязан к рекламным идентификаторам, вообще ко всему-всему-всему. Поэтому вас можно потом догнать: пришли в магазин, а вам потом ещё какую-то чушь присылают без разрешения. Я думаю, в этом зале вряд ли есть хоть кто-то, кто хоть раз писал заявление в ФАС на спам. Вряд ли есть… Кроме меня, наверное.
Бумажки – архаичный, но эффективный способ борьбы за свои права
Это очень круто работает. Правда, придётся полтора года подождать, но ФАС реально проведёт проверку: кто, как, кому передал данные, почему куда и так далее.
Вопрос из зала (далее – З): – В Белоруссии нет ФАСа. Это другая страна.
АХ: – Да, я понимаю. Аналог же наверняка есть какой-то…
Из зала поступают возражения
АХ: – Хорошо, плохой пример, «сори». Не суть важно. Среди моих друзей я никого не знаю, кто вообще в принципе о существовании подобной истории знает – что можно пойти написать, и они потом год ещё будут работать.
Вторая история, которая в России тоже очень развивается, но я думаю, что вы аналог у себя найдёте. Я очень люблю так делать, когда госорган с тобой плохо общается, какой-то банк или ещё что-то – ты говоришь: «Дайте бумажку». И пишешь на бумажке: «Согласно пункту 14 152-го ФЗ прошу вести обработку персональных данных в бумажном виде». Я не знаю, как точно это в Белоруссии делается, но наверняка это делается. По российским законам вам не имеют права отказать на основании этого в услуге.
Я даже знаю много людей, которые в Mail.ru подобное отсылали и просили вести учёт их персональных данных в бумажном виде. Mail.ru очень долго отбивался от этого. Я даже знаю одного разработчика «Яндекса», над которым пошутили: они удалили его аккаунт в ВК и прислали ему пачку распечатанных скриншотов, и сказали, что они будут присылать ему скриншоты каждый раз, когда он захочет обновить свою страницу.
Смешно, но тем не менее это реальная альтернатива, если кто-то реально переживает за данные, с одной стороны… А с другой стороны, тот же РКН мне говорил, что это соглашение об обработке персональных данных – оно формальное, и закон предусматривает ещё несколько вариантов дать это согласие. И что, например, меня пригласили сюда на мероприятие, и если, например, Human Constanta может не заключать в рамках российских законов со мной соглашение об обработке персональных данных (потому что сам факт того, что я приехал и согласился выступить, и является согласием на обработку персональных данных), – все всё равно берут эти бумажные разрешения. Но вот РКН подобную штуку мне говорил, что как бы это вообще не факт, что скорее всего они когда-то отпадут.
Я надеюсь, что в России никогда не создадут единого оператора, прости Господи, персональных данных, потому что хуже того, чем сложить все персональные данные в одну корзину, может быть только сложить их в государственную корзину. Потому что фиг знает, что потом получится с этим всем.
Компании обмениваются персональными данными, и законы слабо регулируют это
Большинство компаний между собой обмениваются какими-то данными, идентификаторами. Это может быть магазин с банком, а потом – банк с соцсетью, соцсеть – ещё с чем-то… И в конце концов, у этих людей появляется некая критическая масса знаний, которые можно каким-то образом использовать, и все эти знания, правда, сейчас пытаются сохранить на своей стороне. Но тем не менее потом это всё равно попадает в какой-нибудь рекламный трафик или ещё куда-то.
Передача данных третьим лицам – это самое весёлое, что может быть, потому что в законах не описано, что это за третьи лица, кому они вообще «третьими» должны считаться. Это, кстати, очень распространённая фраза американских адвокатов – у них это там Third parties – кто, кого вы считаете третьими лицами: бабушку, прабабушку?.. Даже был в Америке такой прецедент, когда чьи-то данные раскрыты были, человек подал в суд, и они доказали, что этот человек через несколько друзей знаком с владельцем данных – какое-то количество рукопожатий, привели какие-то странные социологические исследования – таким образом доказали, что эти люди не могут считаться третьими лицами друг другу. Смешно. Но факт передачи таких данных очень распространён.
Даже если вы заходите на сайт, где стоит счётчик для идентификации – этот счётчик имеет право передавать данные этого трафика куда-нибудь («Кликстриму», владельцам рекламных платформ чего угодно, «Порнохабу», например). «Порнохаб», если кто-то из вас веб-разработчик, – вы зайдите посмотрите, какое количество пикселей отслеживания стоит на сайте «Порнохаба». Просто заходишь – там огромное количество java-скрипта загружается, типа для улучшения работы сайта. На самом деле там и кроссдоменные «куки» ставятся, чего там только нету, потому что эта информация всегда высоко ценится на рынке «кликстрима».
«Фейсбук» виляет и маску срывать не собирается
Естественно, никто из крупных игроков никогда никому не рассказывает, кому и как он продаёт данные. Из-за этого, например, Европа сейчас пытается судиться с «Фейсбуком». Как раз-таки после введения GDPR Европейский союз пытается с «Фейсбука» стрясти собственное раскрытие алгоритмов перепродажи данных третьим лицам.
«Фейсбук» этого не делает и заявляет во всеуслышание, что он этого не делает, потому что они – «корпорация мира» (это я цитирую из письма, которое они мне прислали), они «против зловредного применения технологий» (особенно, если вы распознавание лиц Кремлю продаёте). В общем, суть в том, что «Фейсбук» делает это не совсем честно: главная его цель и главное, что произойдёт, как только такой механизм раскроется – можно будет реально подсчитать маржинальность рекламы, можно будет понять реальную стоимость рекламных объявлений.
Условно, если вам «Фейсбук» сейчас говорит, что стоимость рекламного показа – 5 рублей, и мы вам продаём его за 3 (и, типа, два рубля нам остаётся), и они, условно, 5% прибыли получают с этих рекламных показов. На самом деле это не 5%, а 505, потому что, если этот алгоритм всплывёт наружу (кому и как «Фейсбук» сколько раз передал «кликстрим», данные о посещениях, данные пикселя всевозможным рекламным сетям), окажется, что они денег зарабатывают гораздо больше, чем говорят об этом. И дело здесь не в самих деньгах, а в том, что стоимость клика не рубль, а на самом деле – сотые копеек.
В общем, суть в том, что все пытаются сокрыть подобную передачу, неважно – рекламного, нерекламного трафика, но она есть. К сожалению, нельзя никак юридически узнать это, потому что компании – частные, и всё, что у них внутри – это их частное право и их коммерческая тайна. Но подобные истории там очень часто всплывали.
Наркобарыги предсказуемы и «палятся» на «Авито»
Последняя картинка из этой презентации. Она смешная, и суть её в том, что есть некие категории людей, которые очень сильно переживают за свои персональные данные. И это хорошо, на самом деле! Этот пример – про такую категорию людей как наркобарыги. Казалось бы, люди, которые должны очень сильно переживать за свои персональные данные…
Это – исследование, которые проводилось в начале того года под надзором компетентных органов. Да, это скрипт, которому дали денег, чтобы он купил в «Телеграме», в «Торе» наркотики, но только у тех людей, которых можно было идентифицировать.
На самом деле почти все наркобарыги московские горят на том, что их номер телефона, вообще ни в каких открытых источниках, но рано или поздно на «Авито» они что-нибудь продадут, по чему можно будет понять примерное местоположение этих людей. Суть в том, что красные точки – это где люди живут, а зелёные – это куда они ездят оставлять сами знаете что. Это была одна из частей алгоритма, который прогнозировал расстановку патрульно-постовых служб, но эти московские ребята всегда стараются как-то по диагонали поехать, подальше.
Они считают, что если они сверху слева живут, то они должны сверху справа поехать и там их точно никогда не найдут. Это я вам говорю к тому, что, если вы пытаетесь скрыться от вездесущих алгоритмов, реальный самый крутой вариант – это менять модель поведения: установить какой-то там «Гостери» для рандомизации посещений, владений и так далее. Да господи, есть даже алгоритмы, плагины, которые размеры браузера на пару пикселей меняют, чтобы нельзя было подпись, «фингерпринт» браузера посчитать и как-то вас идентифицировать.
У меня всё. Если у вас есть вопросы – давайте. Вот, есть ссылочка на презентацию.
Вопрос из зала (З): – Скажите, пожалуйста, а с точки зрения использования «Тора», с точки зрения отслеживания трафика… Рекомендуете ли вы?
Скрыться тяжело, но можно
АХ: – «Тор»? «Тор» нет, вообще ни в каком виде. Я, правда, не знаю, как в Белоруссии – в России вообще ни в коем случае туда не заходить, потому что практически большинство «грейснод» верифицированные внезапно добавляют некие пакеты к вашему трафику. Не знаю какие, но если вы посмотрите: есть «ноды», которые маркируют трафик, – непонятно, кто это делает, в каких целях, – но кто-то его маркирует в заголовке для того, чтобы потом можно было понять. В России сейчас же весь трафик хранится, пусть он и хранится в зашифрованном виде, и все троллят «Пакет Яровой» на тему того, что хранится зашифрованный трафик, но он остаётся промаркированный, то есть использовать, расшифровать его нельзя…
З: – В Европе он уже давно хранится, лет десять, наверное.
АХ: – Да, я понимаю. Все смеются над этим – типа, вы храните https, которые невозможно прочитать. Контент прочитать нельзя, но понять, откуда пакеты шли определёнными алгоритмами можно – по весу пакетов, по длине и так далее. А когда у тебя есть под колпаком все провайдеры, есть, соответственно, всё магистральное оборудование и все паспорта… В общем, вы поняли о чём я говорю?
З: – Каким браузером рекомендуете пользоваться?
АХ: – Для «Тора»?
З: – Нет, вообще.
АХ: – Ну, я не знаю. Я на самом деле «Хромом» пользуюсь, но исключительно потому, что там панель разработчика самая удобная. Если вдруг мне понадобится куда-то зайти, я пойду в какую-нибудь кафешку. Правда, там не стоит авторизовываться на настоящую сим-карту.
З: – Вы говорили о каких-то студентах. Вы где-то преподаёте либо какие-то курсы ведёте?
АХ: – Да, у нас есть магистратуры по журналистике данных. Мы обучаем журналистов собирать данные, анализировать – вот они подобные исследования периодически делают.
Безопасных приложений нет
З: – В «Фейсбуке, «Вконтакте» небезопасно с друзьями общаться, чтобы потом не получить контекстную рекламу. А как повысить безопасность?
АХ: – Вопрос в том, что вы считаете допустимым уровнем безопасности. В принципе слова «безопасный» нет. Вопрос в том, что вы считаете допустимым. Некоторые считают допустимым через «Фейсбук» интимными фотографиями обмениваться, а какие-нибудь сотрудники спецслужб считают, что всё, что было сказано через рот, даже самому близкому человеку – оно уже по факту небезопасно. Если вы не хотите, чтобы соцсеть что-то узнала об этом, то да – лучше не писать об этом. Безопасных приложений я не знаю. Я боюсь, их нет. И это нормально с точки зрения того, что любому владельцу любого приложения его нужно как-то монетизировать, даже если это приложение бесплатное или это СМИ какое-то. Оно вроде как бесплатное, но ему всё равно нужно жить на что-то. Поэтому безопасного нет ничего. Вы должны только для себя решить, так сказать, что вас устраивает.
З: – А чем вы пользуетесь?
АХ: – Соцсетями?
З: – Из мессенджеров.
АХ: – Из мессенджеров я пользуюсь главным государственным мессенджером Российской Федерации – «Телеграмом».
З: – «Вайбер». Он безопасен?
АХ: – Слушайте, я не очень разбираюсь в мессенджерах. Честно говоря, я ни в защищённость, ни во что не верю, потому что это было бы, наверное, очень странно. Хотя «Телеграм» – это вроде как и open source, и его алгоритмы шифрования раскрыты. Но это тоже такая хитрая штука, потому что «опен-сорсный» там клиент, а серверов никто не видел. Думаю, что нет: в «Вайбере» очень много спама, ботов и так далее. Фиг знает. Мне кажется, это всё не очень хорошо работает.
Кто опаснее – корпорации или государство?
Ведущий (В): – А у меня к тебе вот какой вопрос. Смотри, ты пару раз вскользь об этом говорил – о том, что государство… Слишком много данных – это не очень хорошо… У корпорации слишком много данных. Ну, это просто жизнь, да? Так кого бояться больше – корпораций или государства? Где подводные камни?
АХ: – Это очень сложный вопрос. Он граничит. Сложный этический барьер. Человеку, если ему нечего бояться, если он не нарушал закон, в принципе ему зачем нужна приватность? Хотя я так не считаю – это государство так считает. Может быть, в этом есть какое-то зерно правды. Слушай, я боюсь больше всего хакеров – какую-то вот такую жесть. На самом деле самая большая жесть, которую я видел в жизни своей (из всей этой темы): где-то полтора-два года назад в Подмосковье поймали педофила и во время следственных действий у него на компьютере нашли несколько самоучителей по «Питону», скрипты, Api VK. Он собирал аккаунты девочек, анализировал, кто из них находится поблизости, собирал, контент, который они… Короче, ты понял. Вот это самая большая жесть, которую я видел. И этого я на самом деле боюсь, что в один прекрасный момент кто-то что-то подобное учудит.
Ещё один маленький «офтопчик»: Европейская организация государственной безопасности в том году делала доклад, что процентов где-то на 20, на 25 что ли увеличилось количество краж с банковских счетов, когда взламывали секретный вопрос. Подумайте просто сейчас о своём секретном вопросе в банке, и подумайте, смогу ли я узнать на него ответ из открытых источников. Если у вас там девичья фамилия матери стоит или любимое блюдо… В общем, люди анализировали аккаунты, на основании этого понимали кличку любимого питомца – как-то так…
З: – Вы говорили, что компании, корпорации собирают с помощью алгоритмов нужную информацию? Вы наверняка знаете как?
АХ: – Была движуха людей, которые одно время через специальный фильтр прогоняли фотографии, чтобы этот фильтр ломал анализ изображений, чтобы нельзя было потом как-то этих людей потом идентифицировать. Вот я вам приводил пример, что «Фейсбук» боролся с криптографией сообщений. И если эта штука появится и приобретёт массовый характер, наверняка соцсети будут с этим бороться. Плюс, распознавание образов сейчас работает очень хорошо, и это граничит с тем, что тот достаточный уровень, чтобы «сломать» эту фотографию (для того, чтобы «сломать» алгоритм, который распознаёт эти образы) – скорее всего, на ней уже ничего понятно не будет.
Всевозможные глич-фильтры хорошо работают, если это сильное прям смещение по половине фотографии. Ваш аккаунт тогда приобретёт все цвета ЛСД. Чисто теоретически я не считаю очень страшным, если «Фейсбук», например, узнает, какая у меня машина – наверное, если я в машине не буду авторизовываться через «Фейсбук».
Закон о забвении работает, но не в интернете
З: – Сталкивались ли вы с пользователем, который заставлял бы вас уважать его, удалить, получить доступ. Вы большими массивами данных оперируете, наверняка уведомляете об этом. Люди могут к вам обратиться. Сколько процентов?
АХ: – Сейчас расскажу. Вот сейчас будет на самом деле интересно. Сейчас посчитаю, сколько людей зайдёт, потому что после мероприятия всегда 15-20 % заходит, заполняет форму на удаление данных — есть такое. Реально это где-то 7-8 % закрытых аккаунтов, которые мы не анализируем, и примерно 5 человек из тысячи, которые просят свои данные удалить. Это очень мало, даже на мой скромный взгляд.
Проблема здесь в следующем: есть такая штука, как закон о забвении. Но закон о забвении, по крайней мере в России, юридически применяется только к поисковым системам. Там прям написано: поисковые системы. И то — это удаление только ссылок на материалы, а не самих материалов. Реально чтобы что-то удалить из интернета, придётся все эти источники обходить, поэтому я в это в принципе не верю. Мы стараемся пользователей предупредить о том, что нужно сначала подумать, прежде чем публиковать.
Пока этот процент очень мал — 5-7 человек из тысяч. К слову, о законе о забвении: все знают такой крутой кейс «Сечин против РБК». Закон о забвении сработал, статью удалили, но она есть везде. Понимаете, что если что-то когда-то попало в интернет, то оно оттуда уже никогда не пропадёт.
Пользователи удаляются, но их идентифицируют по типовому поведению
З: – Не считаете ли вы, что люди, которые удаляют свои аккаунты и пытаются стать «чёрной дырой», будут находиться в более невыгодном положении относительно остальных экономических агентов?
АХ: – Скорее всего, да — это положение будет невыгодно для них самих. Есть же куча всяких скидок, предложений, которые от них зависят. Но, чисто теоретически, если человек удаляет аккаунт сейчас… Популярно у всяких экстремистов, когда они удаляют аккаунт и делают фейк, но продолжают с тем же контентом взаимодействовать — этого человека, опять же, можно идентифицировать (особенно, если это в рамках одной социальной сети, с одного компьютера — это вообще вопрос); элементарно по модели потребления контента можно будет этого человека найти, если стоит такая задача.
Я надеюсь, что в ближайшие 5 лет появится какая-то технология монетизации этих данных, когда человеку реально можно будет заплатить деньги — ты сам заплатишь и мы твои данные использовать не будем. А я думаю, что если в каком-нибудь «Инстаграме» введут платную подписку, ею никто не воспользуется, поэтому альтернатива в том, чтобы платить пользователям за их данные. Но это не очень скоро, потому что лобби страшных корпоративных ребят не даст такой закон провести, хотя было бы прикольно. Но тут дело в том, что невозможно оценить реальную стоимость данных одного человека в какой-то конкретный момент времени.
«Фейсбук» – дырявые ребята
З: – Добрый день. Совсем недавно появилась новость о том, что «Фейсбук» намерен все свои проекты интегрировать, включая «Инстаграм» и «Фейсбук», «Воцапп» и так далее. Как, на ваш взгляд, с точки зрения персональных данных, когда сейчас у меня на смартфоне эти программы висят как бы отдельно, но они всё равно принадлежат Фейсбуку?.. Что будет дальше?
АХ: – Я понял. Юридически они итак принадлежат «Фейсбуку», и он может их бесконтрольно внутри себя объединять, поэтому думаю, что ничего не изменится. Единственное, что теперь достаточно взломать одно приложение для того, чтобы сразу всё получить. А «Фейсбук»… Я надеюсь, они смотрят. Страшно дырявые ребята вообще во всех местах.
В последнее время появилось очень много информации об этом — об утечках данных из «Фейсбука». Это же появилось не потому, что «Фейсбук» начал внезапно эти данные терять, а потому, что GDPR теперь заставляет компанию заранее предупредить. И самый огромный штраф — в том случае, если утечка произошла, а компания это умолчала, и поэтому «Фейсбук» сейчас сам об этом рассказывает. Это не говорит о том, что до этого этих утечек данных не было.
З: – Здравствуйте. У меня вопрос по поводу хранения данных. Сейчас каждое государство вводит закон по поводу того, чтобы данные граждан хранились на территории этого государства. Какое условие достаточно соблюсти для того, чтобы этот закон выполнять, для какого-то интернационального приложения?.. Вот, например, «Фейсбук»: база данных одна…
Каким образом, чтобы соблюдать эти условия?
АХ: – Слушайте, юридически вам достаточно просто сервер арендовать в этой стране и на него что-то положить. Проблема в том, что нет компетентного контролирующего органа. Данные «Фейсбука» в России не лежат. Роскомнадзор с ними борется-борется, борется-борется… У «Фейсбука» есть часть серверов, где лежит интерфейс этого самого «Фейсбука», и проверить невозможно, где по факту данные лежат, как они синхронизируются.
З: – Трафик проверить?
АХ: – Трафик проверить? Да. Но трафик же потом может в какую-то магистральную точку уйти. Плюс, между серверами может быть что-то типа VPN или ещё что-то. Чисто теоретически, никак невозможно проконтролировать, что, скажем, системный администратор в один прекрасный момент на этот сервер не зайдёт и что-то оттуда не заберёт. То есть этот закон сделан не ради защиты данных, а чтобы компании открывали представительства, платили налоги и хранили железо на территории страны. Но на мой взгляд, это какая-то очень странная инициатива, честно говоря.
З: – То есть достаточно фактически интерфейс проверить?
АХ: К вам может кто-то прийти и проверить, что у вас там данные лежат. Но вы можете показать какой-то «эксель», и никто не сможет это проверить, вряд ли кто-то это будет проверять. Сейчас просто по IP-адресам смотрят: что IP-адрес, привязанный к домену, находится на территории страны — дальше не проверяют. Теперь, наверное, ко мне придут проверять.
Нет сервисов, которым можно довериться на 100%, но порядочным людям бояться нечего
З: – Такая новость, много где перепечатанная: из «Майкрософта» чувак выложил, сделал сервис для проверки своих…
АХ: – Что-то типа: не утекли ли ваши пароли? На самом деле после тех же утечек в «Фейсбуке» тот же «Фейсбук» всегда запускает какие-то резервные сайты, на которых можно проверить, что он не попал в эту базу — опять же, GDPR это требует. То есть, если ты такую штуку не сделаешь, то тебе будет не очень хорошо. Поэтому все сейчас представляют эти проекты, как «это наша инициатива»; на самом деле закон это требует. На самом деле это очень крутая штука, но я бы не очень доверял подобным сервисам по проверке, если туда нужно отправлять что-то сложнее твоего пароля, потому что много у кого пароли одинаковые.
З: – Там просто e-mail вводишь, и уже говорят, сколько раз он был скомпрометирован…
АХ: – Я на самом деле не доверяю таким штукам, потому что привязать потом вас к этому браузеру, к реальному аккаунту очень легко. Особенно, если вы пользуетесь сервисами тех же людей, которые этот сайт запустили. Это как было в том году, когда «Фейсбук» прислал: если ваши интимные фотографии утекли в «Фейсбук», вы их нам отправьте, и мы проверим, где они упоминались.
Я не знаю, что это за пиар-кошмар и кто в «Фейсбуке» это придумал, но реально такое было. Они хотели сравнить, никто ли не пересылал в личных сообщениях вашу обнажёнку. В принципе это преследует благие цели, но максимально странно. Я бы этому не доверял.
З: – И ещё один вопрос. Для обычного пользователя насколько высоки риски утечки? Риски ущерба от утечек.
АХ: – Я вас понял. Смотря что за данные хранить. Я думаю, что не очень высокие. Самое страшное – если утекут куда-то e-mail’ы и пароли, а у вас этот пароль стоит везде – тогда да. Я вообще считаю, что пользователям мало чего стоит бояться. Но если они, конечно, не какую-нибудь расчленёнку хранят в гугл-почте. Очень много примеров было.
Самая известная история – в «Гугле», когда в Юте девочку похитили, её не могли найти, и в один прекрасный момент похитители прислали её фотки во вложении архивированном. И «Гугл», сканируя это вложение, обнаружил признаки детской порнографии. Всех нашли. А они ещё ухитрились на «Гугл» в суд подать за то, что они тайну переписки нарушили. Это разбирательство достаточно долго проходило. Но тем не менее я считаю, что обычному пользователю бояться нечего, если он не выкладывает, скажем, паспорт свой в открытый доступ. Это двойная история – смотря что за данные и что за пользователь. Может, сейчас – ничего страшного, а через 15 лет, когда он станет каким-нибудь чиновником, то его какие-то материалы всплывут.
Как работается с государством?
З: – Спасибо. Вы говорили немножко о том, что делаете исследования для государства, государственных органов, служб, работаете с ними. Может, немножко подробнее расскажете о каких-то актуальных проектах. Даже больше, если можете, про… Два вопроса: первый – актуальные проекты, а второй – были ли какие-то такие предложения от государственных служб…
АХ: – Неприличные!
З: – Да. Когда вы думали: может быть, не стоит этого делать.
АХ: – Я вам расскажу. Я это всем рассказываю. Мы с этим человеком в «Твиттере» долго ругались. Из команды Милонова в «Твиттере» мне как-то пришёл вопрос на поиск учителей, которые гей-порно смотрят. Мы сразу сказали, что нет. Но есть такие, письма часто приходят, и очень часто это связано с какими-то оппозиционерами, митингами. Мы такой ерундой не занимаемся, нас и так все говном обливают. Я этого не стесняюсь.
У нас по поводу «госов» следующая политика: мы разрабатываем софт, софт по трёхмерной реконструкции, распознаванию лиц, анализу данных. Что конкретно они делают, очень сложно сказать, но из моделей – это прогнозирование преступлений, то, что связано с госбезопасностью внутри города, перемещения людей, геомаркетинг и так далее. От размещения объектов внутригородской среды до идентификации педофилов, насильников, маньяков и всяких нехороших ребят.
Честное слово, никакими оппозиционерами мы не занимались. Может, нам не говорят об этом в лицо. На самом деле это очень большая проблема – сотрудничество с «госами», потому что не всегда же объясняют, что за задача. Тебе говорят: сделайте софт для идентификации домохозяек, а они на самом деле что-нибудь другое с ним собираются делать – у них там всё ломается.
Плюс, государство – это очень интересный и странный клиент, который постоянно пытается какие-то три копейки вставить в твоё исследование, и зачастую их подходы и понимание машинного обучения очень поверхностные. Например, у меня есть отдельная лекция об ошибках машинного обучения. Я там всегда привожу в пример, когда мы делали систему прогнозирования преступности в Подмосковье, заказчик сказал: там, где продают арбузы, увеличьте, пожалуйста, коэффициент раза в четыре. А потом на самом деле оказалось, что места продажи арбузов нифига некриминальные. Это просто ошибки того, что человек вносит свои мысли.
Короче, государство – прикольный клиент, там очень много интересных задач. Большинство сводится к подобным моделям прогнозирования чего-нибудь. Чаще всего это какая-то городская инфраструктура.
З: – А есть ли источники, где можно проследить за вашими исследованиями? Много информации. Как я понимаю, много её ещё за бортом осталось. Ваши страницы, ещё что-то…
АХ: – У меня нет личных страниц.
З: – Наверное, в «Фейсбук» уже закрыли?
АХ: – Где-то четыре месяца назад была история: они нам всем прислали такие большие письма, что «вы – уроды, Кремлю продаёте всё, нарушаете все правила «Фейсбука». Даже собаке моей прислали письмо: «Hello, Марс блу-корги, ты данные собираешь!» и так далее. Слушайте, у нас ребрендинг сейчас. Недели через две-три у нас сайт и всё обновится. За этим можно будет смотреть. Но мы очень ленивые просто в этом плане.
Как можно определить надёжность VPN?
З: – Вы когда говорили, что зашли бы в кафе, не идентифицируясь там под своим номером телефона. А под каким?
АХ: – Нельзя говорить – под чужим, потому что это призыв к нарушению регламенту идентификации. Нет-нет-нет. Я шучу. Сейчас практически все кафе идентифицируют всё подряд – там не только номер телефона, там есть куча пикселей, там идентификация устройства, мак-адрес и чего там только нет, для того чтобы потом это использовать – от рекламных целей до оперативно-розыскных мероприятий. Поэтому с такими штуками нужно быть очень осторожными. Вы не только можете что-то написать, а с вашего устройства могут написать, а потом что-то произойдёт.
Вы, может, видели историю о том, что сейчас делают расследование, как (в Белоруссии, кстати, тоже) сдают аккаунты «Фейсбука» в аренду, типа для реклам казино. А по факту неизвестно для чего, ещё и доступ к компьютеру дают. Вот таких штук нужно максимально опасаться. Если вы решите откуда-то что-то анонимно написать… Я пришёл бы в кафе и врубил бы VPN какой-нибудь крутой. Но на самом деле (опять же, ни на кого не показываю пальцем), когда будете аккаунт создавать в VPN’е, вы проверьте, кому принадлежит этот VPN, какой компании, кому эта компания принадлежит и так далее. Потому что большинство игроков рынка VPN не совсем хорошие ребята.
Ну ладно, в Белоруссии это неважно. В России хороший VPN проверяют по тому, заблокирован ли там azino777, или нет. Потому что, если нет, то велика вероятность, что в течение недели этот VPN-сервис закроют. В общем, проверяйте всё.
Об автоудалении сообщений
З: – Вы так много говорили про личные сообщения, что их социальные сети читают… А вот, например, у «Фейсбука» есть секретные личные сообщения, которые можно поставить (кроме того, что они ещё и шифруются) на уничтожение. Как вы это можете прокомментировать?
АХ: – Никак. Я, во-первых, не суперпрофессионал в криптографии, а во-вторых, проблема здесь в том, что сервера «Фейсбука» никто не видел, никто не знает, как это там всё работает. Условно, в какой-нибудь спецификации написано, что это end-to-end шифрование, а оно может не такое быть, или оно end-to-end, но с какими-то там погрешностями или ещё с чем-нибудь. Такой штукой есть смысл воспользоваться, если вы боитесь, что тот человек, которому вы это отправили, в какой-то момент попытается что-то сделать.
В «Телеграме» есть удобная функция для отправки интимных фотографий, которые самоудаляются: когда ты пытаешься сделать скриншот, она автоматически удаляется. В «Айфоне» же появилась функция записи видео с экрана, и записать видео с экрана можно и так далее… Мне просто очень часто присылают материалы с этой функцией (автоудаление) – я никогда не понимаю зачем. Я же могу сразу скачать! Это всё на ваше усмотрение.
Социальный рейтинг в Китае: мифы, реальность, перспективы
В: – Я на самом деле немножко злоупотребляю, хотя мне VPN не нужен (кстати, VPN у нас проверенный). А вопрос про этику. У нас есть прекрасный друг из Казахастана, мы его тоже привозили с лекцией. Как-то с ним сидели на какой-то конференции, где рассказывали про разные вещи, и он говорит (а он занимается кибербезопасностью, то есть в чистом виде инженерной безопасностью, человек, которому интересны технические решения): «Вот, вернулся из Китая. Они там такую классную штуку делают – социальный рейтинг». Ты, кстати, что-нибудь исследовал по этому вопросу, как это работает у них?
АХ: – Мы в России скоринг продаём, я много про это знаю.
В: – Вот у меня и вопрос, что бы ты об этом побольше рассказал – о том, что нас, возможно, всех ждёт в будущем. Но ещё вопрос про этику. Он так радостно говорил: «Интересное инженерное решение!» У тебя есть свой кодекс этики?
АХ: – Да, кстати, есть. Два года назад мы его ввели – как раз после истории с Милоновым мы решили как-то ранжировать эти проекты. Возвращаясь к рейтингу: это один из суперпопулярных вопросов, потому что СМИ очень сильно демонизируют всю эту историю – что людей за границу не выпускают, убивают лазером с Луны. Я вам привожу, опять же, инженерные штуки…
Если вы начнёте копать эту историю, посмотрите, что за параметры входят в этот социальный рейтинг, вы поймёте: в него входят закрытые алименты, судимости, кредитная история, то есть штука с инженерной точки зрения реально офигенная. Ты живёшь, не нарушая закон, живёшь хорошо – тебе дают низкую ставку по кредиту. У тебя важная социальная работа (например, учитель) – тебе дают годное жильё. Всех сначала это смутило, потому что просочились сначала историю, что если ты будешь плохо писать про президента, то тебе этот рейтинг снизят. Хотя доказательств не было. В защиту рейтинга скажу, против рейтинга скажу, что и алгоритма никто не видел, какие параметры там по факту используются.
Потом появилась история, что более миллиона человек не выпустили за границу, запретили выезд. На самом деле это не совсем точная формулировка. Вы когда визу получаете (например, в Европу), вам виза даётся из расчёта «70 евро в день» (что-то такое); если вы справку о доходах не дадите, то вам визу не дадут. В Китае местный МИД решил пойти чуть дальше: он просто сразу предупредил людей, у которых недостаточно денег, о том, что, если вы захотите поехать за рубеж, денег у вас не хватит. Соответственно, это всё потом направили в концепцию, что бедных не выпускают за рубеж. Это сложная этическая штука, она граничит на некой презумпции виновности-невиновности, но по факту я не могу дать оценку.
Убивают люди, а не Орудие
Главное, что нужно понимать: все эти алгоритмы, которые осуждает общество – проблема не в алгоритмах. Алгоритмы просто позволили очень быстро анализировать большой «объём» людей, и эту проблему социальную подняли наверх. То есть бот «Майкрософта», который обучился на твитах и стал расистом – это же не бот виноват, а твиты, которые он читал. Или компания, которая решает построить модель идеального сотрудника, проанализировав текущих, и оказывается, что это белый, гендерно – мужчина с высшим образованием.
Это же не модель – расист, сексист или ещё что-то; это – люди, которые наняли этих людей (правы, не правы были – неважно). Всё просто граничит с тем, что искусственный интеллект – злой, плохой, и он мир уничтожит, но на самом деле… Если условно сейчас, например, российское правительство примет закон о том, что оппозиционерам не давать бесплатное образование, и там напишут софт, который идентифицирует и лишит их этого образования бесплатного – это ж не алгоритм будет виноват. Хотя никто эту мою концепцию не поддерживает, потому что, – когда я говорю, что не Орудие убивает людей, а люди, – «ты фашист» и так далее.
В общем, это реально очень крутое инженерное решение. Нужно понимать, почему этого, например, в России не будет. У вас [в Белоруссии] этого не будет, потому что вы – европейское государство, у вас всё хорошо. В России этого не будет по многим причинам: во-первых, у нас не такой уровень доверия к правоохранительной системе, как в Китае; у нас далеко не такой уровень цифровизации. В Китае почему всё получилось? Потому что правительство: у них – цифровая медицина, цифровое страхование, цифровая полиция. И кто-то умный додумался: давайте это всё сложим и сделаем – по сути это программа лояльности. Там больше плюшек, нежели «не плюшек».
Поэтому да – я думаю, что в России это не введут. Нужно сначала отцифровать весь Минздрав (а это задача на 50 лет) – кто-то должен жизнь положить, чтобы это сделать, а никто, естественно, делать этого не будет. С другой стороны, банки российские – передовые в мире по скорингу людей, они чего только не делают: «Ага, мужик? Девушек молодых лайкаешь? Вот тебе карта кредитная на любовницу». Там очень всё продвинуто. Например, в Америке практически везде скоринг подобный запрещён, потому что там есть законы, по которым банк тебе обязан объяснить, почему: «Ага! Потому что компания Social Data Hub за 10 лет хранит историю, и вот – то-то и то-то выдало о тебе»! И давай-ка ты засудишь и одних, и других! А у нас подобных историй нет.
Почему замалчивают статистику?
Я в принципе поддерживаю скоринг, если это не какая-то «тоталитарная» история. Но весь вопрос в том, что его невозможно предугадать, оценить. Это самая сложная история в этике больших данных – предугадать социальный эффект, который будет там через 15 лет. Вот я, например, очень долго умоляю прокуратуру открыть информацию о преступности. Данные криминальной статистики – это один из краеугольных камней любой статистики; все этого очень хотят. Но, например, в России криминальную статистику не открывают по очень простой причине: боятся нарушить демографию внутри городов. Считают, что люди перестанут жить в каких-то городах, даже внутри города всё как-то перераспределится. По этой же причине не раскрывают статистику ЕГЭ – сами понимаете, что в какие-то школы люди пойдут, в какие-то не пойдут.
Возможно, это правильно, возможно, и нет, но было много проектов… Например, «Яндекс» одно время (опять же, по «жёлтым» слухам, не видел, не знаю) решил в модель прогнозирования «недвижки» добавить количество атак на таксистов, то есть некий такой подход к уровню криминала, посчитав количество жалоб таксистов на то что их кто-то домогался, угрожал и так далее. Быстро свернули внутри компании, чтобы подобные вещи не делать.
З: – Вы общаетесь со студентами, общаетесь с аудиторией в своей стране, у нас в стране. Вы заметили по числу вопросов из зала, что мы ещё на той стадии развития, когда мы думаем, что нам нужна конфиденциальность, что мы можем спрятаться от кого-то, свои данные защитить, не предоставив их, спрятав, зашифровав. Если Европейский союз уже перешёл к следующей стадии, стадии приватности, которая подразумевает контроль над данными – заставить всех, кто твои данные собирает, предоставить тебе действенный контроль над ними… По выборкам по регионам, по социальным слоям – какая из категорий граждан, людей, больше уже перешла на второй этап, либо кто ещё сидит на первом в основном?
Кто больше всего озабочен безопасностью персональных данных?
АХ: – Тотальное большинство… Я бы сказал: всем насрать! Это волнует сейчас топ-менеджеров. По городам в России – это Москва и Санкт-Петербург. Активный центр – это айтишники, дизайнеры, креативные профессии, все, кто умеет фильтровать контент, получать новые знания, с высоким уровнем интереса к международным проблемам. В основном это топ-менеджеры; да, айтишники (не считая специалистов по безопасности); банкиры – то есть все люди, на которых утечка данных может как-то повлиять.
Если, например, украдут данные какого-нибудь домохозяина из какой-нибудь Калуги: вряд ли у него в жизни что-то серьёзно поменяется, если у него кто-то украдёт, например, доступ к gmail’у, где он доступ к сериалам хранит. Вопрос в том, что закон всех равно защищает, и это правильно, потому что… с точки зрения закона все равны – ха-ха… но самое главное, что невозможно понять, чьи данные сколько будут стоить, пока эти данные не пропадут – к сожалению, очень сложно спрогнозировать. Но в основном такая категория граждан.
Телефон – в фольгу!
Я единственный раз в жизни видел поголовное хранение всего и вся в двух компаниях. Одна – это крупнейший интегратор по информационной безопасности: там всё, вплоть до USB, клеем заклеено внутри офиса; и люди там такие же ходят – я там встретил человека, у которого телефон в мешочке из фольги. Я узнал, что есть компании, которые торгуют специальными такими мешочками. А второй раз я увидел подобную историю в «Блумберге» у сотрудников: мы стояли в курилке, и кто-то где-то фотографировался, и один из них – «Так, чтобы нас там видно не было на заднем фоне!» Я такой думаю: «О, ничего себе»!
«Лучше мы, чем ФСБ»
Не хотелось бы говорить, что это менее одного процента населения, но, к сожалению, в общей массе практически всем всё равно. Но с другой стороны, у меня есть скандальный сервис по контролю действий несовершеннолетних (давно мы его запускали под слоганом «Лучше мы, чем ФСБ»), чтобы предупредить родителя о том, что несовершеннолетний творит трэш, перед тем как наш же алгоритм, установленный где-то там, к нему кого-то отправит.
При верификации ребёнка нужно присылать скан паспорта (это в принципе нормальная практика), но мы написали, что вы можете обрезать номер паспорта, потому что нас он не интересует; нас интересует только ваша фотка, голограммка и имя-фамилия. И практически 100 % людей – ну, где-то 95 паспортов из 100 – люди в «Фотошопе» аккуратно вырезали эти номера и отправляли только нужную часть. То есть они поняли – ага, раз им не нужно, то не нужно это и присылать. На мой взгляд, это прям какая-то реальная подвижка, на которую их подтолкнуло недоверие к нам.
З: – Выборка такая – определённая. Там же люди, которые обращаются, они уже продвинутые.
Люди не хотят, чтобы за ними следили, но не читают соглашения
АХ: – Да. А вторая такая же штука: мы в тест в конце того года запускали приложение для знакомств (скоро его перезапустим). Там была контрольная группа в 100 тысяч человек. И там по подходам GDPR в личном кабинете было 15 галочек – я даю разрешение на анализ взаимодействия с интерфейсом, на доступ к моей демографии, на доступ к трёхмерной реконструкции лица, на доступ к моим личным сообщениям и так далее. Мы максимально расписали всевозможные доступы. Даже где-то есть статистика, кто на что ставил галочки. 98 % оставили по умолчанию проставленными все галочки (притом что они заходили на эту страничку и видели это всё, но им наплевать было), а вот эти 2 % интересно было проанализировать на то, что для людей было приоритетно.
Все убрали разрешение на доступ к личным сообщениям и практически все убрали разрешение доступ к данным сексуального теста (что им там нравится, что они там заполняли, свои извращения – шучу). Но это людей пнули в эту, ткнули: им интерфейс говорит – внимательно прочитай это, даёт возможность проскролить это соглашение до конца. Но это было сделано исключительно потому, что это был исследовательский проект, и все были предупреждены. Ни одна компания, включая нас, когда выпустят это приложение в открытый доступ, не будет заставлять человека читать это сообщение до конца, потому что… ну, извините, так это всё работает.
При условии того, что они зашли к нам, зная, чем занимается компания, зная, что они зашли в сервис, который будет тебе предлагать кандидатов на основании того, какое ты порно лайкаешь – даже на основании этого только 2 % прочитали эти галочки и вообще что-то сделали. И то практически никто из них не снял галочку «Доступ к трафику и данным о посещении других веб-страниц». В основном всех волновали личные сообщения.
Обнажёнка и посадки за лайки – интересные законы братских республик
З: – У меня вопрос по защите данных. Можно носить телефон в фольге, делать вид, что их нет… Потом оказывается, что ты вроде как сохраняешь, сохраняешь, но потом ты должен свои данные отдать государству, потому что оно с тебя требует, и ты никак не можешь… И тут получается, что господрядчики все насквозь дырявые. А в Белоруссии ещё такая норма есть: если я проверю безопасность своих личных данных (кое-что подправлю и получу доступ к ним), то я сразу уголовник. Та же самая статья использовалась, чтобы журналистов по «делу БелТа» обвинить в том, что они получили несанкционированный доступ к данным (можете сами почитать). Вот, собственной, и вопрос: является ли эффективной мерой для приватности, вообще для безопасности частных данных такие ограничения?
АХ: – Я понял. В Белоруссии есть много очень интересных законов. Я буквально недавно узнал… Я вот всё шучу про передачу обнажёнки, а у вас это, оказывается, запрещено.
З: – Демонстрация запрещена!
АХ: – Это вообще как-то странно.
З: – Смотреть можно, передавать нельзя, лайкать нельзя. Смотреть вместе нельзя!
АХ: – Я на ваш вопрос отвечу. Вернусь к теме «сидят за лайки» в Москве. В России это тема номер один. Не знаю, как в Белоруссии, но, честно говоря, государство… Если статистику анализировать, в Москве 95 посадок за лайки из 100 – это когда люди нажаловались на людей, кто-то пишет на прокуратуру на другого человека. Государство очень редко возбуждает подобные дела. Мне кажется, что этот закон – абсолютно абсурдный. Не знаю ни одного реального преступника, которого за этого посадили. Но эту меру используют, чтобы хоть что-то человеку вменить. Мне кажется, что это максимально странно. Думаю, что когда-нибудь это отменят.
З: – Это называется под колпаком держать.
АХ: – Ну-у-у, окей… Не могу сказать. Я не совсем прям прогосударственное чудовище, но моё восприятие немного изменено, знаете, людьми, которые приходят к нам и говорят: «У меня ребёнок пропал, помогите найти». Я говорю: «Я не могу ничего сделать без разрешения суда». Ты смотришь на этих родителей, которые всё в своей жизни отдали бы, любой доступ к любым данным дали – только чтобы решили их проблему. Поэтому мне очень сложно подобную дискуссию вести: с одной стороны, я считаю, что и государство правильные вещи делает, когда реальных каких-то людей ловит, а с другой стороны, давать бесконтрольный доступ – это вообще жуткая история.
Возвращаюсь к вашей штуке, «сори», что отвлёкся. Я в пакетики из фольги не верю вообще. Иметь мобильный телефон и оборачивать его в фольгу – это какая-то глупость. Ради чего это делать? Ради того, чтобы телефон к «вай-фаю» не подключался? Проще его выключить. Чтобы мобильный оператор тебя не идентифицировал? Они итак всё равно могут сигнал триангулировать, как-то посчитать это. Для меня единственные эффективные меры безопасности – это хранилище, защищённое, типа локальной сети – может, в квартире, где можно что-то хранить.
З: – Тут вопрос по законодательству. Является ли законодательство репрессивным по отношению к человеку, которые хочет проверить свои данные?
АХ: – Я понял, да. Я даже не знал про эту штуку, поэтому не могу вам точно сказать. В России такого нет, хотя там всё очень сложно. Наверное, можно проконсультироваться с квалифицированными юристами и, возможно, есть какая-то лазейка – может, в какой-то Европейский суд подать… Нет? Не могу вам про это сказать. Мои знания в праве поверхностны, на уровне руководителя компании. Я знаю, чего делать нельзя, чтобы тебе никто ничего не сказал. Это, конечно, очень печально.
З: – Я к тому, что в других странах (например, в Штатах) нормальная практика, что ты можешь протестировать какую-то уязвимость, а потом о ней заявить, но не разглашать.
АХ: – Да, «баг-баунти». Я понял, есть такое.
З: – И у компаний нет механизма, чтобы тебя убрать, потому что это дешевле.
АХ: – Эта штука тоже граничит на уровне закона. Смотря как вы эту уязвимость найдёте. Мне кажется, что большое количество денег, выплаченных за эту уязвимость, в Америке были выплачены под соглашение о неразглашении и под угрозами засудить этого человека. Тоже как бы свечку не держал. Мы всегда рискуем такой штукой. У меня сотрудники пару раз находили подобные уязвимости во всяких госприложениях – я всегда говорю: «Отправьте анонимное письмо лучше, чем вы им скажете, что дырка там». А потом какой-нибудь НИИ придёт, который этот сервис поставил… В общем, дальше продолжать не буду.
Проверить бизнес на честность не получится: не нравится – не пользуйся
З: – Такой вопрос. Вы сказали, что провели опыт – 15 галочек надо было поставить… Допустим, пользователь отменяет все галочки. Кто и как проконтролирует это? Как это проверить вообще?
АХ: – Честно вам скажу: никто и никак. Серьёзно. То, что вы у «Гугла» поставили-сняли галочку «Запрет рекламного отслеживания», вообще это ничего не значит. К сожалению, даже когда вы во «Вконтакте» ставите запрет индексации поисковиков, поисковики всё равно это индексируют, а потом просто не выдают эти результаты определённым людям. Это всё на уровне отсутствия компетентных органов, которые не могут это проверить. Плюс, компании, которые это делают, – частные. У «Фейсбука» правильная или неправильная позиция, она у них одна: не нравится – не пользуйся.
О регулировании
З: – У меня только один простой вопрос. А как вы относитесь к вопросу регулирования в обработке данных, саморегуляции?
АХ: – Я, как представитель компании, считаю, что рынку, бизнесу нужно саморегулирование. Я верю в то, что ассоциация больших данных может сама всё зарегулировать сама, без государства. Я очень не доверяю государственному регулированию и очень не доверяю всем историям, когда государство что-то хочет хранить у себя, потому что каждый кейс показывал, что это очень плохо. Обязательно кто-нибудь приклеит логин и пароль на жёлтый стикер на монитор и так далее.
В общем, я верю в саморегуляцию. Плюс ко всему верю, что в ближайшие 5 лет мы придём к некой открытости. Даже сейчас вы это уже видите по новостным инфоповодам, что государству очень сложно врать пользователям, пользователям очень сложно врать системе. И это, в принципе, наверное, хорошо. Раз уж у нас сотрудников разведок по фоткам публичным вычисляют
Всё это ведёт к снижению, наверное, уровня преступности. Ну, чисто математически. Если кому-то интересно будет проговорить о снижении уровня преступности – там очень много есть всевозможных выводов, которые можно сделать. В общем, я за саморегуляцию рынка. Спасибо!
Для просмотра ссылки необходимо нажать
Вход или Регистрация