Facebook отключил в России несколько десятков аккаунтов, связанных с компаниями Social Data Hub и Fubutech, которые соцсеть заподозрила в скрейпинге — непредусмотренном соглашением сборе и анализе данных пользователей. Аккаунт основателя компаний Артура Хачуяна тоже недоступен. Рассказываем главное о компании, которая делает с данными из соцсетей все — от таргетированной рекламы до поиска призывников и закладок.
Хачуян рассказал изданию Inc., что на адрес зарегистрированной в Ирландии Social Data Hub пришло письмо от Facebook, в котором соцсеть обвинила компанию в сборе и продаже данных пользователей Facebook и Instagram в обход правил Facebook.
Как пишет издание, приводя примеры нарушений, Facebook сослался на интервью Хачуяна, где тот говорит, что не только собирал данные без согласия пользователей, но и сотрудничал с государственными структурами, корпорациями и медиа. Сам Хачуян сказал, что не знает, что это за интервью. «У Facebook есть основания полагать, что вы заключили сделку с властями, включающую сверку фотографий из личных аккаунтов пользователей для их идентификации», — говорится в письме.
Соцсеть потребовала прекратить продавать властям данные пользователей и до 12 октября предоставить полный список данных Facebook, которые компания использовала. Чтобы проверить это, Facebook потребовала представить доступ к хранилищам. Хачуян заявил, что его компании занимаются разработкой софта для анализа данных и продает его клиентам. «Что они с нашим софтом делают — это уже их дело. Пусть Facebook пишет в Кремль», — сказал он. Он добавил, что удалять данные и присылать логи он не будет, а привлечь компании к ответственности невозможно, так как у нее слишком много данных, и доказать, откуда их получили, невозможно.
Как ранее писал Inc., Social Data Hub Хачуян создал после того, как в 2014 ушел из рекламного агентства «Апостол» Тины Канделаки вместе с отделом кибернетики. В то время как Social Data Hub занимался данными широкого профиля, используя слоган «испытай дата-оргазм» и сайт на домене .sexy, Fubutech является более серьезной компанией: она помогает чиновникам искать диссидентов и сотрудничает с крупными корпорациями.
Издание отмечало, что «американским коллегам для получения информации из Facebook пришлось налаживать сеть приложений, ворующих персональные данные. А для SocialDataHub хватает и открытых данных из сети «ВКонтакте»: членство в группах, аудиозаписи, фотографии, списки друзей и прочее». Для поддержания актуальности данные скачивают 24/7. «Бумаге» Хачуян рассказывал, что сначала данные в соцсетях собираются специальными алгоритмами, потом попадают в хранилище, а там уже анализируются с помощью скриптов.
Хачуян говорил, что компания работает с госорганами по вопросам «поиска педофилов, дезертиров и других плохих людей», поэтому многие сотрудники невыездные. Один из примеров поиска дезертиров он часто приводит в своих лекциях: человек, который удалил себя из соцсетей после получения повестки в армию и переехал в другой регион. Social Data Hub нашла его с помощью технологии распознавания на фотографиях других людей — и он все-таки отправился в армию.
«Я делаю людей счастливыми. Особенно рекламных агентов, банкиров, полицейских», — говорил Хачуян Esquire. На лекции в Фонде Егора Гайдара Хачуян рассказывал, что поиск данных в открытых соцсетях использует и он сам: «До социального терроризма еще далеко, но у меня много таких историй, когда ЖКХ мне не отвечает на звонок, я нахожу в соцсетях главного инженера, его жену, детей и начинаю им всем писать», — рассказывает он.
Компания работает и со СМИ, помогая в расследованиях. Например, аналитики по технологии распознавания лиц по фотографии его оторванной головы нашли в соцсетях аккаунты главного подозреваемого в деле о теракте 3 апреля 2017 года в Санкт-Петербурге Акбаржона Джалилова.
Среди клиентов есть и банки. «Если я, например, работаю с банком, мы продаем ему не факты о клиентах, а мою персональную аналитику кредитной способности человека. И с этим ничего уже не сделать: банк просто передает тебе страничку в соцсети, и я говорю, что этот парень вряд ли вернет кредит. Как я это сделал, на основании чего — никто никогда не сможет доказать», — рассказывал о своем алгоритме Хачуян.
Большой резонанс вызвал запуск сервиса «Родительский контроль», который позволяет родителям следить за активностью детей в социальных сетях. Его лозунг — «Лучше мы, чем ФСБ». Сервис позволял анализировать лайки, подписки, фотографии и комментарии и получать уведомления, если алгоритм обнаружит увлеченность ребенка «радикальными идеями» или если у него в друзьях появятся люди, которых подозревают в педофилии. Стоила такая услуга 150 рублей в месяц. Хачуян позднее называл ее попыткой благотворительной акции, которая стала пиар-провалом.
Как писал Esquire, на серверах Хачуяна хранится 9 петабайт информации. Для сравнения: архив крупнейшей в мире Библиотеки Конгресса США, в том числе ее аудио и видеофайлы, весят в три раза меньше. В материале, который вышел в марте 2018 года, говорилось, что алгоритм Хачуяна уже проиндексировал все аккаунты во всех российских соцсетях и заканчивал индексировать Facebook. Хачуян в интервью говорил, что это абсолютно легально. «Я не большой брат, я большое ухо. Я не лезу ни к кому в спальню, а слушаю только то, что люди сами рассказывают о себе», — говорил он. Для защиты своих данных он всегда заказывает еду и такси к соседнему дому, но порнографию смотрит «ВКонтакте» без анонимайзера, объясняя это тем, что знает, какую смотрят все остальные.