Google боты «читают» почту и файлы пользователей для развития своего ИИ

В кратце: Облачные провайдеры активно добывают информацию о пользователях из его почты, документов, фотографий, перемещений, контактов, чатов и других видов деятельности с целью развития своих услуг, но иногда это выходит из под контроля и в итоге эта информация может попасть к другим лицам, использована для влияния на вас либо для обучения ботов искусственного интеллекта. Если вы обеспокоены сохранностью ваших персональных данных и конфиденциальных документов с которыми вы работаете в сети тогда вам следует практиковать мульти-экземплярный подход либо использовать дополнительное шифрование почты, google drive, yandex диска и других онлайн служб.

Уже давно, и совсем незаметно для своих пользователей Google начал внедрять «чтение» электронных писем в почтовой службе gmail. В начале это делалось для борьбы с вирусами а теперь и для машинного обучения алгоритмов Искусственного Интеллекта над которыми работает google. Например если вы заказали авиа билет или забронировали гостиницу и при этом использовали электронную почту Gmail, то информация об этом тут же появиться в Google календаре и Google картах. Google сервисы также «читают» все файлы которые вы получаете или отправляете по почте. Другой пример — google может распознать дату и пункт назначения из билета в PDF документе. Картинки, документы, таблицы и фотографии хранимые на облачном диске google drive также анализируются на предмет «опасного» содержимого либо с целью предоставления быстрого поиска или сортировки.

Конечно данные функции помогают пользователям, но при этом необходимо четко осознавать что вся информация полученная из ваших файлов, почты, фотографий, веб-поиска а также ваше поведение в сети, используется google не только как товар но и как улики для детального расследования инцидентов на уровне национальной безопасности. Также стоит упомянуть что участились случаи взломов, атак и утечки личных данных в крупных компаниях.   

Зачем google собирает и хранит так много  данных?

Для того чтобы продавать много рекламы необходимо знать все о потребителях. Google в этом стремлении старается всюду «сопровождать» пользователей чтобы на каждом шагу понимать что может вам понадобиться сейчас или в будущем: сервис, товар или услуга. Приведем список сервисов где google собирает данные:

  • Почта Gmail — интересы, друзья, работа, учеба и семья. 
  • Google drive — интересы, друзья, бизнес, учеба.
  • Браузер Chrome — интересы, здоровье, покупки, работа.
  • Телефон Android — передвижения, интересы, друзья, досуг, здоровье. (google maps, google photo, gmail, google drive, keep, fit)
  • Умные колонки Google Ассистенты — Семья, интересы. 

Как видно, в случае использования телефона с Google Android, со всеми сервисами зарегистрированными на личной почте в gmail, google может отследить практически все аспекты вашей цифровой жизни деятельности в трех измерениях: Семья, Работа, Хобби\Отдых. Благодаря gmail и популярной возможности «поделиться» данными в Photo, Drive, Maps — google может воссоздать вашу сеть знакомств даже лучше чем facebook или Вконтакте.

Распознавание голоса
Если вы используете голосовой набор текста, например диктуете голосом SMS , то система Android тут же отправит ваше произношение на сервер чтобы он распознал текст из аудио записи.  В итоге сервер сохранит это аудио и текст набранного СМС , таким образом он будет знать как звучит именно этот текст, и это поможет ему распознавать голос в будущем для вас и других людей. Кстати по умолчанию он будет хранить эти аудио записи в облаке и вы даже можете их прослушать. Обычно никто не выключает эти настройки, так что google уже знает как разные люди произносят один и тот же текст. И Наверняка Искуственный Интеллект уже учиться говорить вашим голосом. 

Определение координат
Вы знаете что google хранит координаты всех WiFi точек доступа в мире? Это означает что если вы подключитесь к любой точке доступа, которая работает более недели, то google будет в состоянии узнать где вы находитесь. В начале это делалось чтобы лучше определять координаты телефона. Теперь они это делают чтобы получить координату телефона даже если вам этого не надо в данный момент. Например когда вы фотографируете, то Android по умолчанию эти координаты запишет в JPG  файл фотографии. Таким образом google может например выяснить кто именно посещает какой то определенный адрес, или кто туда входил за определенную дату. Но google также хранит у себя информацию о том как каким WiFi точкам и GSM сотам был подключен телефон в течении дня и  легко может сопоставить эти данные с временем создания фотоснимка и получить местоположение сьемки.

Распознавание лиц и предметов на фотографиях
Сервис Google Photo уже готов предложить вам услугу по сортировке фотографий в зависимости от того в каком месте вы сфотографировались или с кем из друзей вы фотографировались. По умолчанию координату места сьемки записывает в JPG файл ваш телефон, причем даже без включенного GPS. Чтобы он координата не сохранялась , необходимо снять галочки в настройках камеры. Но google все равно это может выяснить поскольку он всегда сохраняет информацию какое устройство и когда сделало фотографию и может сопоставить это с координатами WiFi точек и GSM антен к которым был подключен телефон. И как доказательство мы видим что всетаки Google Photo указывает места сьемки даже без координат в JPG файлах. 
Функция Группировка Людей, распознает схожие лица и предлагает вам подсказать Какому лицу соотвествует какой почтовый адресс. На этом шаге вы добровольно идентифицируете личность человека. У себя в облаке google может обьеденить эти знания и узнать в лицо многих людей из разных стран и постоить взаимосвязи между ними.

Персональный помощник.
Гугл выпускает ассистента Google Home — система которая предназначена быть вашим другом и помощником. Для нее требуется идеальное распознавание голоса и способность поговорить с вами, отвечая на любые вопросы. А для этого ей необходимо все о вас знать. 

  • В фильме «Она» (Her, 2013) мы можем наблюдать характерный диалог между Человеком и его персональным Ассистентом:
    Ассистент: Ты не против, если я наведу порядок в твоей почте? 
    Человек: Не против, давай.
    (прошло 10 секунд)
    Ассистент: Знаеш, я нашла много старых писем , которые больше тебе не пригодятся, ну там — реклама, подтверждения доставки, заказы пицы, билетов. Можно удалить?
    Человек: Да конечно.
    Ассистент: Готово. А еще я вижу что ты не ответил на письмо твоей мамы, месяц назад она тебя спрашивала Как твои дела? как твоя книга?
    Человек: Да все ни как не было времени.
    Ассистент: Давая я отвечу, что все хорошо, книга продвигается.
    Человек: Да давай… 

В 2017 году политики высшего ранга и топ бизнесмены высказались об Искусственном Интеллекте как о ядерном оружии 21го века. А если проанализировать последние достижения в ИИ , то станет очевидно что «Большие Данные» это один из важных ингредиентов для изготовления Искусственного Интеллекта (ИИ). Наши поступки, высказывания, предпочтения отпечатанные в электронном виде — это идеальное руководство или инструкция к действию для Программ-Роботов. Просто нужно правильно научить их пользоваться этим. И они смогу поступать как Люди — только в сотни раз быстрее и масштабнее, скажем как небольшая армия.

Какую роль играют Большие данные в разработке Искусственного Интеллекта

Что особенно характеризует Интеллект так это способность с высокой вероятностью предсказывать исход событий. В такой задаче как вождение машины, предсказывание ситуации даже на 10 секунд вперед уже является прогрессом. А при прогнозировании погоды 1 день это обычное дело в наши дни.

Один из разделов в ИИ это машинное обучение. Чтобы образно показать как обучение работает с Большими Данными,  приведем примеры. Чтобы обучить машину Играть в Игру необходимо показать ей как бы это делал человек. Для этого необходима очень большая подборка игр которые играли много человек и исход в различных случаях. Чтобы научить машину предсказывать поведение человека, необходимо показать ей пример как миллионы людей поступали в такой же ситуации, в таком возрасте, при схожих обстоятельствах. 

Информация о том, что покупают, что читают и как общаются миллионы людей образует собой основу для Машинного Обучения и создания Искусственного Интеллекта.

Как уменьшить уровень вашего отслеживания?

В теории эта проблема называется Агрегация и Инференция данных (добывание информации). А противодействие этому — Много-экеземплярность (или Polyinstantiation —Полиинстанция) это способ защиты от «Отслеживания» при этом вам необходимо разделить ваши информационные потоки по нескольких независимым каналам.

В данном списке мы попробовали привести пример возможного разделения деятельности пользователя на 6 каналов, по которым обычно отслеживается его деятельность:

  1. Почта — Yandex Почта, Mail.ru, Proton Mail,
  2. Телефон — если Google Android, то в качестве регистрационного gmail — использовать отдельный, не используемый для почты, пустой gmail аккаунт.
  3. Хранение фотографий онлайн — Shoebox, Ever, Yandex Диск.
  4. Карты и навигация — Maps.me, или отдельный Android телефон с отдельной учетной записью gmail.
  5. Браузер — переход на FireFox, Yandex Browser
  6. Онлайн документы — Microsoft Office 365

Мы намеренно не указали здесь Facebook, VK, Instagram поскольку само по себе их использование означает добровольную и явную передачу вашей цифровой жизнедеятельности (персональной информации подкрепленной поступками).

Чтобы найти другие альтернативы любому сервису можно воспользоваться поиском , например «Google maps alternative».

Как сделать так чтобы Google drive не смог просматривать содержимое ваших файлов? 

Защита вашего онлайн контента от просматривания онлайн службами типа google drive, yandex диск, это очень мощный инструмент от отслеживания. На самом деле есть надежный способ защиты файлов хранимых в облаке от самих провайдеров — Шифрование на стороне клиента.

Чем это отличается от Шифрования которое анонсирует DropBox или Google Drive в своих возможностях:

  • Онлайн Службы шифруют ваши данные чтобы контролировать доступ к ним внутри своих подразделений. Поскольку данные с одного акаунта могут храниться в разных ДатаЦентрах, На разных Серверах в разных дисках, к ним имеют логический и физический доступ много сотрудников внутри компании.

Наша утилиты Rohos Disk, Rohos Mini Drive также позволяют создать полностью зашифрованные контейнеры либо зашифрованные папки внутри Google Drive, DropBox, MS One Drive или Yandex Диска.