Когда мы говорим что компьютеры собирают данные мы имеем в виду что пользователи данные
Сейчас все вокруг твердят про пользу big data. В итоге бизнес пытается работать с масштабными базами данных, но сталкивается с проблемой — все данные разнородные и неструктурированные, перед загрузкой в базы их нужно долго обрабатывать. В итоге работа с big data оказывается слишком сложной и дорогой, а часть данных теряется, хотя могла бы принести пользу в будущем.
Помочь с этим могут data lake — озера данных, которые помогают быстро и недорого работать с большими объемами неструктурированных данных. Расскажем о их особенностях, ключевых отличиях озер от обычных баз данных и о сферах, в которых они будут наиболее полезны.
Иллюзия контроля
Среди специалистов, которые занимаются изучением сбора персональных данных, распространена точка зрения зрения о том, что запрос приложений на доступ к персональным данным — лишь иллюзия контроля. Зачастую приложения находят другие способы получения искомой информации, включая данные о местоположении. Также они могут использовать данные, для которых не нужно разрешение, например уникальные идентификаторы устройств, которые позволяют приложениям собирать данные о том, как и когда их используют. Полученная информация затем попадает к рекламодателям, позволяя им улучшить свои продукты и повысить уровень продаж. Но как еще используют персональные данные?
Наверняка вы не раз слышали истории о взломах и использовании личных данных. Недавно Facebook и Twitter объявили, что персональные данные сотен пользователей оказались в открытом доступе. Причиной послужило требование некоторых приложений Android, загруженных из магазина Google Play, ввести данные учетной записи. Компании получили отчет службы безопасности, согласно которому, набор для разработки программного обеспечения под названием One Audience предоставляет сторонним разработчикам доступ к личным данным, таким как адреса электронной почты, имена пользователей и даже последние твиты. Не исключено, что кто-то мог получить контроль над чужим аккаунтом Twitter, однако доказательств этого на сегодняшний день нет.
Игровые приложения являются одними из самых агрессивных, когда речь заходит о конфиденциальности
Также сложно назвать прозрачными приложения Facebook и Snapchat, так как большое количество пользователей регулярно жалуются на нарушения конфиденциальности. Однако самое печальное заключается в том, что мы ничего не можем с этим сделать. Остается только бойкотировать приложение, если оно вам не нравится или вовсе отказаться от использования некоторых социальных сетей. При этом, скорее всего, в будущем проблема конфиденциальности персональных данных станет намного серьезнее.
Насколько интернет большой?
Для начала можно измерить, сколько информации в нем циркулирует: около пяти эксабайтов в день . Это 40 тыс. двухчасовых фильмов в стандартном разрешении в секунду.
Не обойтись без мощных линий связи. Сотни тысяч километров проводов пересекают страны вдоль и поперек, еще больше тянется по морскому дну и соединяет острова и континенты. Около 300 подводных кабелей (глубоководный вариант по толщине не превышает садовый шланг) держат на себе весь современный интернет. Большая их часть представляет собой связку оптоволоконных нитей, по которым данные передаются со скоростью света.
Длина кабеля сильно варьируется: Дублин с островом Англси соединяют 130 км оптоволокна, а Калифорнию с Сингапуром, Гонконгом и другими городами Азии — Азиатско-Американский шлюз длиной 19 тыс. км.
Основные кабели обслуживают безумное количество людей. В 2008 году повреждение двух морских кабелей недалеко от египетского порта Александрия коснулось десятков миллионов пользователей в Африке, Индии, Пакистане и на Ближнем Востоке.
В прошлом году начальник Штаба обороны Великобритании сэр Стюарт Пич заявил, что Россия может стать угрозой для международной торговли и интернета, если решит уничтожить подводные кабели.
За щитом безопасности
Компания Lenovo первой создала несколько важных решений для безопасности. К ним относится сканер отпечатков пальцев, который теперь является ключевым компонентом биометрической проверки, а также первый чип TPM (Trusted Platform Module) — выделенный микроконтроллер, защищающий аппаратное обеспечение с помощью встроенных криптографических ключей.
Сегодня компания продолжает совершенствовать свои продукты, чтобы предотвратить несанкционированный доступ к личной информации. Так, Lenovo создала для своих корпоративных клиентов комплексную платформу безопасности ThinkShield, которая обеспечивает базовую конфиденциальность, аутентификацию, защиту данных и обнаружение сетевых уязвимостей.
Решение включает целый комплекс инструментов:
- ThinkPad Privacy Guard активизирует защиту экрана от подглядываний через плечо и уведомляет о злоумышленнике, который пытается получить доступ к информации на дисплее.
- Сканер отпечатков пальцев Match-on-Chip помещает биометрические данные в надежное хранилище на чипе FPR, что обеспечивает дополнительную безопасность.
- Защита Smart USB на основе BIOS позволяет ИТ-специалистам настраивать порты USB так, чтобы пользователи не могли «подцепить» вредоносное ПО, а злоумышленники — скачать файлы с устройства.
- Lenovo WiFi Security обнаруживает угрозы и уведомляет пользователей, когда они собираются подключиться к небезопасным беспроводным сетям: механизм распознает подозрительную активность и защищает от взломов.
- Инструмент обнаружения угроз ThinkShield Buffer Zone изолирует вредоносный контент на устройстве от рабочей памяти, реестра и файлов, а также от распространения по сети.
- Технология Absolute Persistence позволяет ИТ-администраторам поддерживать постоянное подключение к пользовательским устройствам, использовать расширенные интеллектуальные ресурсы, автоматизировать защиту конечных точек и соблюдать соответствие нормативным требованиям.
Интегрированная система безопасности охватывает весь жизненный цикл ПК, начиная с разработки BIOS и микропрограммного обеспечения в цепочке поставок и заканчивая вводом в эксплуатацию.
ВКонтакте
Правовой статус ВК по нашему вопросу общедоступных данных - определяется следующими публичными документами:
Если Вы являетесь пользователем ВК или разработчиком, использующим API / SDK, предоставленное Вконтакте, то, это значит, что на Вас распространяются все эти документы и нормы, определенные в них. Все они являются офертами, которые пользователь принимает, совершая конклюдентное действие - регистрацию и это определено, к примеру, в Лицензионном соглашении:
2.2. После заполнения обязательных полей и ознакомления с настоящим Соглашением Лицензиат присоединяется (принимает) настоящее Соглашение, путем нажатия кнопки «Зарегистрироваться» или аналогичной, что по смыслу ст.ст. 435 и 438 Гражданского кодекса РФ является принятием (акцептом) оферты Лицензиара, а равно заключением договора, порождающего у Лицензиата обязанности соблюдать условия Соглашения, в том числе применимых в Социальной сети правил.
Пункт 5.12. данных Правил предупреждает, что данные - могут быть общедоступными для любых пользователей Интернета:
5.12. Пользователь как обладатель информации, размещенной на собственной персональной странице, осознает, что за исключением случаев, установленных настоящими Правилами и действующим законодательством Российской Федерации, Администрация Сайта не принимает участие в формировании и использовании содержания и контроле доступа других пользователей к персональной странице Пользователя. Размещая информацию на персональной странице, в том числе свои персональные данные, Пользователь осознает и соглашается с тем, что указанная информация может быть доступна другим пользователям сети Интернет с учетом особенностей архитектуры и функционала Сайта
Пункт 5.3. Лицензионного соглашения закрепляет позицию ВК, что вся персональная информация может быть доступна всем пользователям Интернета, только уже появляется ссылка на то, что сам пользователь ВК может изменять уровень доступности, но (!) только если сам ВК не изменит функциональные возможности этого:
Лицензиат соглашается на отражение его учетных и иных данных, а также иной информации на Персональной странице Лицензиата в рамках функционала Социальной сети, а также на то, что такие данные будут считаться общедоступными, если иной режим доступа к ним не был выбран Лицензиатом в пределах функционала Социальной сети. Лицензиат соглашается, что информация, включая учетные и иные данные, может быть доступна другим пользователям сети Интернет с учетом существующего функционала Социальной сети (который может изменяться время от времени Лицензиаром). Лицензиар может ограничивать использование третьими лицами информации из Социальной сети, в том числе в коммерческих целях. Использование информации Лицензиаром определяется настоящим Соглашением
2.1. Оказывая услуги по использованию Сайта и его сервисов (далее – Услуги Сайта), Администрация Сайта, действуя разумно и добросовестно, считает, что Пользователь:
осознает, что информация на Сайте, размещаемая Пользователем о себе, может становиться доступной для других Пользователей Сайта и пользователей Интернета, может быть скопирована и распространена такими пользователями
5.2. Размещая информацию на персональной странице, в том числе свои персональные данные, Пользователь осознает и соглашается с тем, что указанная информация может быть доступна другим пользователям сети Интернет с учетом особенностей архитектуры и функционала Сайта . Пользователь самостоятельно определяет режим конфиденциальности и условия доступа к информации, указанной в п.п. 4.2.3 – 4.2.5 настоящих Правил, посредством соответствующих настроек. Администрация Сайта принимает технические и организационные меры по обеспечению функционирования соответствующего инструментария Сайта
Естественно, что так как ВКонтакте исходит из презумпции осознания пользователями своих действий и доступности данных пользователя всему Интернету - ВК не несёт ответственность за последствия публикаций:
Администрация Сайта не несет ответственности за действия третьих лиц, получивших в результате использования Интернета или Услуг Сайта доступ к информации о Пользователе в соответствии с выбранным Пользователем уровнем конфиденциальности, за последствия использования информации, которая, в силу природы Сайта, доступна любому пользователю сети Интернет . Администрация Сайта рекомендует Пользователям ответственно подходить к решению вопроса об объеме информации о себе, размещаемой на Сайте
Кому и зачем нужны озера данных
Озера данных можно использовать в любом бизнесе, который собирает данные. Маркетинг, ритейл, IT, производство, логистика — во всех этих сферах можно собирать big data и загружать их в data lake для дальнейшей работы или анализа.
Часто озера используют для хранения важной информации, которая пока не используется в аналитике. Или даже для данных, которые кажутся бесполезными, но, вероятно, пригодятся компании в будущем.
«Data lake позволяет накапливать данные «про запас», а не под конкретный запрос бизнеса. За счет того, что данные всегда «под рукой», компания может быстро проверить любую гипотезу или использовать данные для своих целей. Например, для оптимизации логистики и эффективного управления цепочками поставок — от более детального планирования и прогнозирования объема продаж до поставок в нужном количестве, нужного качества, в нужное время с минимальными затратами», — Алексей Кулешов, директор департамента организационного развития и технологий ИТ-компании ОТР.
Например, вы используете на производстве сложное оборудование, которое часто ломается. Вы внедряете IoT, интернет вещей — установили датчики для контроля за состоянием оборудования. Данные с этих датчиков можно собирать в Data Lake без фильтрации. Когда данных накопится достаточно, вы сможете их проанализировать и понять, из-за чего случаются поломки и как их предотвратить.
Или можно использовать data lake в маркетинге. Например, в ритейле и e-commerce можно хранить в data lake разрозненную информацию о клиентах: время, проведенное на сайте, активность в группе в соцсетях, тон голоса при звонках менеджеру и регулярность покупок. Потом эту информацию можно использовать для глобальной и масштабной аналитики и прогнозирования поведения клиентов.
Таким образом, озера данных нужны для гибкого анализа данных и построения гипотез. Они позволяют собрать как можно больше данных, чтобы потом с помощью инструментов машинного обучения и аналитики сопоставлять разные факты, делать невероятные прогнозы, анализировать информацию с разных сторон и извлекать из данных все больше пользы.
Исследование ANGLING FOR INSIGHT IN TODAY’S DATA LAKE показывает, что компании, внедрившие Data Lake, на 9% опережают своих конкурентов по выручке. Так что можно сказать, что озера данных нужны компаниям, которые хотят зарабатывать больше, используя для этого анализ собственных данных.
«Компании-лидеры используют передовые подходы к аналитике данных, хранящихся в data lake, например машинное обучение. Для этого подходит информация из различных источников: логи (журналы регистрации событий), данные из социальных сетей, данные с разнообразных девайсов (смартфоны, умные часы, планшеты) и другие. С помощью такого подхода к анализу данных компания может получить полезные инсайты различной природы, вывести закономерности, предположить появление тех или иных сценариев в будущем», — Константин Савчук, управляющий партнер компании Constanta.
Небольшой вывод:
Позиция ВКонтакте логична: каждый сам несёт ответственность за те данные, которые он предоставляет и публикует для публичного доступа, а также ВКонтакте запрещает автоматизированно собирать и анализировать персональные данные из соцсети без разрешения ВК. При этом, пользователь ВК может сам определять какая информация является общедоступной, а какая нет, если ВК разрешает это сделать. Но, правообладатель ВКонтакте может по дополнительному соглашению с какими-либо разработчиками предоставить любую информацию ему и в таком случае ответственность несёт уже сторонний разработчик.
Как понять, что данные собирают без предупреждения?
Бесплатные приложения обычно загружаются трекерами — в конце концов, разработчики должны каким-то образом зарабатывать деньги. При этом пользователям не стоит рассчитывать на то, что такие приложения не будут собирать их данные.
Трекер — система аналитики мобильного приложения с возможностью отслеживания источника установок.
Faceapp уверяет пользователей, что не предоставляет данные правительству РФ
Результаты исследования, проведенного сотрудниками International Computer Science Institute, показали, что платные версии приложений часто имеют те же трекеры, что и их бесплатные аналоги. Исследователи полагают, что мы вступаем в эпоху, когда нельзя быть уверенным в том, что если заплатить за приложение, оно не получит доступ к персональным данным. Игры часто считаются одними из самых инвазивных приложений, не говоря уже о том, что они часто предназначены или специально предназначены для детей, которых следует защищать в соответствии с законами о конфиденциальности, разработанными специально для детей. Специалисты советуют внимательно изучать разрешение игровых приложений перед установкой.
Прежде чем загружать приложения, которые запрашивают доступ к функциям, не имеющим никакого отношения к предоставляемой услуге, ученые советуют подумать дважды. Однако будет еще лучше, если вы решите побольше узнать непосредственно о разработчике. Так, если вы не хотите, чтобы правительство Китая потенциально имело доступ к вашим данным, вам будет интересно узнать, что TikTok принадлежит китайской компании. Представители TikTok утверждают, что компания не хранит пользовательские данные на территории Китая и не делится этой информацией с правительством. Также, приложение FaceApp базируется в России, однако и его разработчики заявили, что не хранят пользовательские данные на территории страны. В свою очередь, представители Вконтакте уверяют общественность, что не предоставляют личные данные пользователей правоохранительным органам, однако количество уголовных дел из-за постов в этой социальной сети свидетельствует об обратном. Так что вам решать, стоит ли доверять подобным компаниям.
Также исследователи рекомендуют периодически проверять настройки телефона, чтобы посмотреть, каким приложениям открыт доступ к личной информации. С недавнего времени устройства Apple и Android стали сообщать пользователям, к каким функциям приложения запрашивают доступ, предоставлен ли он и можно ли изменить свое решение.
Что такое Всемирная паутина?
Всемирная паутина или веб — это способ просматривать информацию и делиться ей через интернет. Эта информация — текст, музыка, фото, видео, что угодно — оформляется в виде веб-страниц, доступ к которым обеспечивает браузер.
«Гугл» обрабатывает более 40 тыс. запросов в секунду, благодаря браузеру Chrome компании принадлежит более 60% рынка браузеров. Сайтов существует почти два миллиарда, но на большинство из них практически не заходят. Более половины мирового веб-трафика привлекает одна десятая процента от общего их количества (т. е. около 5 млн).
Правовой статус опубликования и использования общедоступных данных пользователей определяется следующими документами:
- Политика конфиденциальности Твиттер
- О конфиденциальной информации в Твиттере
- Условия предоставления сервисов
- API-интерфейсы Твиттера
- Developer agreement - Соглашение с разработчиками
- Developer policy - Политика конфиденциальности для разработчиков
- Developer terms: More about restricted uses of the Twitter APIs - Условия для разработчиков: Подробнее об ограничении использования API Twitter
Как видно из перечня документов, регламентирующих правовой статус пользователя и информации - у Твиттера он самый большой и достаточно доскональна всё прописано.
Самым первым предложением Политики конфиденциальности Твиттер декларирует:
В этом вся основная суть политики Twitter в отношении данных пользователей и контента, который они создают - максимальная публичность и прозрачность процессов. Эта позиция Twitter закреплена в пункте 1.2. Политики конфиденциальности и определяет, что вся информация находится в открытом доступе:
- Часовой пояс и язык, время создания учетной записи, Твиты и определенная информация о Твитах (дата, время, приложение и версия Twitter, с помощью которой ретвитнули Твит);
- Местоположение в Твитах и в учетной записи в Twitter (если пользователь это опубликовал и дал доступ);
- Созданные списки, люди, на которых подписан пользователь, и которые подписаны на пользователя;
- Твиты, которые отметили как понравившиеся, или ретвитнули;
- Трансляции в Periscope, которые созданы, на которые кликнул пользователь или с которыми связан иным образом в Periscope или Twitter ;
- Оставленные вами сердца (Hearts), комментарии, количество сердец (Hearts) , которые получили, учетные записи, Суперфаном которых является пользователь;
- Трансляции, которые пользователь смотрел в прямом эфире или в режиме воспроизведения;
- Любые сердца, комментарии или другой контент, который пользователь публикует в эфире другой учетной записи;
- Информация о пользователе, размещенная другими людьми, использующими сервисы Twitter, также может быть общедоступной.
Кроме предоставления вашей публичной информации непосредственно на Twitter, мы также используем такие технологии, как интерфейсы API и внедряем их, чтобы сделать эту информацию доступной для веб-сайтов, приложений и прочего для их использования, - например, отображение Твитов на новостном веб-сайте или анализ информации, размещаемой людьми в Twitter. Обычно мы предоставляем этот контент в ограниченном количестве бесплатно и взимаем плату за лицензирование для крупномасштабного доступа. У нас есть стандартные условия, которые определяют порядок использования этих данных, а также программа нормативно-правового соответствия для обеспечения соблюдения этих условий. Но эти лица и компании не связаны с Twitter, а их предложения могут не отражать обновления, которые вы делаете в Twitter.
Мне очень понравилась позиция Твиттера, выраженная в " Условиях предоставления сервисов ", что существенным требованием является использовать контент исключительно только который пользователь готов сделать общедоступным.
Центральная идеология этих документов:
Мы считаем, что данные Twitter могут стать мощной силой добра в мире - от спасения жизней во время наводнений в Джакарте до оказания помощи Геологической службе США в отслеживании землетрясений и сотрудничества с ООН в достижении целей в области устойчивого развития. Тем не менее, мы запрещаем использование данных Twitter и API интерфейсов Twitter любой организацией в целях слежки или любым другим способом, который не соответствует разумным ожиданиям наших пользователей в отношении конфиденциальности.
Обобщая правового положения разработчиков можно сказать следующее:
Что они там делают?
Бóльшая часть пользовательского трафика приходится на видео: по данным американской технологической компании Cisco, если сложить все онлайн-просмотры видео на «Ютубе», «Нетфликсе», других сайтах и веб-камерах, они составят 77% от мирового интернет-трафика.
Конфиденциальность + безопасность
Настройки конфиденциальности имеют большое значение, но их одних недостаточно: важно приложить максимум усилий для сохранности данных. Если приватность касается прав человека на управление его личной информацией, то безопасность — это совокупность методов защиты. Она начинается с программного обеспечения, которое должно регулярно обновляться, ведь каждый день появляются новые угрозы, и производители ПО выпускают обновления для их устранения.
Однако ключевую роль в сохранности данных имеют аппаратные функции безопасности. Они должны быть заложены архитектуру продукта с самого начала разработки (Security by Design).
Безопасность на уровне устройств начинается с надежных конструктивных решений, обеспечивающих защиту пользователей. Каждый компонент и источник его поставки должны быть проверенными: лишь это служит гарантией отсутствия «встроенных» угроз. Преступники все чаще нацеливаются на цепочки поставок, чтобы внедрить уязвимости в устройства во время производства и транспортировки.
Один из примеров аппаратных средств безопасности — шторка ThinkShutter, которая закрывает камеру ноутбука. Это простое решение, представленное Lenovo в прошлом году, не позволяет хакерам использовать камеру, чтобы шпионить за вами.
Шторка камеры Lenovo ThinkShutter дает пользователю ноутбука возможность самому решать, будет ли его кто-то видеть.
Хотя есть хакеры, использующие онлайн-камеры для слежки за людьми и для того, чтобы оценить домашнюю обстановку, чаще у них иная цель — посмотреть, используете ли компьютер в данный момент. Это делается для того, чтобы запустить серию сценариев для взлома, которые будут заметны на экране.
Проблемы и решения
Компании и правительственные организации используют целый ряд современных технологий — от куки-файлов веб-сайтов до датчиков, встроенных в машины, а также устройств для сбора беспрецедентных объемов данных о своих клиентах, гражданах, сотрудниках. В их задачи входит оценка настроений и предпочтений, прогнозирование потребностей, повышение производительности труда, выявление мошенничества, отслеживание местонахождения, мониторинг здоровья, контроль безопасности.
Большая часть этих данных собирается с благими целями. Однако никто не может ответить на один из самых актуальных вопросов: где проходит граница? Люди хотят быть осведомлены о том, как обрабатываются и хранятся персональные сведения и насколько обеспечена их конфиденциальность. Соблюдаются ли «право на забвение» и множество других международных, государственных и локальных правил безопасности?
По мнению экспертов, компаниям стоит предпринять меры по укреплению доверия, объяснять клиентам, зачем они собирают определенную информацию, как намереваются ее использовать, какую выгоду может получить вторая сторона и, конечно же, как все эти данные будут защищены.
Обеспечение безопасности является сложной задачей для любой компании, особенно с развитием облачных сред. Появляются стартапы, обещающие трансформировать способы защиты данных и управления ими, поставщики технологий и консалтинговые фирмы создают свои собственные платформы и методики. Сегодня охрана конфиденциальности стала целой отраслью.
И День защиты персональных данных — это повод еще раз задуматься о путях решения проблемы. В настоящее время инициативу Совета Европы по охране личной информации поддерживают около 80 государств, а практика правильной ее обработки используется в крупнейших мировых организациях, включая ООН.
Как думаете, за вами следят? Пока вы размышляете над ответом, напомним, что практически за каждым вашим действием в интернете ведется пассивное наблюдение. Средняя веб-страница обменивается полученными данными с десятками разработчиков. То же самое можно сказать о многих мобильных приложениях. Некоторые из них и вовсе собирают конфиденциальную информацию, включая ваше местоположение и данные о совершенных звонках. Различные предприятия и даже организаторы мероприятий используют Bluetooth и WiFi для мониторинга за людьми поблизости. Розничные сети прибегают к использованию технологий по распознаванию лиц чтобы идентифицировать покупателей и делать им личные рекламные предложения. Более того, полученной информацией представители частных компаний могут делиться с правоохранительными органами.
Приложение TikTok разработано в Китае, правительство которого занимается тотальной слежкой за собственными гражданами
Как работает озеро данных
Data lake — это огромное хранилище, которое принимает любые файлы всех форматов. Источник данных тоже не имеет никакого значения. Озеро данных может принимать данные из CRM- или ERP-систем, продуктовых каталогов, банковских программ, датчиков или умных устройств — любых систем, которые использует бизнес.
Уже потом, когда данные сохранены, с ними можно работать — извлекать по определенному шаблону в классические базы данных или анализировать и обрабатывать прямо внутри data lake.
Для этого можно использовать Hadoop — программное обеспечение, позволяющее обрабатывать большие объемы данных различных типов и структур. С его помощью собранные данные можно распределить и структурировать, настроить аналитику для построения моделей и проверки предположений, использовать машинное обучение.
Еще одним примером инструмента обработки данных в data lake являются BI-системы, помогающие бизнесу решать задачи углубленной аналитики (data mining), прогнозного моделирования, а также визуализировать полученные результаты. Область использования многогранна — от финансового менеджмента до управления рисками и маркетинга.
«Чтобы работать с озером данных, в компании должны быть технические специалисты: Data Scientist, Data Developer, бизнес-аналитик. Такие специалисты имеют доступ к данным в data lake и могут их обрабатывать с помощью различных аналитических систем и подходов. В data lake данные можно обрабатывать без извлечения — достаточно оборудовать системы для анализа прямо внутри озера», — Константин Савчук, управляющий партнер компании Constanta.
Какие социальные группы в интернете не представлены?
Отмечается четкое разграничение по возрасту: среди пожилых людей пользователей сети куда меньше, чем среди молодых. По данным Бюро национальной статистики , в Великобритании, где в возрастной группе от 16 до 34 интернетом пользуются 99% населения, более половины из 4,5 млн взрослых, которые никогда не выходили в сеть, составляют люди 75 лет и старше.
Гендерная разница тоже присутствует. В большей части стран мира интернетом пользуются преимущественно мужчины. Среди женщин на 12% меньше пользователей интернета, чем среди мужчин. С 2013 года гендерная разница в большинстве регионов мира уменьшилась, а в Африке, наоборот, возросла. Здесь, по данным МСЭ, среди интернет-пользователей женщин меньше на 25%.
А в Пакистане соотношение пользователей по полу два к одному не в пользу женщин, в Индии 70% от всех сидящих в сети — мужчины. Несоответствие отражает патриархальные традиции и сопутствующее им неравенство.
Небольшой вывод:
Позиция Facebook в отношении данных пользователей более гибкая, чем у ВКонтакте, но общий тренд о том, что социальная сеть предоставляет третьим лицам по дополнительному соглашению - аналогичная. При этом более однозначно и чётко закрепляет правовое положение пользователя, его данных, а также определяет какие, зачем и как собирает Facebook данные о пользователях.
Чем озера данных отличаются от обычных баз данных
Ключевое отличие озер данных от обычных баз данных — структура. В базах данных хранятся только четко структурированные данные, а в озерах — неструктурированные, никак не систематизированные и неупорядоченные.
Пример: представим, что есть вольное художественное описание вашей целевой аудитории: «Девушки возрастом 20–30 лет, незамужние, обычно без детей, работающие на низких руководящих должностях. И мужчины 18–25 лет, женатые, без детей, без четкого места работы». Такое описание — неструктурированные данные, которые можно загрузить в data lake.
Чтобы эти данные о целевой аудитории стали структурированными, их нужно обработать и преобразовать в таблицу:
Пол | Возраст | Семейный статус | Дети | Работа | |
Портрет 1 | женский | 20–30 | в браке | нет | низкая руководящая должность |
Портрет 2 | мужской | 18–25 | в браке | нет | любая |
В классической базе данных вы должны определить тип данных, проанализировать их, структурировать — и только потом записать в четко определенное место базы данных. Мы можем создать алгоритм, который работает с конкретными ячейками, потому что четко знаем, что хранится в этих ячейках.
В случае с озером данных информацию структурируют на выходе, когда вам понадобится извлечь данные или проанализировать их. При этом процесс анализа не влияет на сами данные в озере — они так и остаются неструктурированными, чтобы их было также удобно хранить и использовать для других целей.
Если упростить, можно представить, что data lake — это ваш жесткий диск, на котором хранятся все ваши файлы. А база данных — таблица, в которой учтены все эти файлы.
Есть и другие различия между базами данных и озерами данных:
Полезность данных. В базах данных все данные полезны и актуальны для компании прямо сейчас. Данные, которые пока кажутся бесполезными, отсеиваются и теряются навсегда.
В озерах хранятся в том числе и бесполезные данные, которые могут пригодиться в будущем или не понадобиться никогда.
Типы данных. В базах хранятся таблицы с конкретными цифрами и текстом, распределенными по четкой структуре.
В озерах лежат любые данные: картинки, видео, звук, файлы, документы, разнородные таблицы.
Гибкость. У базы данных гибкость низкая — еще на старте нужно определить актуальные для нее типы данных и структуру. Если появятся данные новых форматов — базу придется перестраивать.
У озер гибкость максимальная, потому что ничего не нужно определять заранее. Если вы вдруг решите записывать новые данные, например, видео с камер для распознавания лиц, озеро не придется перестраивать.
Стоимость. Базы данных стоят дороже, особенно если требуется хранить много данных. Нужно организовывать сложную инфраструктуру и фильтрацию, все это требует денег.
Озеро данных стоит намного дешевле — вы платите исключительно за занятые гигабайты.
Понятность и доступность данных. Данные в базе легко смогут прочитать и понять любые сотрудники компании, с ними могут работать бизнес-аналитики.
Чтобы структурировать данные в озере требуются технические специалисты, например Data Scientist.
Сценарии использования. Базы данных идеальны для хранения важной информации, которая всегда должна быть под рукой, либо для основной аналитики.
В озерах данных хорошо хранить архивы неочищенной информации, которая может пригодиться в будущем. Еще там хорошо создавать большую базу для масштабной аналитики.
Чем опасны data lake
У озер данных есть одна серьезная проблема. Любые данные, попадающие в data lake, попадают туда практически бесконтрольно. Это значит, что определить их качество невозможно. Если у компании нет четкой модели данных, то есть понимания типов структур данных и методов их обработки, плохо организовано управление озером, в нем быстро накапливаются огромные объемы неконтролируемых данных, чаще всего бесполезных. Уже непонятно, откуда и когда они пришли, насколько релевантны, можно ли их использовать для аналитики.
В итоге наше озеро превращается в болото данных — бесполезное, пожирающее ресурсы компании и не приносящее пользы. Все, что с ним можно сделать, — полностью стереть и начать собирать данные заново.
Чтобы озеро не стало болотом, нужно наладить в компании процесс управления данными — data governance. Главная составляющая этого процесса — определение достоверности и качества данных еще до загрузки в data lake. Есть несколько способов это сделать:
- отсекать источников с заведомо недостоверными данными;
- ограничить доступ на загрузку для сотрудников, у которых нет на это прав;
- проверять некоторые параметры файлов, например не пропускать в озеро картинки, которые весят десятки гигабайт.
Настроить такую фильтрацию проще, чем каждый раз структурировать данные для загрузки в базу данных. Если процесс налажен, в data lake попадут только актуальные данные, а значит, и сама база будет достоверной.
Управление данными — это не факультативная, а приоритетная задача. В компании должен быть отдельный сотрудник, ответственный за data governance. Обычно это Chief Data Officer, CDO.
«Накапливать данные в расчете “потом разберемся, зачем нужно, и поймем, как использовать” — неправильно. Потом вычленить что-то полезное из этого огромного массива абсолютно разных данных будет сложно и затратно. Поэтому при проектировании любого озера данных в первую очередь надо еще “на берегу” определиться, для каких целей его строить», — Алексей Кулешов, директор департамента организационного развития и технологий ИТ-компании ОТР.
Интернет — это глобальная сеть, которая объединяет компьютерные сети меньшего размера, принадлежащие компаниям, правительствам, университетам и другим организациям, и позволяет им общаться друг с другом. Путешествовать по миру цифровой информации помогает совокупность проводов, компьютеров, центров обработки данных, роутеров, серверов, репитеров, спутников и Wi-Fi-вышек.
Вот эта инфраструктура и позволяет нам закупать продукты на неделю, делиться моментами из жизни в «Фейсбуке», смотреть «Изгоя» на «Нетфликсе», писать письма тетушке в Австралию и искать фото самой маленькой кошки в мире.
Что такое data lake
На русский язык data lake переводится как «озеро данных». Оно представляет собой огромное хранилище, в котором разные данные хранятся в «сыром», то есть неупорядоченном и необработанном виде. Данные в data lake как рыба в озере, которая попала туда из реки, — вы точно не знаете, какая именно там рыба и где она находится. А чтобы «приготовить» рыбу, то есть обработать данные, ее нужно еще поймать.
Мы в своей жизни чаще всего сталкиваемся именно с неструктурированными данными. Видеоролики, книги, журналы, документы Word и PDF, аудиозаписи и фотографии — все это неструктурированные данные, и все они могут хранится в Data Lake.
Сколько человек пользуются интернетом?
Смотря как считать. Согласно способу, принятому в Международном союзе по электросвязи (МСЭ), специализированном учреждении ООН, человек считается пользователем, если заходил в интернет в течение последних трех месяцев. Это означает, что даже если люди живут в городе, где есть интернет-кабель или Wi-Fi-вышка, они не обязательно пользуются интернетом.
Если следовать этому критерию, по состоянию на конец 2017 года интернетом пользовались около 3,58 млрд человек или 48% населения Земли. К концу 2018 года число пользователей достигнет 3,8 млрд или 49,2%, а к маю 2019-го в сети будет сидеть половина мира.
«Об этой разнице часто забывают при обсуждении доступа и стоимости, — говорит Дханарадж Тхакур, руководитель исследований в организации Web Foundation. — Мы можем сказать, что интернетом пользуются 50% населения, но большинство заходит в сеть с телефонов. По производительности этот способ сильно отличается от ПК или ноутбуков».
Популярность мобильного интернета ведет и к другим проблемам. В Африке, например, телекоммуникационные компании поощряют пользователей покупать пакеты мобильного интернета от 20 Мб до 1 Гб, предлагая доступ к основным приложениям типа «Фейсбука», «Инстаграма», почты «Джимэйл» и «Твиттера», даже когда трафик закончится. Суть в том, что у людей интернет ассоциируется с этими платформами, а не с вебом вообще. Некоторые даже не понимают, что заходят в сеть.
Это стало понятно, когда опросы и фокус-группы в Африке и Юго-Восточной Азии неожиданно показали, что пользователей «Фейсбука» больше пользователей интернета.
«Для них „Фейсбук“ и есть интернет. Остальное им неинтересно», — говорит Нанджира Самбули, в Web Foundation она руководит проектами по обеспечению равных прав на доступ в интернет.
Небольшой вывод:
Политика Твиттера, как и все остальные правые документы - содержат много идеологических позиций о том, что всё сделанное с использованием Твиттера - всё публично и тот пул данных, что они собирают - большая сила, которую надо использовать во благо. И поэтому Твиттер возлагает полную ответственность за соблюдение законодательства и безопасность использования общедоступных данных на тех кто совершает действие - на пользователей, на читателей, на разработчиков.
Насколько хорошо защищены ваши данные? В современном мире, где все взаимосвязано, этот вопрос беспокоит и большие компании, и обычных пользователей. Именно ему посвящен День защиты персональных данных (Data Privacy Day) — международная инициатива, которая поддерживается в 47 странах — участницах Совета Европы, а также в США, Канаде и Израиле. Ее цель — повысить осведомленность людей о том, как используется их личная информация и каким образом обезопасить себя от утечки. Участники мероприятий предлагают способы усиления конфиденциальности в сети, а также обсуждают возможность нововведений на законодательном уровне. Разработчики программного и аппаратного обеспечения, в свою очередь, представляют новые решения и проекты.
День защиты персональных данных отмечается 28 января, начиная с 2006 года. Дата приурочена к подписанию Конвенции Совета Европы от 28 января 1981 года «О защите лиц в связи с автоматизированной обработкой персональных данных». Этот документ впервые определил международные обязательства по защите приватной информации и прав на неприкосновенность личной жизни.
К настоящему времени Конвенцию подписали более 50 стран, однако проблема еще не решена. До сих пор миллионы людей не знают, как их данные собираются, хранятся и используются коммерческими компаниями и госорганами и как они становится целью добычи киберпреступников.
Всякий раз, когда мы проводим время в интернете, мы делимся персональными сведениями, которыми могут воспользоваться мошенники. Пользователям необходимо вооружиться знаниями, чтобы принимать соответствующие меры предосторожности. В их числе — резервное копирование с использованием надежного шифрования или защищенных облачных сервисов.
Согласно статистике, около 70% всех киберпреступлений в мире связаны с похищением идентичности. Это может случиться вследствие кражи пароля или даже самого компьютера и привести к тому, что преступники получат в свои руки конфиденциальную корпоративную информацию. Каждые две секунды в мире происходит новый инцидент взлома и похищения личных данных.
Чтобы помочь пользователям обезопасить себя, Национальный альянс по кибербезопасности (National Cyber Security Alliance, NCSA) создал единый портал для контроля над настройками конфиденциальности. Он содержит ссылки на популярные сайты электронной коммерции, почтовые и мобильные сервисы, поисковые системы и социальные сети. Учитывая, что каждый из этих многочисленных ресурсов собирает сведения о пользователях, им рекомендуется проверить и установить подходящий уровень приватности.
Производители также активно работают над защитой своих устройств. Например, предлагают многокомпонентные и многофакторные системы аутентификации, которые работают как вместе, так и по отдельности. Одним из самых надежных вариантов считаются смарт-карты для ноутбука.
Сколько электроэнергии ему нужно?
По подсчетам китайской телекоммуникационной компании Huawei, к 2025 году сектор информационно-коммуникационных технологий будет потреблять 20% от всего производимого в мире электричества и выбрасывать в атмосферу более 5% углекислого газа. Автор исследования Андерс Андре считает, что виной тому будет « цунами данных ».
В 2016 году Национальная лаборатория им. Лоуренса в Беркли установила, что в 2020 году американским центрам по обработке данных (там компьютеры хранят, обрабатывают и передают друг другу информацию) понадобится 73 млрд кВт⋅ч энергии. Столько производят десять атомных электростанций наподобие Hinkley Point B (атомная электростанция на юго-западе Англии — прим. Newочём ).
Как сохранить конфиденциальность данных?
Думаю, никто не будет спорить с тем, что у людей должно быть право знать, какую информацию о них собирают и что с ней делают. Ситуация, в которой частные корпорации обрабатывают персональные данные пользователей без их информированного согласия попросту недопустима. Тем не менее, практически каждый день мы видим, что компании не собираются регулировать работу с данными пользователей, так как ими движет, в первую очередь, желание получить прибыль. Более того, многие компании заходят еще дальше: когда пользователи дают разрешение на использование персональных данных, приложения взимают дополнительную плату или снижают качество обслуживания. Таким образом, они должны нести ответственность за неправомерное использование конфиденциальных данных.
Исследователи полагают, что для защиты персональных данных необходимо требовать введения более совершенных законов о конфиденциальности и их соблюдения. И хотя политика конфиденциальности несовершенна, скачивать мобильные приложения без нее может быть просто опасно. Конечно, лучший способ избежать обработки ваших данных сторонними приложениями — не загружать их вообще. В конце-концов сегодня каждый должен решить для себя, стоит ли установка приложения того, что она отнимает.
Что ждет интернет в будущем?
Как минимум, к интернету подключат больше разных типов устройств. Тренд, который начался с мобильных телефонов, планшетов, MP3-плееров и телевизоров, переключился на дверные замки, термостаты, лампочки, кофеварки, холодильники, посудомойки, духовки, стиральные машины, часы, зубные щетки, поливалки для газона и, конечно же, акустические системы. Дальше — больше. Интернет вещей станет манной небесной для компаний, которые хотят следить за нашим поведением, но может и улучшить некоторые аспекты нашей жизни, дав нам больше контроля над ней. Вместе с тем он сделает нас более уязвимыми перед кибератаками и утечкой персональных данных. В первой половине 2018 года Лаборатория Касперского зафиксировала в три раза больше атак вредоносных программ на смарт-устройства, чем за весь 2017 год. Пожалуй, самое модное интернет-словечко сейчас — децентрализация. Ее поддерживает сам Тим Бернерс-Ли . Децентрализованная сеть или DWeb призвана снести ограждающие интернет стены, внутри которых люди путешествуют по виртуальному миру при помощи посредников в лице «Гугла», «Фейсбука» и других. Вместо того, чтобы передавать массивы информации о миллионах людей на хранение кучке компаний, DWeb создает систему, где каждый хранит информацию о себе, вплоть до лайков в социальных сетях, сохраняет права на нее, и может выбирать, где и как этой информацией делиться.
Хочешь видеть статьи или подкасты чаще? Поддержи проект :
Patreon — аудиоверсии в день записи для патронов и многое другое .
В продолжение статьи Можно ли использовать данные из соцсетей расскажу небольшую юридическую аналитику положений популярных социальных сетей - ВКонтакте, Facebook, Twitter в части работы с данными, которые пользователи публикуют и предоставляют сами.
Сразу небольшой дисклеймер, что эта статья может быть полезна:
- тем, кому интересно можно ли использовать их данные, которые сделаны публичными через соцсети или иные интернет-ресурсы;
- тем, кто в использует персональные данные, взятые из соцсетей;
- тем, кто разрабатывает IT-продукты с использованием соцсетей;
- просто любознательным читателям.
Так как позиции закона мы уже рассмотрели, то сразу перейдём к тройке соцсетей и к тому как они относятся к использованию данных, полученных из соцсети абстрактными третьими лицами и разработчиками при использовании API или SDK. Основывался исключительно на публичных юридических документах - тех самых, которые, обычно, никто не читает. И, да, предвосхищая критику - я буду много цитировать документы, т.к. не хочу быть голословным и считаю, что всегда надо подтверждать источниками то что говорим. Наверное, это такая профессиональная деформация сознания :)
Как обычно, для тех кто торопится резюмирую - все социальные сети не берут на себя ответственность за данные пользователей и в своих публичных юридических документах утверждают, что размещенные данные являются публичными и доступны любым пользователям Интернета. А вот позиции к использованию данных разработчиками - у каждой социальной сети отличается.
Для удобства восприятия, подготовил такую общую схему иерархии:
Красным отмечены запрещенные способы использования данных из соцсетей и открытых интерне-ресурсов, а зелёным - разрешённые.
Полезен ли для нас интернет?
Бездна информации под названием интернет — это палка о двух концах. Интернет распространяет по всему миру знания и взаимопонимание, но в то же время предоставляет бесконечные возможности для бесполезной траты времени и развития вредных привычек вроде компульсивной проверки социальных сетей.
По данным исследований, чрезмерное увлечение «Фейсбуком» связано с низкой самооценкой и недовольством жизнью, хотя здесь сложно сказать, что причина, а что следствие. Twitter, который организация Amnesty International обвинила в создании токсичной среды для женщин, в марте попросил помощи в борьбе с троллями и дезинформацией. Врачи рекомендуют не брать планшеты и телефоны в постель из-за негативного влияния экранов на качество сна.
Невзгоды жизни онлайн заставили некоторых людей отказаться от интернета или, по крайней мере, от самых времязатратных, неэтичных и вызывающих привыкание сервисов. Если данные британского государственного медиарегулятора Ofcom верны, так можно освободить кучу времени. Регулятор установил, что в среднем британцы проверяют мобильные телефоны каждые 12 секунд и проводят онлайн 24 часа в неделю, а у некоторых доходит и до пугающих 40 часов.
Где сейчас нет интернета?
Между теми, у кого интернет есть, и теми, у кого его нет, существует явная разница, и преобладающий фактор — бедность. Для городских центров в некоторых африканских странах доступ в интернет — дело обычное.
Более половины населения ЮАР и Марокко имеют доступ к сети, некоторые регионы Ботсваны, Камеруна и Габона стремительно догоняют. Быстрее всего растет мобильный интернет благодаря тому, что за последние три года цены на широкополосную связь упали на 50%.
Но многие регионы развиваются не так быстро. В Танзании, Уганде и Судане интернетом пользуются от 30% до 40% населения. В Гвинее, Либерии и Сьерра-Леоне в сеть выходят от 7% до 11% жителей. В Эритрее и Сомали доступ к интернету имеют менее 2% населения.
Организация точки доступа в отдаленной, непокрытой сетью деревне будет стоить в три раза дороже, чем в городе, где интернетом смогут воспользоваться куда больше людей, а инвестиции окупятся быстрее. В сельской местности спрос на интернет гораздо меньше, так как люди не видят в нем смысла: он не отвечает их интересам.
Правильнее будет сказать, что речь идёт не только о социальной сети Facebook, но о всех продуктах, которые принадлежат Facebook Inc. и Facebook Ireland Limited (Facebook, Instagram, Messenger).
В общем, правовой статус определяется следующими документами и приложениями, также являющиеся публичными офертами как и у ВКонтакте:
В Политике использования данных сразу определено какие данные обрабатывает Facebook (спойлер: всю-всю информацию, какую только FB может получить при использовании вами продуктов):
Вообще, можно схематично изобразить движение данных от пользователя так:
Facebook в своих публичных документах достаточно однозначно определяет что относится к общедоступным данным в Политике использования данных :
Положения справочного центра дополнительно конкретизируют и раскрывает что является общедоступной информации:
То есть, к общедоступным данным, в отличии от ВКонтакте, Facebook юридически добавляет также все действия пользователя в социальной сети (такие как лайки, репосты, и т.д.), а также в Политике использования данных предупреждает, что к общедоступным данным о пользователе также является:
И это очень логично, что некоторая информация о вас будет общедоступна, даже если вы никаких действий не совершили, если кто-то сослался на вас, расшарил ваш контент или отметил на публикации. Тогда за наличие вашего согласия на такую публикацию несёт тот пользователь, который совершил это действие и вы можете попросить Facebook удалить этот контент.
При создании IT-продуктов с использовании API / SDK Facebook, разработчики должны следовать требованиям, предъявляемым Политике платформы Facebook , где определено что нельзя делать с полученными данными, каким условия должны соответствовать положения и действия разработчиком. К примеру:
- данные пользователей, полученные от Facebook, не должны передаваться компаниям, торгующим информацией, или продаваться, даже если вы предупреждаете об этом в своей политике конфиденциальности
- разработчик должен опубликовать и соблюдать свою политику конфиденциальности
- разработчик должен получать согласие людей, прежде чем использовать их данные в какой-либо рекламе
- разработчику запрещено продавать и передавать по лицензии, и покупать данные, полученные от Facebook
- запрещено использовать данные, полученные от Facebook, для принятия решений о соответствии каким-либо требованиям, в том числе для одобрения или отклонения заявки или определения процентной ставки по кредиту
В свою очередь, для пользователей положения Политики использования данных определяют следующее:
Когда вы решаете использовать сторонние приложения, сайты или другие сервисы, которые используют наши Продукты или интегрированы в них, они могут получать информацию о том, что вы публикуете или чем вы делитесь
.
Кроме того, когда вы скачиваете или используете такие сторонние сервисы, они могут осуществлять доступ к вашему общедоступному профилю на Facebook и любой информации, которой вы делитесь с ними
.
Информация, которую собирают такие сторонние сервисы, регулируется их собственными условиями и политиками (а не этой политикой)
Большое различие с правовыми положения ВКонтакте - Facebook разрешает использовать общедоступные данные для аналитики:
И в этой же Политике использования данных определено кто может получать доступ к аналитическим отчётам и собирать данные пользователей:
Как обеспечить интернетом весь мир?
Сложнее всего обеспечить дешевым интернетом бедные сельские регионы. Технологические компании США, которые интересуются развивающимися рынками, надеются занять эту нишу.
Alphabet, управляющая компания Google, отказалась от разработки дронов на солнечных батареях и сейчас сосредоточена на высотных аэростатах , которые позволят раздавать интернет практически из космоса. Компания Илона Маска SpaceX и фирма OneWeb разрабатывают свой способ сделать интернет доступным для всех с помощью группы микроспутников.
Facebook, чье бесплатное приложение для доступа в сеть Free Basics было заблокировано в Индии из-за закона о сетевом нейтралитете, также отказался от проекта раздающих интернет беспилотников, и сейчас разрабатывает более доступные мобильные услуги вместе с местными компаниями.
Microsoft задействует неиспользуемые ТВ-частоты для беспроводной широкополосной сети. Также набирает популярность еще один способ — создание частных сетей . Такие мобильные сети обычно используют энергию солнечных батарей и создаются для нужд местного населения. Ими управляют кооперативы, они оказываются дешевле других вариантов, приносят сообществу доход и дают работу местным кадрам.
Кто они?
В некоторых странах в сеть заходят практически все. Интернетом пользуются более 98% жителей Исландии. Схожие показатели отмечаются в Дании, Норвегии, Люксембурге и Бахрейне, указывает МСЭ.
В Великобритании пользователи интернета составляют 95%, в Испании — 85 , в Германии — 84, во Франции — 80, а в Италии — только 64. Доклад исследовательского центра Pew Research Center за 2018 год показал, что интернетом пользуются 89% американцев.
Доступа нет в основном у бедных и менее образованных слоев населения, жителей сельской местности. И все же доминирует в онлайн-пространстве вовсе не Запад.
В США проживают около 300 млн пользователей интернета, а в Китае в 2018 году было зафиксировано более 800 млн, хотя у 40% населения доступа нет. Индия достигла показателя в 500 млн пользователей в этом году, 60% населения все еще оффлайн.
Бесплатный сыр бывает только в мышеловке
Хотите всегда быть в курсе новостей из мира науки и высоких технологий? Подписывайтесь на наш канал в Яндекс.Дзен
К сожалению, сегодня не стоит рассчитывать на добросовестность разработчиков и глав корпораций
Так, благодаря критике компаний Apple и Google, которые в прошлом допускали утечки данных, были предприняты шаги для предотвращения несанкционированного доступа к функциям устройств и лучшего информирования пользователей о том, к какой информации имеют доступ установленные приложения. Как сообщает BuzzFeed News, некоторые приложения запрашивают доступ к местоположению, чтобы предоставить пользователям лучшую, персонализированную информацию. При этом не упоминая, что продают данные или используют их для таргетинга объявлений. Недавно журналисты New York Times обнаружили, что одно из популярных приложений отправляло данные о местонахождении пользователей 40 различным компаниям, в то время как пользователи считали, что их местоположение отслеживалось только для получения прогноза погоды.
Несмотря на то, что пользователи должны быть осведомлены о сборе персональных данных приложениями, описание “политики конфиденциальности” может быть длинным, расплывчатым и сложным для понимания. Так, в заметках о политике конфиденциальности некоторых приложений может быть сказано, что ваши данные могут быть переданы филиалам, что фактически означает, что они будут переданы рекламодателям и/или аналитическим агентствам.
Что такое дарквеб?
Веб-поиск идет не по всем сайтам. Загуглите слово «щеночки», и браузер покажет страницы, которые поисковик нашел среди сотни миллиардов, внесенных в поисковый индекс. Этот индекс огромен, но в нем только часть того, что есть в сети.
Гораздо больше страниц, около 95%, не индексируются, а потому невидимы для стандартных браузеров.
У веба как бы три слоя: поверхностный, глубокий и темный. Стандартные браузеры прочесывают поверхность — страницы, которые видно лучше всего. Ниже располагается глубокий веб: огромное количество непроиндексированных страниц. К ним относятся страницы, скрытые паролем (их используют в офисных сетях), и страницы, на которые никто не ссылается: при составлении индексов «Гугл» и другие поисковики, переходят от одной страницы к другой по гиперссылкам.
Внутри глубокой сети скрывается темный веб или дарквеб: сайты, адреса которых прячут их от просмотра. Для доступа в дарквеб, нужно специальное ПО, например, Tor (англ. The Onion Router — ‘многослойный маршрутизатор’ — прим. Newочём ) — инструмент, созданный ВМС США для работы агентов разведки.
Существует множество способов использовать дарквеб законно: так сохраняют анонимность журналисты, активисты и информаторы, но по большей части его используют для преступной деятельности. На нелегальных рынках в дарквебе можно найти все: от наркотиков, оружия и фальшивых денег до хакеров, киллеров и детской порнографии.
Читайте также: