Что такое пользовательские данные
Пользовательские данные
Любой интернет-проект накапливает большие объемы пользовательских данных: источники, откуда пришли пользователи, пути по сайту, корзины, Client ID, User ID и другие данные, необходимые для анализа маркетингового продвижения. Эту информацию необходимо анализировать, но вручную такие объемы информации обрабатывать сложно и долго.
Пользовательские данные – что это
Пользовательские данные – это информация о пользователях, собираемая в сети различными сервисами и устройствами. Кто собирает пользовательские данные? Да практически все!
— Браузеры и поисковики,
— Соцсети и мессенджеры,
— Каждый владелец сайта 🙂
Какую информацию можно собрать о пользователе?
— Данные, которыми пользователь делится сам (email при подписке на рассылку, профили в соцсетях – дата рождения, ФИО и т.д.)
— Данные, которые можно собрать косвенно: поведение, географию, путь пользователя на сайте.
Пользовательские данные – зачем собирать
Если вы знаете о своем пользователе все, то вы сможете предложить ему именно тот продукт, который ему интересен. Вы уже не будете предлагать домохозяйке гаечный ключ или крем для загара владельцу автосервиса (хотя, почему бы и нет?).
Данные о пользователях помогают понять своего клиента и создать индивидуальное сообщение, которое может быть использовано:
— в любом рекламном сообщении.
Кроме того, пользовательские данные необходимы для настройки таргетированной рекламы, которая покажет нужный текст с нужным фото нужному пользователю. А значит, повысит вероятность конверсии пользователя в клиента (в разы!).
Знание пользовательских данных поможет создать нативную рекламу в блоге или каком-нибудь профильном СМИ: мало того, что вы будете понимать, что на этой площадке сидит ваша аудитория, вы еще и будете знать, какой текст их сможет заинтересовать.
Пользовательские данные – как собирать
— Если вы владелец сайта, у вас наверняка установлены различные сервисы статистики, счетчики (например, Google Analytics, Яндекс.Метрика). Эти сервисы помогают собирать пользовательские данные: при правильной настройке вы можете увидеть источник, откуда пришел пользователь, посмотреть его путь по сайту (то есть узнать, что именно его интересует).
— Кроме того, вы можете предложить пользователю бесплатный контент и получить более подробную информацию – email или, что лучше, профиль в соцсетях. Если у вас есть профиль вашего пользователя в соцсетях, вы практически владеете миром. Шутка)
Профиль в соцсетях позволит узнать пол, возраст, семейное положение – если это не будет прямо указано, то косвенно. Точно узнаете об интересах пользователя и его социальном статусе (по пабликам и группам, на которые он подписан).
— Системы таргетинга и ретаргетинга также помогут вам собрать информацию о ваших пользователях. Правда она вам будет доступна в закрытом виде – то есть внутри системы вы сможете ею пользоваться (для настройки объявлений), но скачать не сможете.
В общем, пользовательские данные собрать не проблема. Вопрос – что с ними делать дальше.
Пользовательские данные – анализ
Если вы обладатель большого массива пользовательских данных, это еще не значит, что вы молодец. Данными и информацией нужно пользоваться, иначе они так и останутся лежать мертвым грузом.
Большие объемы пользовательских данных можно и нужно сегментировать в зависимости от ваших целей, а главное – целей ваших рекламных кампаний:
— по полу, возрасту, географии,
— по поведению на сайте,
— по товарам в корзине и т.д.
После успешной сегментации можно запускать рекламу. Но – лучше не ограничиваться каким-то одним рекламным сообщением, которе кажется вам и вашему коллеге идеальным. Лучше запускать несколько версий кампании и проводить А/Б-тестирование. Таким образом, вы сможете выделить, какой именно формат и контент привлекает вашу целевую аудиторию (лучше конвертируется в продажи, звонки или заказы).
Пользовательские данные – автоматизируем
Конечно, вручную сегментировать и анализировать такие объемы данных сложно. Сегодня на рынке есть множество сервисов big data для анализа больших данных. В качестве аналитической платформы мы используем Tableau:
— удобно анализировать данные из нескольких источников,
— универсальная платформа для любой аналитики (возможность автоматизировать АБ-тестирование, аналитика рассылок, контексной рекламы и пр.),
— легко осваивать (2 дней вполне достаточно, чтобы начать собирать рабочие дашборды с графиками и диаграммами).
Если у вас есть вопросы по пользовательским данным – как их собирать и анализировать, готовы помочь и проконсультировать:
Память Андроид: очистить кэш и данные приложений
Содержание статьи:
Накопитель заполнен на 75%. Перенести данные на SD-карту
О чём говорит это предупреждение? В данном случае система предупреждает, что на внутренней памяти устройства осталось меньше 25% свободного пространства. По большому счёту, это не критическая ошибка, доступная память ещё в наличии, но нужно иметь ввиду два момента:
В статье Память на Android. Все разделы памяти Андроид устройств мы подробно останавливались на разборе всех типов памяти Android OS. Там же приводилась следующая строчка:
Если с удалением медиафайлов и документов всё более или менее понятно, то вопрос оптимизации памяти, занимаемой приложениями, рассмотрим подробнее.
Из чего состоят приложения на Андроид
В первую очередь, стоит указать, что каждое Андроид приложение условно можно разделить на три части по типу используемых файлов:
Удаление приложения на Андроид
Содержимое папки с программой в каталоге /data/app/ хранится там на протяжении всего времени работы от момента установки до момента деинсталляции приложения.
Очистить данные приложения Андроид
В частном случае это может быть немного иной путь, что, в частности, соответствует общему каталогу, отличаясь только отображением иерархии каталогов:
Этой папкой возможные места хранения данных приложения на Андроид не ограничиваются. Часто программа при установке создаёт свой каталог в корне карты памяти: либо внутренней, либо внешней. Именно в этих папках программа сохраняет информацию, которую:
Кроме вышеперечисленных путей есть ещё один каталог, о котором нужно упомянуть отдельно. Речь пойдёт о папке obb, которая расположена по пути:
Игровая индустрия развивается достаточно быстро. Вместе с этим растут и требования к аппаратной части, в том числе и к дисковому пространству. Всё это актуально и для Android OS. Серьёзные игры с красивой прорисовкой графики и серьёзным геймплеем требуют хранения большего объёма системной информации. Всё это привело к тому, что у многих игр появился ярко выраженный кэш. Но, как и в разных способах установки программ, есть несколько путей и в том, как поместить кэш игры в папку /Android/obb/:
Теперь кому-то может показаться странным, почему информацию о папке с кэшем мы поместили в главу о данных Android, а не о самом кэше. И вот в чём дело. По сути, кэш игры так называют потому, что он скачивается ею при установке. Эти данные являются кэшем только для самого приложения и с точки зрения пользователя. Для операционной системы Андроид файлы кэша игры являются данными приложения и при очистке кэша не затираются (ниже повторим об этом). А когда же затираются?
Также при установке игр с кэшем необходимо учитывать ещё один нюанс: при удалении такой игры следует вручную проверить, удалился ли кэш автоматически. Если этого не произошло, то папку с кэшем можно удалить вручную любым файловым менеджером.
Очистить кэш приложения Андроид
Для начала определим, что такое кэш приложения :
Но у кэша существует естественный недостаток: он хранит как действительно нужные, регулярно вызываемые файлы, так и те, которые были показаны лишь раз и больше пользователю не понадобятся. Чтобы избавиться от ненужной информации, занимающей место, существует опция, которая позволяет очистить кэш приложения.
Давайте рассмотрим пример, который объясняет смысл понятий программа, данные приложения и кэш приложения простыми словами.
В какой-то момент времени мы переезжаем в другой офис (прошивка или смена устройства), он больше и просторнее, но в нём пока нет ничего. В первую очередь, приходит офис-менеджер (установка программы). Однако, она пока не может работать, у неё нет данных, поэтому мы устанавливаем ей компьютер (подгрузка данных приложения). Работа закипела. Но пока стол пуст (кэш очищен), скорость работы офис-менеджера ниже прежней: каждый раз, чтобы скрепить документы или посчитать большие суммы, ей приходится отвлекаться на поиски нужных инструментов. Поэтому, постепенно на столе у Татьяны вновь появляется степлер и кулькулятор (заполнение кэша). А вот блокнот, оказывается, нужен не так часто, поэтому он может лежать в выдвижном шкафу, а на освободившееся на столе место мы поместим календарь, обращение к которому происходит чаще. Благодаря этому Татьяна теперь справляется со своими задачами ещё быстрее.
Кэш приложения также может размещать по разным папкам. Чаще всего это одноимённый каталог cache, который расположен, например, в папке приложения из /Android/data/
То есть, если на нашем смартфоне заканчивается доступная память на накопителе, именно очистка кэша позволит нам освободить некоторый объём памяти для записи новых данных. Перед очисткой кэша убедитесь, что данная процедура безболезненна для конкретной программы и не приведёт к удалению важной информации.
Миф 4: Это то же самое: персональные данные и (или) большие данные? (из цикла «Главные мифы Интернета»)
Что персональные, что большие… Всё это данные, информация, поэтому есть ли смысл их разделять? Дело тут не в одних терминах, а в принципиальных характеристиках, которые современные «мифотворцы» предпочитают не замечать.
Big data: что такое, кто такой?
В 2008 году в спецвыпуске журнала «Nature», посвященном взрывному росту мировых объемов информации, редактор Клиффорд Линч впервые употребил выражение «большие данные» (big data). По сути, это постоянный поток огромных объемов информации, непрерывно поступающей из различных источников. К данной категории относится большинство потоков данных свыше 100 Гб в день.
В настоящий момент термин big data не получил нормативно-правового определения ни в одной из юрисдикций мира. В 2018 году в России вносился законопроект о больших пользовательских данных, в котором было предложено регулирование, крайне схожее с нормами законодательства о персональных данных. Положения законопроекта были раскритикованы экспертами как противоречащие природе больших данных. В частности, нормы о необходимости согласия пользователя на их обработку были бы фактически неисполнимы.
Источники big data:
1. Данные из окружающей среды. Окружающая среда генерирует порядка 90% всех новых данных. Факты изменений здесь фиксируют различные датчики, контроллеры, приборы учета, устройства аудио— и видеорегистрации, измерительные комплексы и проч. Помимо этого, на события в окружающей среде реагируют машины и механизмы, создавая свои данные о параметрах биологической и физической среды; пространственные, производственные, промышленные, транспортные; геоданные и метаданные.
2. Данные, генерируемые людьми. В процессе поиска информации, потребления контента и способов взаимных коммуникаций люди генерируют свои виды данных, которые учитываются системами, счетчиками, формами на сайтах и т.д. Информация образуется из потока постов, комментариев, лайков, фото-, аудио— и видеозаписей… К этой группе относятся как персональные данные, так и данные по индивидуальным параметрам (биометрические и биомедицинские данные), пользовательские данные (открытые пользовательские данные) и «цифровой след», о котором мы уже упоминали в предыдущих мифах.
3. Данные, генерируемые организациями. В процессе своей деятельности компании генерируют данные по бизнес-процессам. Это данные о поиске, добыче и логистике ресурсов, маркетинговые параметры, данные о совершенных транзакциях и проч. Сюда относятся отчетные результаты работы компаний, государственные учетные данные, государственные открытые данные и т.д.
Персональные данные как часть больших
Термин personal data правильнее было бы перевести как «личные данные», «личные сведения» или даже «личная информация». Любой из этих вариантов точнее указывает на связь информации с личностью, на частный характер этой информации.
В отличие от big data, персональные данные (ПД) находятся в правовом поле. В 152-ФЗ они определяются как «любая информация, относящаяся к определенному или определяемому на основании такой информации физическому лицу (субъекту персональных данных), в том числе его фамилия, имя, отчество, год, месяц, дата и место рождения, адрес, семейное, социальное, имущественное положение, образование, профессия, доходы, другая информация». При этом Федеральный закон вводит требования по защите, процедурам хранения, передаче ПД третьим лицам.
Разновидности ПД:
1. Уникальные идентификаторы человека, в частности: имя, отчество, фамилия гражданина, а также его псевдоним, в том числе творческий. Возможность использования этих уникальных идентификаторов с согласия гражданина другими лицами в их творческой, предпринимательской и иной экономической деятельности прямо предусмотрена законом (см. статью 19 ГК РФ).
2. Изображение гражданина (в виде фотографий, видеозаписей и проч.), представляющее собой разновидность информации о самом лице или его частной жизни. Каждое физическое лицо является обладателем абсолютных прав на собственное изображение и вправе как само использовать свое изображение (например, размещая свои фотографии в Instagram), так и распоряжаться правом на свое изображение (в частности, предоставляя заинтересованным лицам право публикации своих фотографий в различных изданиях). Примечательно, что п.1 ст.152.1 ГК РФ допускает использование изображения гражданина после его смерти супругом и детьми, а при их отсутствии – родителями.
3. Уникальные идентификационные номера, к которым традиционно относят, например, номер паспорта, ИНН, СНИЛС, и которые присваиваются в рамках различных государственных систем.
4. Особо значимые конфиденциальные личные сведения, к которым сегодня принято относить сведения в финансовой сфере, о здоровье, о детях, о социальном страховании, а также геолокационные данные.
5. Общедоступная информация о гражданине, размещенная в сети Интернет им самим. Речь идет об обнародовании гражданами различной информации о себе в социальных медиа. Это могут быть сведения об интересах гражданина, которые он считает нужным раскрыть в сети: любимых фильмах, предпочитаемом бренде одежды, музыкальных пристрастиях и т.д.
Заметим, что человек, размещая подобную информацию о себе в открытом доступе, утрачивает право запрещать ее использование без его согласия. Такой аспект закреплен в законодательстве (п.1 ст.152.2 ГК РФ). (Подробнее в материале).
Нужны ли границы?
Итак, большие данные и персональная информация – это не синонимы, невзирая на то, что ПД являются их частью. Но подменять понятия все-таки не следует. Применительно к big data речь чаще идет о создании данных, генерируемых техническими источниками. (Данные из социальных источников в большей мере накапливаются или собираются.) Персональные данные свободно вливаются в эти потоки, становясь их составляющими. И именно присутствие ПД в составе больших данных вызывает массу вопросов, не возникающих в адрес технических источников. Да и проблемы, требующие законодательного урегулирования, – это проблемы персональных данных. Кстати, именно ПД обладают наибольшей коммерческой ценностью.
Приведем понятный пример. Больница обрабатывает персональные данные своих пациентов – это персональные данные специальной категории. Также она обрабатывает персональные данные сотрудников – это персональные данные иной категории. Скорее всего, у больницы две базы данных. Если сложить обе базы, получится общее количество персональных данных, которые есть в информационной системе этой больницы.
Обрабатываю ли я персональные данные?
Да, если вы владелец сайта с условной посещаемостью 5 человек в неделю, но на нем есть форма обратной связи с полями «ФИО, адрес электронной почты, телефон». Информация о том, для каких целей вы собираете персональные данные, как вы их используете, должна быть представлена на вашем сайте.
Да, если вы обрабатываете персональные данные своих сотрудников или сторонних специалистов, нанятых для выполнения каких-то работ.
Да, если вы работаете с частными клиентами и вам требуются их паспортные данные для заключения договоров. Это касается турагентств, фитнес-центров, различных сервисных компаний, интернет-магазинов и проч.
И снова да, если вы бюджетная организация, политическая партия или детский сад. Последние обладают не только информацией о ребенке, но и о его родителях, включая место работы и должность. Не говоря уже о медицинских учреждениях, где содержится море личной деликатной информации, которую необходимо надежно хранить.
Самое главное, что точно объединяет «персонажей» нашего мифа, это потребность в защите. И разрабатываемый сейчас в России Кодекс этики использования данных должен стать конституцией для игроков рынка данных и новым щитом для граждан, защищающим персональную информацию от несанкционированного использования и утечек.
Персональные данные: как хранить, обрабатывать и защищать по закону
Персональные данные (ПДн) — это любая информация, относящаяся прямо или косвенно к определенному физическому лицу. Рассказываем в материале Selectel, о типах ПДн, как правильно их хранить, обрабатывать и законно защищать.
Когда сайт или приложение собирает информацию о пользователях (физических лицах), то владелец ресурса считается оператором персональных данных (ПДн). Личный кабинет в приложении, форма сбора email на сайте или отслеживание геолокации — это всё сбор ПДн. Когда владелец ресурса становится оператором ПДн, то подпадает под 152-ФЗ — закон «О персональных данных», в котором много правил, как оператор обязан обращаться с ПДн, чтобы обеспечивать безопасность полученной информации.
Чтобы определить, что такое ПДн и как с ними работать, обратимся к Федеральному закону №152-ФЗ «О персональных данных». В законе есть следующее определение персональных данных:
«Персональные данные — это любая информация, относящаяся прямо или косвенно к определенному физическому лицу»
Телефон, email, фотография, ФИО — всё это может считаться ПДн.
Также к ПДн можно отнести:
Но есть нюансы. В совокупности друг с другом эти данные могут считаться ПДн, а по отдельности — не всегда. Например, сам по себе адрес электронной почты не ПДн — это абстрактные данные. Но адрес почты «petrov120999@mail.ru», который принадлежит Петрову Петру Петровичу — это ПДн.
Аналогично с телефоном — сам по себе номер это не ПДн. Но если в базе телефонного оператора указано, что владелец номера +7999-999-99-99 — Петров Петр Петрович, то это уже персональные данные. По ним оператор идентифицирует владельца.
Фотография человека всегда является ПДн, однако они не всегда являются биометрическими ПДн, на сбор которых требуется письменное согласие. К примеру, фотография на пропуске — это ПДн, потому что требуется для сверки с лицом человека при входе.
Фамилия, имя и отчество тоже не всегда ПДн. Например, когда мы не знаем человека и без дополнительной информации затруднительно его идентифицировать. Информация «Петров Петр Петрович» ничего нам не говорит — полных совпадений может быть сотни. Но если у нас есть сопоставление, что у Петрова Петра Петровича номер телефона +7-999-999-9999, то это уже ПДн.
Часто ФИО задает контекст и становится ключевой частью в персональной информации, без которой большая часть данных теряет смысл. Например, когда мы анонимно опрашиваем посетителей сайта о размере зарплаты, то не собираем ПДн. Но если через опрос мы выясняем фамилии и имена, то эта информация уже ПДн.
Полного списка ПДн нет. Данные из списка не всегда относятся к ПДн. Поэтому в 152-ФЗ нет эталонного перечня информации, или законченного списка, по которому было бы понятно, из чего состоят персональные данные. Причина в том, что они зависят от контекста.
Если по набору информации можно идентифицировать человека, как личность, то это ПДн. Если для идентификации нужна дополнительная информации — набор данных уже не ПДн.
Примечание. 152-ФЗ не уникален. В Европе действует его аналог — Регламент по защите ПДн (GDPR). GDPR похож на 152-ФЗ, но есть и различия. Например, в GDPR ПДн считаются не только адрес, ФИО или геолокация, но и религиозные, философские, политические взгляды.
Постановление правительства №1119 делит ПДН на 4 категории для информационных систем:
Кажется, что данные, которые известны родным, друзьям или работодателю, однако это в корне неверно. По закону ПДн из общедоступных источников — это только справочники и адресные книги, данные в которые заносятся только с согласия субъекта ПДн. Данные, которые можно найти в интернете общедоступными не являются.
Определенные ПДн входят в категорию специальных, а именно информация о:
Это информация о физиологических и биологических особенностях человека:
Но есть нюанс. В 2013 году Федеральная служба по надзору в сфере связи, информационных технологий и массовых коммуникаций разъяснила, что здесь тоже важен контекст:
Если вы сдали кровь для анализов, то это не биометрические данные — информация с результатами не используется, чтобы выяснить личность. Но отпечатки пальцев, которые требуются для входа офис, уже биометрические данные — узоры на пальце используются для опознания личности.
Сюда входят ПДн, что не относятся ко всем предыдущим. Например:
В законе есть две сущности: субъект и оператор ПДн.
Субъектом персональных данных считается человек, чьи персональные данные использует оператор ПДн, например, собирает.
Субъект — это физическое лицо: владелец аккаунта в соцсети, посетитель сайта или покупатель в магазине. Например, клиент интернет-магазина заказал ноутбук, а чтобы его получить, выбрал курьерскую доставку, оставив фамилию, имя, адрес и телефон. По этим данным можно определить личность покупателя, поэтому теперь он субъект ПДн, а магазин — оператор.
Оператор — это физическое лицо или организация (государственная или частная), которая собирает, обрабатывает, хранит и распространяет ПДн, определяет цели и содержание их обработки.
Например, операторами становятся работодатели, когда соприкасаются с личными данными сотрудников. Даже если сотрудник всего один — работодатель уже оператор.
Рассмотрим, как оператору собирать, хранить, обрабатывать и защищать ПДн.
Условия. Если на сайте или в приложении есть возможность зарегистрироваться, заполнить анкету, заказать товар или подписаться на рассылку — это ресурс уже собирает ПДн. В 14 статье 152-ФЗ сказано, что собирать персональные данные можно только с разрешения пользователей. Для этого оператор обязан получить письменное согласие того, чьи данные собирает. Но в интернете письменную форму согласия заменяют на электронную.
В электронной форме сбора ПДн должна быть «Политика конфиденциальности», где описана причина сбора, что будет происходить с данными, кто будет хранить, обрабатывать и как долго. Также там должно быть указано, как субъекту отозвать разрешение на обработку.
Под каждой формой необходимо добавить чекбокс с текстом: «Соглашаюсь на обработку персональных данных в соответствии с политикой конфиденциальности». Без «галочки» пользование ресурсом должно быть невозможно.
Для сбора cookies тоже понадобится разрешение на сбор ПДн.
Обычно новым пользователям показывается всплывающее окно с предупреждением, что сайт собирает cookies, IP и геолокацию, а если пользователь не согласен, то может не пользоваться сайтом. Но эта информация также должна быть продублирована в документе «Последствия отказа предоставить персональные данные».
Исключения. Согласие на сбор ПДн нужно не всегда. Полный список исключений указан во втором пункте 22 статьи 152-ФЗ, но если кратко, то разрешение не обязательно для сбора общедоступных данных, обезличенной статистики, СМИ и работодателям, когда они собирают данные у сотрудников для соблюдения ТК. При этом все данные, естественно, не должны передаваться третьим лицам. Чаще всего, на сайты, приложения и, в целом, на коммерческие ресурсы в интернете, исключения не распространяются.