Что такое биометрические данные человека
Биометрические персональные данные: в чем суть и где их используют
Все полученные знания о личных биоданных человека собираются, хранятся и могут использоваться для опознания людей. Это особенно актуально в связи с активизацией угроз международного и внутреннего терроризма.
Классификация биологических данных
Суть в том, что сведения, полученные по индикации индивидуальных характеристик каждого конкретного человека с использованием технологий, являются персональными биометрическими данными. По существу, они различаются на:
статичные, которые передающиеся генетически человеку при рождении: ДНК, радужная оболочка глаза, отпечатки пальцев;
динамические, изменяемые в процессе развития и жизненных обстоятельств: голос, почерк, походка.
Правовое применение
В ФЗ-152 от 27.07.2006 года регламентирована правовая основа по защите персональных данных физических лиц. Законодательством определен порядок обращения с биопараметрами в рамках реализации конституционных прав граждан, гарантирующих неприкосновенность частной жизни и сохранность персональной тайны.
Личные биометрические сведения оператор может использовать без письменного разрешения при следующих чрезвычайных обстоятельствах:
необходимой депортации из другого государства.
В целях исполнения приставами судебных решений.
В случаях противодействия терроризму.
Осуществления оперативно-розыскной деятельности.
Связанных с коррупцией в госслужбе.
Важно! Биологические параметры характерные для каждого человека хранятся в защищенной базе данных в виде цифрового кода. При похищении закодированного ключа злоумышленник может воспользоваться секретной информацией для осуществления противоправных действий.
Системы биометрических технологий
Создание технологических систем позволяет осуществить проверку подлинности биоданных на основе методов сравнительной биометрической аутентификации. Сведения о пользователе такие, как сетчатка глаза, оттиск подушечки пальца и другие сканируются. Полученные параметры обрабатываются в системах с использованием цифровых технологий. Процесс аутентификации проводится в четыре этапа:
Запись
В процессе записи ведется запоминание одного или нескольких экземпляров физического образца биометрического параметра для более полного составления характеристики изображения.
Преобразование
Зафиксированная уникальная информация обрабатывается и путем технологических манипуляций закрепленный биологический параметр человека преобразовывается в цифровой код.
Сравнение
Закодированный биопараметр сравнивается с представленным для анализа образчиком.
Совпадение/несовпадение
В результате система аутентификации выдает оценку, совпадает или нет хранящийся в базе данных закодированный биометрический параметр с анализируемым образчиком.
Важно! Технологические системы аутентификации подлежат общей стандартизации по надежности и должны иметь сертификаты качества, которые выдает ICSA (Международная ассоциация по компьютерной безопасности).
Практическое применение
Практическое применение биометрических технологий востребовано во многих сферах деятельности, связанных с гарантией обеспечения безопасности доступа к различной информации. Системы с цифровой базой закодированных биологических параметров помогают решать задачи по идентификации личности в случаях обеспечения:
организации антитеррористических операций;
охраны общественного правопорядка;
безопасности банковских операций;
реализации оценки в розничной торговле;
предоставления социальных услуг;
выдачи заграничного паспорта либо визы;
разблокировки устройства смартфонов, компьютерных гаджетов.
Основные биометрические параметры
Современные технологии охватывают уникальные и динамичные биопараметры для решения вопросов персональной идентификации личности. К ним относятся:
Отпечатки пальцев
Изображение папиллярных линий на пальцах руки, различающиеся у всех людей, в том числе у близнецов, на протяжении всей жизни. Этот уникальный, статичный параметр используют в системах идентификация для установления личности.
Важно! Это надежный, проверенный годами способ идентификации, при котором невозможно искусственно восстановить идентичный отпечаток.
Радужная оболочка глаза
Надежным способ в биометрической технологии является проведение идентификации при сравнении радужной оболочки глаза. Такой параметр у человека остается неизменным в течении всей жизни. Изображение сохраняется неизменным при любых обстоятельствах, включая:
операцию на глаза по ликвидации катаракты;
введения имплантатов на роговице;
использование простых и цветных контактных линз;
пожизненную слепоту человека.
Важно! При наличии у человека радужной оболочки глаза, которая выглядит для запоминающих устройств, как сеть, состоящая из множества переплетающихся кругов, компьютерные технологии могут всегда идентифицировать владельца.
Голос
Голосовые характеристики являются динамичными параметрами, идентификация которых востребовано:
при удаленном обслуживании в контакт-центрах;
в банковских учреждениях;
в автоматических голосовых меню.
Важно! Голосовой параметр может измениться, и не всегда индикация бывает точной. На голос влияют возрастные факторы, Лор заболевания и другие воздействия.
Виды биометрических данных сегодня постоянно дополняются, усовершенствуются, и создаются новые системы распознавания личности. Проводятся работы по созданию единой базы данных. На законодательном уровне решаются вопросы правового регулирования обеспечения сохранности и доступа к персональным данным. Не за горами тот день, когда подтвердить свою личность можно будет одним мизинцем, прикоснувшись к биометрическому считывателю!
Как работает биометрия в России и следует ли ее опасаться?
Биометрию можно назвать самым многообещающим способом идентификации и аутентификации: удобство пользования сочетается в ней с надежностью, а считыватели уже достаточно просты, чтобы встраиваться в мобильные телефоны. Россия также следует общемировому тренду. Рассказываем, как в нашей стране работает биометрическая система.
Читайте «Хайтек» в
В последние пару лет в России тема биометрической идентификации граждан находится в фокусе общественного и политического внимания. Это связано главным образом с развитием Единой биометрической системы, для нормативно-правового обеспечения которой был принят Федеральный закон от 31 декабря 2017 г. № 482-ФЗ «О внесении изменений в отдельные законодательные акты Российской Федерации».
В частности, Центробанк уже довольно давно прилагает усилия к тому, чтобы стимулировать банки к применению таких систем удостоверения личности. Банки стараются: например, Сбербанк разворачивал в Москве пилотную зону с банкоматами, способными опознавать клиента по лицу. Выгоды кажутся очевидными: скажем, для открытия вклада не нужно беспокоиться о наличии паспорта, достаточно прийти в отделение и предъявить самого себя, а при общении с банкоматом не понадобится и пластиковая карта.
Что такое биометрия?
Общеизвестные примеры биометрических данных — это характерные рисунки радужной оболочки глаза или папиллярных линий на подушечках пальцев. Впрочем, стоит отметить, что к биометрии относят не только физические, но и поведенческие показатели, наподобие походки или индивидуальных особенностей набора текстов на клавиатуре.
Однако к какому бы типу ни относились эти данные, они в любом случае неотъемлемы от человека и поэтому могут гарантировать очень высокую надежность удостоверения личности — при условии, что считыватели трудно обмануть. В целом биометрическая аппаратура развивается сейчас именно в этом направлении, повышая устойчивость к фотографиям лиц и напечатанным на 3D-принтерах пальцам.
Главные требования к биометрическим характеристикам можно назвать «тремя У»: универсальность, уникальность, устойчивость. Иначе говоря, для того, чтобы стать критерием распознавания личности, параметр должен иметься у каждого человека, отличаться в каждом конкретном случае и оставаться относительно неизменным со временем. Есть и несколько сопутствующих требований: например, характеристика должна быть удобна для измерения, включая общественную приемлемость этой процедуры.
Имеются ГОСТы по следующим методам:
Помимо этих способов известен или обсуждается ряд других, в том числе довольно экзотичных:
Какие существуют проблемы с биометрией?
В то же время способ имеет свои изъяны. Так, заметной теоретической проблемой является требование уникальности, которое, согласно некоторым измерениям, не может быть полностью выполнено. В связи с этим вводят два понятия: частота ложного одобрения (false acceptance rate, FAR) и частота ложного отказа (false rejection rate, FRR).
Первый параметр отражает вероятность того, что по данным пользователя А будет идентифицирован / аутентифицирован пользователь В — например, в результате совпадения их показателей.
Второй параметр — это, наоборот, вероятность того, что система не узнает пользователя, посчитав его посторонним лицом. По некоторым данным, если для отпечатков пальцев средний FAR составляет 0,01%, то для лица и голоса (тех самых параметров, которые будут использовать отечественные банки) он может достигать 1-2%. Именно поэтому существует мнение, что биометрия не подходит для массового внедрения: если одна попытка аутентификации из ста будет заканчиваться несанкционированным доступом, то в масштабах страны это даст миллионы инцидентов.
Практика применения биометрии в России:
Исторически первой формой работы с биометрическими данными можно смело назвать сбор сведений о правонарушителях в рамках работы силовых ведомств. Отпечатки пальцев, например, — классическое доказательство при расследовании преступлений. Работая с подозреваемыми и осужденными, правоохранительные органы фиксируют рост человека, характерные приметы его внешности.
При этом, если в обычных биометрических системах данные обезличиваются, то здесь, напротив, устанавливается точная связь измеренных параметров с конкретным человеком. В предыдущем разделе, рассматривая законодательство о персональных данных, мы отметили, что в связи с осуществлением правосудия или оперативно-розыскными мероприятиями согласие субъекта на сбор биометрических ПД не требуется; эти положения подчеркивают особый характер таких сведений.
Упоминания о биометрии в нашем обзоре законодательства начались с заграничных паспортов. Действительно, основной документ гражданина России за рубежом по сей день остается одной из главных областей применения биометрических технологий. Микросхема в подобном изделии бывает способна хранить не только общие сведения о владельце (например, имя, фотографию и т. п.), но и рисунок радужной оболочки глаза или отпечаток пальца.
Что можно делать при помощи биометрии В России?
Для чего российские банки собирают биометрию?
Работа над системой хранения и использования данных началась еще в 2017 году. С 1 июля 2018 года была запущена Единая биометрическая система — база, в которой хранятся биометрические данные граждан. Тогда же начали прием биометрии несколько крупных банков — Сбербанк, Альфа-Банк, ВТБ, Почта Банк, Райффайзен и другие.
Разработчиком и оператором системы выступает Ростелеком — он обрабатывает данные и обеспечивает их безопасное хранение. Сейчас в биометрическую систему можно сдать запись голоса и изображение лица. По этим данным можно идентифицировать человека как в отделении, так и удаленно — например, по телефону или через мобильное приложение. Возможно, в будущем в системе будут храниться и другие параметры — отпечатки пальцев или снимки радужки глаза.
Как сдать биометрию?
Узнать, где в вашем городе можно сдать свои голос и лицо, можно с помощью карты на сайте Центробанка. Здесь можно найти список отделений банков с адресами и временем работы. Список постоянно расширяется, в нем появляются новые отделения и банки.
Отметим, что сбор биометрии может отличаться от места к месту.
Безопасно ли сдавать биометрию?
Сразу после первых новостей о начале сбора банками биометрии появились люди, которые начали сомневаться в надежности хранения своих данных. С одной стороны, они боялись, что дырами в системе могут воспользоваться мошенники – в том числе, подставные люди в банках – чтобы оформлять на посторонние лица кредиты. Другие опасаются того, что система не сможет правильно распознать человека из-за изменений в голосе (например, при простуде) или во внешности (например, после пластической операции или травмы).
Конечно, уже сейчас можно достаточно точно смоделировать внешность любого человека и даже подделать его голос. Чтобы распознавать и отметать имитации, ЕБС вводит дополнительные методы подтверждения личности. Она обращает внимание на выражение лица, расположение камеры, интонацию и другие параметры, которые могут показать, что к системе обращается сам клиент, а не имитация. Иногда нужно будет ответить на контрольные вопросы или совершить дополнительные действия – например, дотронуться до мочки уха. Так дополнительно будет подтверждаться факт того, что с системой взаимодействует реальное лицо.
Биометрия и биометрические данные: что это такое и безопасно ли это?
Биометрические данные являются частью передовых технологий. Проще говоря, биометрия — это любые показатели, связанные с человеческими особенностями. Наиболее распространенными примерами биометрической системы распознавания являются отпечатки пальцев и технология распознавания лиц. Как новая технология, биометрические системы могут повысить удобство, заменяя пароли и помогая правоохранительным органам поймать преступников. Биометрические идентификаторы также выполняют функцию контроля доступа в безопасной среде, как физической, так и цифровой. Но первый вопрос, который вы должны задать: защищены ли мои биометрические данные от кражи?
Что такое биометрия и для чего используются биометрические данные?
Биометрия — это способ измерения физических характеристик человека для проверки его личности. Они могут включать физиологические признаки, такие как отпечатки пальцев и глаза, или поведенческие характеристики, которые оценивают уникальное поведение и подсознательные движения человека. Для того, чтобы биометрические данные были полезными, они должны быть уникальными, постоянными и собираемыми. После измерения, информация сравнивается и сопоставляется в базе данных.
Каждый раз, когда вы разблокируете экран смартфона с помощью функции распознавания лиц, запрашиваете у голосового помощника прогноз погоды или прикладываете отпечаток пальца на на какое-либо устройство, вы используете биометрические данные. Вы можете использовать эту технологию каждый день для идентификации личности или для взаимодействия с личным устройством, но существует множество других способов использования биометрических данных.
Например, полиция может собирать ДНК и отпечатки пальцев на месте преступления или использовать видеонаблюдение для анализа походки или голоса подозреваемого. В медицине применяется сканирование сетчатки глаза или проводятся генетические тесты. И даже ваша подпись относится к биометрическим данным.
Типы биометрических данных
Распознавание голоса. Измеряет уникальные звуковые волны в голосе во время разговора с устройством. Ваш банк может использовать систему голосового управления для проверки вашей личности при звонках.
Как работает биометрия?
Если вы когда-либо вставляли свой отпечаток пальца в устройство, то у вас возможно сложилось смутное представление о том, как работает биометрия. В основном, вы записываете свои биометрические данные в устройство, в данном случае отпечатки пальцев. Эта информация сохраняется, и к устройству можно будет получить доступ только после сравнения вашего отпечатка и сохраненного. Любой человек в мире может прикоснуться пальцем к сенсорному кругу вашего смартфона и вряд ли сможет разблокировать его.
Отпечатки пальцев — это всего лишь одна из форм биометрических данных. Одной из новых форм биометрической технологии является сканирование глаз. Обычно сканируют радужную оболочку. Почерк и голосовые отпечатки — это другие биометрические данные, которые являются исключительно вашими и иногда необходимы для обеспечения безопасности.
Биометрическая система состоит из трех различных компонентов:
Биометрические данные широко распространены на смартфонах, таких как iPhone Apple и некоторых устройств Android. Ноутбуки и другие вычислительные устройства все больше полагаются на биометрические системы, и эта тенденция только начинается. Биометрическая аутентификация и идентификация являются безопасным способом входа на устройства и в различные службы. Кроме того, это может снять трудности с запоминанием десятков паролей учетных записей.
Конфиденциальны ли биометрические данные?
Когда речь заходит о биометрических данных, существует серьезная озабоченность по поводу конфиденциальности. Некоторые из основных проблем, выявленных с помощью биометрических данных, включают в себя следующие:
Как защитить биометрические данные?
Для защиты биометрических данных, вы можете принять ряд мер по обеспечению их безопасности на основе здравого смысла:
Биометрические данные могут сделать мир более безопасным и удобным. Соблюдение принципов здравого смысла в области безопасности может сыграть важную роль в защите вашей частной жизни.
На видео: Биометрические данные в России
Биометрия в платежах – основы технологии
Сегодня мы постоянно слышим в новостях «запущен проект по распознаванию лиц на транспорте», «в кафе NN реализовано распознавание лиц для оплаты», «в компании ZZ организован проход в офис по лицу» и прочие «яркие» заголовки. Кроме того, многие люди привыкли к использованию FaceID на своих смартфонах. Но, как обычно, известное – не есть от того познанное. Начнём с основ, чтобы разобраться в предмете.
Факторы аутентификации
Аутентификация – подтверждение того, что «Я это Я». Все известные способы аутентификации субъекта (субъект – тот, кто действует) относятся к трем классам-факторам:
Фактор 1. То, что человек знает. Имеется в виду обладание уникальной или секретной, информацией: пароль, ответ на вопрос, дата рождения, номер паспорта и т.д.
Фактор 2. То, чем человек владеет. Речь идёт о владении каким-либо предметом, например, документом, ключом от автомобиля, пластиковой картой для прохода, брелоком и т.д.
Фактор 3. То, чем человек является. Под этим подразумеваются неотъемлемые естественные характеристики человека: лицо, отпечаток пальца, подпись (почерк) и многие другие
Мы будем говорить о последнем, третьем факторе аутентификации в применении к решению практических задач.
Что такое биометрия
Когда говорят «биометрия», то имеют в виду технологии, позволяющие измерять, классифицировать и сравнивать естественные, присущие каждому человеку, физические характеристики. В конечном итоге, всё это делается для распознавания человека среди множества других людей (идентификация) или дополнительное подтверждение того, что субъект является тем, кем он себя назвал (аутентификация). Короче говоря, биометрические технологии позволяют определить и подтвердить личность человека, основываясь на определённом наборе данных.
Какие данные могут быть использованы для достижения этой цели? Перечислю основные требования:
Универсальность: данные могут быть получены, или сняты, с любого человека, вне зависимости от возраста, роста, пола, и т.д.
Уникальность: получаемый набор данных должен быть уникальным для каждого человека, т.е. необходимо свести к минимуму вероятность нахождения двух разных людей с одними и теми же или близкими данными
Приведу несколько примеров характеристик, или биометрических модальностей, присущих всем людям, но при этом являющихся уникальными для каждого человека:
Отпечаток пальца
Лицо
Голос
Рисунок вен ладони
Радужка глаза
Почерк
Походка
Список можно продолжить. При этом в практических задачах, например, для идентификации личности при выполнении платежа или при прохождении паспортного контроля, важны дополнительные требования к биометрическим технологиям:
Скорость и простота сбора и обработки: данные должны собираться и обрабатываться достаточно быстро, весь процесс должен занимать секунду. Если процесс занимает больше секунды, это приводит людей в невообразимое раздражение потому, что люди уже привыкли к быстрой работе бесконтактных платежей
Стоимость датчиков для снятия биометрических данных и системы их обработки
Характеристики первых трёх биометрических модальностей из списка выше могут быть сняты и обработаны достаточно быстро и относительно просто. Например, для снятия рисунка вен необходим специальный прибор, который сегодня нельзя установить на каждый недорогой смартфон. Несмотря на то, что прибор этот (обычная камера, которая видит чуть шире, чем видимый диапазон) очень прост, ставить его на устройства не принято.
Кроме этого, следует отметить, что для уверенной работы алгоритмов распознавания какого-либо признака человека необходимо, чтобы этот признак был мало подвержен изменениям как с течением времени, так и при наличии различных помех. Например, испачкав палец в краске, им уже нельзя разблокировать устройство при помощи датчика отпечатка пальца; если голос осип, т.е. поменял свой тембр при простуде, становится временно недоступным распознавание человека по голосу.
Некоторые признаки человека крайне мало подвержены изменениям, например, рисунок радужки глаза практически не меняется при жизни человека. Лицо человека меняется со временем, но этот процесс достаточно медленный, и, как правило, непрерывный. Кроме этого, два этих признака (радужка и лицо) мало подвержены случайным изменениям, например, травмам, царапинам и т.д. Таким образом, можно добавить ещё одно требование к биометрическим характеристикам:
Устойчивость: данные должны быть неизменны со временем или изменяться очень медленно
Наконец, биометрические технологии можно разделить на контактные и бесконтактные, по принципу снятия данных. Например, при снятии отпечатка пальца, предполагается контакт между частью тела человека и поверхностью прибора, что не всегда удобно. Напротив, для записи голоса или создания снимка (фотографии) лица непосредственного контакта не требуется. Поэтому – ещё одно требование:
Удобство для пользователя: данные должны собираться простым и удобным для пользователя образом (желательно бесконтактно) и не требовать от
пользователя усилий для предоставления его биометрических данных
Таким образом, можно выделить шесть основных требований к биометрическим характеристикам: универсальность, уникальность, стоимость, простота сбора и обработки, устойчивость, удобство.
Остановлюсь на технологиях, позволяющих распознавать человека по лицу, т.е. лицевой биометрии, или facial recognition, поскольку данная биометрическая модальность удовлетворяет в достаточной степени всем выдвинутым нами требованиям.
Идентификация и аутентификация по биометрическим признакам
Важно понимать разницу между двумя понятиями: идентификацией и аутентификацией.
Под идентификацией понимают выделение или нахождение одного объекта среди множества похожих. Человек сталкивается с такой задачей регулярно, например, увидев на экране знакомое лицо актёра, человек сразу идентифицирует его, то есть узнаёт, находит его у себя в памяти, среди многих других знакомых лиц. Узнав актёра по лицу, мы сразу вспоминаем, например, список фильмов с этим актёром, возраст, имя и т.д. Иными словами:
Задача идентификации состоит в нахождении объекта по определённому признаку среди многих похожих между собой. Также такую задачу называют сравнением 1:N (один ко многим), где N – это общее количество объектов, по которым идёт поиск.
Под аутентификацией понимают подтверждение факта сходства полученной характеристики объекта с характеристикой, записанной ранее. То есть, получение ответа на вопрос “действительно ли перед нами Х”? Подобная задача тоже часто встаёт перед человеком: например, увидев на экране телефона имя звонящего “Y”, мы заранее предполагаем, что будем беседовать с Y, однако только услышав знакомый голос, то есть сравнив услышанное с тем, что есть у нас в памяти, мы убеждаемся, что говорим действительно с Y. Иными словами:
Задача аутентификации состоит в подтверждении достаточного сходства объекта со своим образом, записанным ранее. Также задачу называют сравнением 1:1 (один к одному).
Необходимо отметить, что полное сходство при биометрической аутентификации не может быть достигнуто, так как каждый человек одновременно и равен, и не равен самому себе. Улыбнувшись для фотоснимка один раз, потом невозможно повторить точно такую же улыбку: мельчайшие детали лица всё равно будут другими. Однако, это обстоятельство не мешает успешно проводить надёжную аутентификацию человека по лицу: установив достаточно высокий порог сходства для вынесения решения, можно добиться очень высокой точности.
Решение задачи распознавания и классификации изображений лица
В основе современных способов распознавания лица лежат технологии машинного зрения, позволяющие компьютерной программе самостоятельно без помощи человека распознавать и классифицировать определённые детали изображения. Например, возможно выделить человеческое лицо среди многих деталей на снимке (распознавание) и сравнить с уже имеющимися образцами лиц для установления возможного сходства (классификация).
Разработка отдельных алгоритмов распознавания объектов на изображениях началась ещё в 1960-х годах, но только ближе к концу 1980-х стало возможно использовать значительно возросшие вычислительные мощности для проверки идей, лежащих в основе алгоритмов, на практике. В XXI веке, а именно с середины 2010-х годов повсеместное распространение смартфонов, оснащённых камерами, сделало возможным резкое улучшение качества работы технологии в связи с огромным количеством исходных данных для алгоритмов (фотографий лиц) и устройств, способных выдавать результаты их работы. Согласно исследованиям компании Gemalto, с 2013 года было выпущено 500 моделей смартфонов, поддерживающих распознавание как минимум одной биометрической модальности, а общее количество платежей, произведённых с мобильных устройств достигло почти 2 миллиардов за 2017 год [1], т.е. можно говорить о повсеместном использовании устройств, поддерживающих биометрическую аутентификацию/идентификацию для платежей.
Весь процесс применения технологий машинного зрения к задаче идентификации человека по лицу можно разделить на три этапа:
Поиск лица на изображении (фотографии)
Выделение черт и характеристик лица для получения биометрического образца
Сравнение образца с хранящимися в базе, или поиск по базе образцов
Рассмотрим основные принципы алгоритмов, лежащих в основе каждого из этапов решения задачи.
Поиск лица на изображении
Алгоритм обладает следующими достоинствами:
Устойчивость: большое количество истинно-положительных ответов и очень малое количество ложноположительных
Возможность использования алгоритма только для решения задачи нахождения лица на фотографии, без идентификации/аутентификации пользователя
Работа алгоритма начинается с поиска определённых признаков на изображении: на рис.1 изображены 4 различных типа признаков. Значение, присваиваемое каждому из признаков, вычисляется следующим образом: берётся сумма величин всех пикселей светлой области и вычитается из суммы величин всех пикселей закрашенной области. Величиной пикселя может, например, выступать численное значение (номер) цвета, записанное в нём. Таким образом, значением, присвоенным признаку А, может быть разность между освещённостью (яркостью) правой и левой частями прямоугольника.
Пример прямоугольных шаблонов-признаков
Каким образом может быть такой принцип использован для поиска лиц на изображении? Все человеческие лица имеют более или менее похожие свойства, или черты. Поиск по подобному признаку позволяет найти эти черты на снимках:
Область носа всегда светлее, чем область глаз
Область глаз всегда немного темнее, чем верхняя часть щёк
шаблон-признак, похожий на нос
шаблон-признак, похожий на область глаз
Используя другие прямоугольные шаблоны-признаки, а также шаблоны-признаки разного размера можно составить карту местоположений и размеров черт лица: глаз, рта, носа, границ лица.
Приведём пример работы алгоритма: предположим, мы ведём поиск четырёх признаков с рис. 1 по изображению размером 100 на 100 пикселей. Изображение делится на 25 сегментов, размером 20 на 20 пикселей, и поиск черт ведётся шаблонами такого же размера. Мы поочерёдно накладываем каждый из шаблонов на участок изображения, смотрим получаемое значение, а затем записываем результат в таблицу:
На этой карте-таблице в ячейках записан тип шаблона, который получил наибольшее по модулю значение в данном сегменте, а также это значение. Видно, что в центральной части карты находятся сильно выраженные черты, соответствующие определённым шаблонам-признакам, например, весьма вероятно, что в центральной части изображения находится нос.
Вот таков базовый принцип составления карты черт лица на изображении. Можно заметить, что, во-первых, в нём не учитывается, что лица могут быть наклонены как в целом, так и частично, во-вторых, может потребоваться более, или наоборот, менее подробное разбиение изначального изображения, в-третьих элементы разбиения могут пересекаться, и т.д. Все эти замечания учитываются в современных подходах, например, используется большее число шаблонов, составляются более “сильные” классификаторы признаков, как линейные комбинации “простых, слабых” и т.д.
Получение биометрического образца из фотографии
После того, как лицо на фотографии найдено и выделено, можно говорить о переводе изображений лица в биометрический образец, т.е. в такую форму, в которой можно сравнивать её с другими по формальным критериям, автоматическим (машинным) образом. Очевидно, например, что простое попиксельное сравнение двух снимков вряд ли увенчается успехом – помимо различий в мельчайших деталях лица, обязательно будут иметь место различия в условиях съёмки. Поэтому необходимо выделять некий набор черт лица и сравнивать лица уже по этим чертам.
Приведу алгоритм, опубликованный в 1991 году [3], хорошо демонстрирующий основной принцип создания биометрического шаблона: “собственные лица” (по аналогии с собственными векторами).
Сначала формируется набор из изображений, которые используются для обучения, так называемый тренировочный набор. Изображения должны быть сняты в идентичных условиях: при одинаковом освещении, при одинаковом положении головы, и т.д. Также они должны иметь одинаковый размер, например, 100 на 100 пикселей.
Затем все изображения переписываются в векторном виде, то есть создаётся вектор-столбец, в котором записаны значения, взятые из пикселей (номера цветов); таким образом, векторы будут иметь 10 000 компонент каждый. Формируется матрица (таблица) T из вектор-столбцов. После этого необходимо вычислить “среднее” изображение и вычесть его из каждого из векторов-столбцов; можно сказать, что таким образом мы выделяем всё “общее” из каждого изображения и отбрасываем его, оставляя только отличительные черты.
Далее, составляется ковариационная матрица S (неформально говоря, отображающая зависимость изменения компоненты вектора от других компонент) и для неё вычисляются собственные значения и собственные вектора. На деле этот шаг – самый затратный с точки зрения вычислений, но он может быть упрощён поиском собственных векторов S без явного вычисления самой матрицы S.
Каждый полученный в нашем примере собственный вектор будет иметь 10 000 компонент, т.е. сам может быть “расшифрован” как изображение. Эти изображения и формируют базис “собственных лиц”. Т.е., каждое изображение из тренировочного набора, и вообще каждое изображение, удовлетворяющее изначальному формату, может быть теперь записано в форме:
Понятно, что 10 000 собственных значений – это слишком много, и их хранение и использование ничем не отличается от хранения 10 000 пикселей изначального изображения. Поэтому выбираются основные собственные значения и соответствующие им “собственные лица”. Выбор осуществляется сортировкой собственных значений по величине и установлением произвольного порогового значения t для их суммарной вариации, т.е.:
Иными словами, мы выбираем набор собственных значений такой, что их сумма будет значительной частью суммы всех собственных значений (можно установить значение t, например, 0.85). Значение k на практике оказывается относительно небольшим, например, для изображений 100 на 100, оно часто близко к 30.
Теперь можно говорить об основном наборе “собственных лиц”, который содержит наиболее значимые признаки всех лиц из тренировочного набора, а любое изображение лица как из тренировочного набора, так и извне, может быть разложено на компоненты – в виде взвешенного набора (линейной комбинации) “собственных лиц”. Т.е., любое изображение лица может быть представлено в виде вектора из, например, 30 компонент (а1, а1, …, а30). В таком виде его уже можно хранить и сравнивать с другими по формальным критериям, это и будет биометрический образец.
Следует дополнительно отметить два момента: во-первых, не имея доступа к набору “собственных лиц”, нельзя воссоздать изображение лица по биометрическому образцу. Во-вторых, “собственные лица”, переведённые в изображение, не всегда даже и похожи на лица в обычном понимании:
пример “собственных лиц” от AT&T Laboratories
Данный алгоритм, безусловно имеет свои недостатки, например, почти всегда главными собственным значениями становятся те, которые отвечают за освещённость, он плохо справляется с выражениями лица, очень зависит от условий съёмки. Однако, он хорошо показывает общий подход к формированию биометрических образцов по изображениям лица.
В современных решениях по идентификации человека по лицу используются, в основном, подходы, основывающиеся на глубоком обучении (deep learning), в которых многие шаги выполняются неявно при помощи нейронных сетей, к примеру, составление набора черт лица, взвешенный набор которых и будет составлять биометрический образец. Поэтому алгоритмы в целом, и форматы образцов в частности, варьируются от решения к решению; многое определяется качеством (разнообразием, величиной) набора лиц, на котором обучается решение, архитектурой нейронной сети и другими параметрами.
Поиск и сравнения в базе биометрических образцов
Как я уже писал, биометрический образец представляет собой вектор характеристик лица, на данный момент у многих известных решений он состоит из порядка 100 компонент (значений). Иными словами, биометрический образец являет собой точку в, допустим, 100-мерном пространстве. Теперь, каким образом, сделав снимок на камеру смартфона, можно определить, какой человек изображён на фотографии?
Сперва с фотографии выделяется изображение лица человека, затем изображение переводится в биометрический образец-вектор. Затем вектор пересылается на сервер распознавания, где хранятся записи образцов для разных пользователей. Если представить себе образец как точку в 100-мерном пространстве, то вопрос “какой человек изображён на снимке?” эквивалентен вопросу “какая точка является ближайшей к данной для сравнения?”. Близость между точками может определяться разными способами, в зависимости от алгоритма, например, это может быть обычное евклидово расстояние между точками. Таким образом, найдя ближайшую точку (ближайший вектор) к данной для сравнения, мы будем знать, на кого более всего похож человек, лицо которого изображено на фотографии.
Для каждого пользователя в базе может храниться несколько образцов для последующего сравнения, тогда можно говорить о попадании вектора в некую область 100-мерного пространства, отождествляемую с определённым пользователем. Таким образом, можно ответить на вопрос “является ли человек тем, за кого себя выдаёт?”, т.е. произвести аутентификацию. На нашем языке вопрос будет звучать как “попадет ли вектор-образец в нужную область?”.
В следующей статье я рассмотрю способы оценки решений, а именно, как посчитать, какой алгоритм лучше справляется с задачей идентификации и аутентификации.
Никита Лукьянов
аналитик-разработчик Департамента Инноваций НСПК