Какво е разпознаване на лица? AI за Big Brother

Може ли Биг Брадър да идентифицира лицето ви от наблюдението на видеонаблюдение на улично ниво и да каже дали сте щастлив, тъжен или ядосан? Може ли това удостоверяване да доведе до ареста ви с неизпълнена заповед? Какви са шансовете, че идентификацията е неправилна и наистина се свързва с някой друг? Можете ли да победите наблюдението изцяло, използвайки някакъв трик?

От другата страна, можете ли да влезете в трезора, защитен от камера и софтуер за идентификация на лица, като вдигнете отпечатък на лицето на упълномощено лице? Ами ако сложите триизмерна маска на лицето на упълномощено лице?

Добре дошли в разпознаването на лица - и подправянето на разпознаването на лице.

Какво е разпознаване на лица?

Разпознаването на лица е метод за идентифициране на неизвестно лице или удостоверяване на самоличността на конкретно лице от лицето му. Това е клон на компютърното зрение, но разпознаването на лица е специализирано и идва със социален багаж за някои приложения, както и някои уязвимости при подправяне.

Как работи разпознаването на лица?

Ранните алгоритми за разпознаване на лица (които все още се използват днес в подобрена и по-автоматизирана форма) разчитат на биометрични данни (като например разстоянието между очите), за да превърнат измерените черти на лицето от двуизмерно изображение в набор от числа (функция вектор или шаблон), който описва лицето. След това процесът на разпознаване сравнява тези вектори с база данни с известни лица, които са съпоставени с характеристики по същия начин. Едно усложнение в този процес е настройването на лицата към нормализиран изглед, за да се вземат предвид въртенето и накланянето на главата, преди да се извлекат показателите. Този клас алгоритми се нарича геометричен .

Друг подход за разпознаване на лица е да се нормализират и компресират двуизмерни изображения на лицето и да се сравнят с база данни с подобно нормализирани и компресирани изображения. Този клас алгоритми се нарича фотометричен .

Триизмерното разпознаване на лица използва триизмерни сензори за заснемане на лицевото изображение или реконструира триизмерното изображение от три двумерни проследяващи камери, насочени под различни ъгли. 3-D разпознаването на лица може да бъде значително по-точно от 2-D разпознаването.

Анализът на текстурата на кожата картографира линиите, шарките и петна по лицето на човек към друг вектор на характеристика. Добавянето на анализ на текстурата на кожата към 2-D или 3-D разпознаването на лица може да подобри точността на разпознаване с 20 до 25 процента, особено в случаите на подобни на близнаци и близнаци. Можете също да комбинирате всички методи и да добавите многоспектърни изображения (видима светлина и инфрачервена светлина), за още по-голяма точност.

Разпознаването на лица се подобрява годишно от началото на полето през 1964 г. Средно процентът грешки намалява наполовина на всеки две години.

Свързано видео: Как работи разпознаването на лицето

Тестове на доставчици за разпознаване на лица

NIST, Националният институт за стандарти и технологии в САЩ, провежда тестове на алгоритми за разпознаване на лица, Тест за разпознаване на лица (FRVT), от 2000 г. Използваните набори от данни за изображения са предимно снимки на правоохранителни органи, но също така включват диви неподвижни изображения, като тези, намерени в Wikimedia, и изображения с ниска разделителна способност от уеб камери.

Алгоритмите FRVT се представят предимно от търговски доставчици. Сравненията за предходната година показват големи печалби в производителността и точността; според доставчиците това е преди всичко поради използването на дълбоки конволюционни невронни мрежи.

Свързаните програми за тестване на разпознаване на лица NIST са изследвали демографски ефекти, откриване на морфинг на лица, идентифициране на лица, публикувани в социалните медии, и идентифициране на лица във видео. Предишна поредица от тестове бяха проведени през 90-те години под различно име, технология за разпознаване на лица (FERET).

NIST

Приложения за разпознаване на лица

Приложенията за разпознаване на лица най-вече попадат в три основни категории: сигурност, здравеопазване и маркетинг / продажба на дребно. Сигурността включва правоприлагането, а този клас на разпознаване на лица може да бъде толкова доброкачествен, колкото по-бързо и по-точно съвпадение на хората със снимките на паспорта им, отколкото хората, и толкова зловещ като сценария „Лице на интерес“, при който хората се проследяват чрез видеонаблюдение и се сравняват към съпоставени бази данни със снимки. Сигурността извън правоприлагащите органи включва често срещани приложения като отключване с лице за мобилни телефони и контрол на достъпа за лаборатории и трезори.

Здравните приложения за разпознаване на лица включват проверки на пациенти, откриване на емоции в реално време, проследяване на пациента в дадено заведение, оценка на нивата на болка при невербални пациенти, откриване на определени заболявания и състояния, идентификация на персонала и сигурност на съоръжението. Приложенията за маркетинг и продажба на дребно за разпознаване на лица включват идентифициране на членовете на програмата за лоялност, идентифициране и проследяване на известни магазини и разпознаване на хората и техните емоции за целенасочени предложения за продукти.

Противоречия, пристрастия и забрани за разпознаване на лица

Да се ​​каже, че някои от тези приложения са противоречиви, би било подценяване. Както обсъжда статия от „Ню Йорк Таймс“ от 2019 г., разпознаването на лица се завихря в противоречия - от използването му за наблюдение на стадиона до расисткия софтуер.

Наблюдение на стадиона? Разпознаването на лица беше използвано в Super Bowl през 2001 г.: софтуерът идентифицира 19 души, за които се смята, че са обект на неизпълнени заповеди, въпреки че никой не е арестуван (не поради липса на опит).

Расистки софтуер? Има няколко проблема, като се започне със софтуера за проследяване на лица от 2009 г., който може да проследява белите, но не и чернокожите, и продължава с проучването на MIT от 2015 г., което показва, че софтуерът за разпознаване на лица по онова време работи много по-добре върху бели мъжки лица, отколкото при жени и / или Черни лица.

Този вид проблеми доведоха до категорични забрани на софтуера за разпознаване на лица на определени места или за конкретни цели. През 2019 г. Сан Франциско стана първият голям американски град, който блокира полицията и други правоприлагащи органи от използването на софтуер за разпознаване на лица; Microsoft призова за федерални разпоредби за разпознаване на лица; и MIT показаха, че Amazon Rekogmination има повече проблеми с определянето на женския пол, отколкото мъжкия пол от изображения на лица, както и повече проблеми с черния женски пол, отколкото белия женски пол.

През юни 2020 г. Microsoft обяви, че няма да продава и не е продал своя софтуер за разпознаване на лица на полицията; Amazon забрани на полицията да използва Rekogmination за една година; и IBM изостави технологията си за разпознаване на лица. Банното разпознаване на лица изцяло обаче няма да е лесно, като се има предвид широкото му приемане в iPhone (Face ID) и други устройства, софтуер и технологии.

Не всеки софтуер за разпознаване на лица страда от едни и същи пристрастия. Проучването за демографски ефекти от NIST за 2019 г., последвано от работата на MIT, показа, че алгоритмичните демографски пристрастия варират значително сред разработчиците на софтуер за разпознаване на лица. Да, има демографски ефекти върху степента на фалшиво съвпадение и честотата на фалшиво несъвпадение на алгоритмите за идентификация на лица, но те могат да варират с няколко порядъка от доставчик до продавач и с времето намаляват.

Хакерско разпознаване на лица и техники против подправяне

Като се има предвид потенциалната заплаха за поверителността от разпознаването на лица и привличането на получаването на достъп до висококачествени ресурси, защитени чрез удостоверяване на лицето, има много усилия за хакване или подправяне на технологията. Можете да представите отпечатано изображение на лице вместо живо лице, или изображение на екран, или триизмерна отпечатана маска, за да преминете удостоверяване. За видеонаблюдение можете да възпроизвеждате видеоклип. За да избегнете наблюдение, можете да изпробвате тъканите и гримовете „CV Dazzle“ и / или IR излъчвателите на светлина, за да заблудите софтуера да не разпознава лицето ви.

Разбира се, има усилия за разработване на техники за подправяне на всички тези атаки. За да открият отпечатани изображения, доставчиците използват тест за жизненост, например изчакване обектът да премигва, или извършване на анализ на движението, или използване на инфрачервена светлина, за да различи живо лице от отпечатано изображение. Друг подход е да се извърши анализ на микротекстурата, тъй като човешката кожа е оптически различна от отпечатъците и материалите за маски. Най-новите техники за борба с подправянето се базират най-вече на дълбоки конволюционни невронни мрежи.

Това е развиващо се поле. Води се оръжейна война между нападателите и софтуер за подправяне, както и академични изследвания за ефективността на различните техники за атака и защита.

Доставчици за разпознаване на лица

Според Electronic Frontier Foundation MorphoTrust, дъщерно дружество на Idemia (известна преди като OT-Morpho или Safran), е един от най-големите доставчици на разпознаване на лица и други технологии за биометрична идентификация в Съединените щати. Той е проектирал системи за държавни DMV, федерални и щатни правоприлагащи агенции, граничен контрол и летища (включително TSA PreCheck) и държавния департамент. Други често срещани доставчици включват 3M, Cognitec, DataWorks Plus, Dynamic Imaging Systems, FaceFirst и NEC Global.

Тестът за разпознаване на лица NIST за разпознаване на лица изброява алгоритми от много други доставчици от цял ​​свят. Има и няколко алгоритми за разпознаване на лица с отворен код, с различно качество и няколко основни облачни услуги, които предлагат разпознаване на лица.

Amazon Rekognance е услуга за анализ на изображения и видео, която може да идентифицира обекти, хора, текст, сцени и дейности, включително анализ на лице и персонализирани етикети. API на Google Cloud Vision е предварително обучена услуга за анализ на изображения, която може да открива обекти и лица, да чете отпечатан и написан на ръка текст и да вгражда метаданни във вашия каталог с изображения. Google AutoML Vision ви позволява да обучавате персонализирани модели на изображения.

API на Azure Face прави разпознаване на лица, което възприема лица и атрибути в изображение, извършва идентификация на лице, което съответства на лице във вашето частно хранилище с до 1 милион души, и извършва разпознаване на възприети емоции. Face API може да работи в облака или на ръба в контейнери.

Набори от данни за лица за обучение по разпознаване

Налични са десетки набори от данни за лица за изтегляне, които могат да се използват за обучение по разпознаване. Не всички набори от данни за лица са равни: Те са склонни да се различават по размер на изображението, брой представени хора, брой изображения на човек, условия на изображенията и осветление. Органите на реда също имат достъп до непублични набори от данни за лица, като текущи снимки и изображения на шофьорска книжка.

Някои от по-големите бази данни за лица са етикетирани лица в дивата природа, с ~ 13 000 уникални хора; FERET, използван за ранните NIST тестове; базата данни Mugshot, използвана в текущия NIST FRVT; базата данни за камери за наблюдение на SCFace, достъпна и с лицеви забележителности; и етикетирани в Wikipedia Faces, с ~ 1.5K уникални самоличности. Няколко от тези бази данни съдържат множество изображения на идентичност. Този списък от изследователя Итън Майерс предлага някои убедителни съвети за избора на набор от данни за лице за конкретна цел.

В обобщение, разпознаването на лица се подобрява и доставчиците се учат да откриват повечето подправки, но някои приложения на технологията са противоречиви. Процентът на грешките при разпознаване на лица намалява наполовина на всеки две години, според NIST. Доставчиците са подобрили техниките си срещу подправяне чрез включване на конволюционни невронни мрежи.

Междувременно има инициативи за забрана на използването на разпознаване на лица при наблюдение, особено от полицията. Да се ​​забрани изцяло разпознаването на лица обаче ще бъде трудно, като се има предвид колко широко е станало.

Прочетете повече за машинното обучение и дълбокото обучение:

  • Дълбоко обучение срещу машинно обучение: Разберете разликите
  • Какво е машинно обучение? Интелигентност, получена от данни
  • Какво е дълбоко обучение? Алгоритми, които имитират човешкия мозък
  • Обяснени алгоритми за машинно обучение
  • Автоматизирано машинно обучение или AutoML обяснено
  • Обяснено контролирано обучение
  • Обяснено полууправлявано обучение
  • Обяснено учене без надзор
  • Обяснено учебно усилване
  • Какво представлява компютърното зрение? AI за изображения и видео
  • Какво е разпознаване на лица? AI за Big Brother
  • Какво представлява обработката на естествен език? AI за реч и текст
  • Kaggle: Къде учените по данни учат и се състезават
  • Какво е CUDA? Паралелна обработка за графични процесори