Sikkerhetssystemer med funksjon for ansiktsgjenkjenning: prinsipp for drift, installasjon og omfang. Pålitelighet av ansiktsgjenkjenningssystemet. Servere for programvare for ansiktsgjenkjenningsformål

Med misunnelsesverdig regelmessighet dukker det opp artikler på Habré som forteller om visse metoder for ansiktsgjenkjenning. Vi bestemte oss for ikke bare å støtte dette fantastiske emnet, men å publisere vårt interne dokument, som dekker, men ikke alle, men mange tilnærminger til å møte anerkjennelse, deres styrker og svakheter. Den ble satt sammen av Andrey Gusak, vår ingeniør, for unge ansatte i maskinsynsavdelingen, for pedagogiske formål, så å si. I dag tilbyr vi det til alle. På slutten av artikkelen - en imponerende liste over referanser for de mest nysgjerrige.

Så la oss begynne.
Til tross for det store utvalget av algoritmer som presenteres, kan den generelle strukturen til ansiktsgjenkjenningsprosessen skilles ut:

Den generelle prosessen med å behandle et ansiktsbilde under gjenkjenning

På det første stadiet blir ansiktet oppdaget og lokalisert i bildet. På gjenkjenningsstadiet justeres ansiktsbildet (geometrisk og lysstyrke), funksjonene beregnes og selve gjenkjenningen utføres - de beregnede funksjonene sammenlignes med standardene som er lagret i databasen. Hovedforskjellen mellom alle de presenterte algoritmene vil være beregningen av funksjoner og sammenligning av samlingene deres med hverandre.

1. Elastisk graftilpasningsmetode.

Essensen av metoden er redusert til elastisk sammenligning av grafer som beskriver ansiktsbilder. Ansikter er representert som grafer med vektede topper og kanter. På gjenkjenningsstadiet forblir en av grafene - referansen - uendret, mens den andre er deformert for å passe best til den første. I slike gjenkjenningssystemer kan grafer representere både et rektangulært gitter og en struktur dannet av karakteristiske (antropometriske) punkter i ansiktet.

EN)

B)

Et eksempel på strukturen til en graf for ansiktsgjenkjenning: a) et vanlig gitter b) en graf basert på ansiktets antropometriske punkter.

Ved toppunktene i grafen beregnes funksjonsverdier, oftest bruker de komplekse verdier av Gabor-filtre eller deres ordnede sett - Gabor wavelets (Gabor-systemer), som beregnes i et lokalt område av grafens toppunkt lokalt ved å konvolvere piksellysstyrkeverdiene med Gabor-filtre.


Sett (bank, jet) med Gabor-filtre


Et eksempel på en konvolusjon av et ansiktsbilde med to Gabor-filtre

Kantene på grafen er vektet med avstanden mellom tilstøtende hjørner. Forskjellen (avstand, diskriminerende karakteristikk) mellom to grafer beregnes ved å bruke en viss prisdeformasjonsfunksjon, som tar hensyn til både forskjellen mellom verdiene til funksjonene beregnet ved toppunktene og graden av deformasjon av kantene på grafen .
Deformasjonen av grafen skjer ved å forskyve hver av toppunktene med en viss avstand i visse retninger i forhold til dens opprinnelige plassering og velge en slik posisjon der forskjellen mellom verdiene til funksjonene (responsene til Gabor-filtrene) ved toppunktet til den deformerte grafen og den tilsvarende toppunktet til referansegrafen vil være minimal. Denne operasjonen utføres vekselvis for alle toppunktene i grafen til den minste totale forskjellen mellom egenskapene til den deformerbare og referansegrafen er nådd. Verdien av prisdeformasjonsfunksjonen ved denne posisjonen til den deformerbare grafen vil være et mål på forskjellen mellom inngangsbildet og referansegrafen. Denne "avslappende" deformasjonsprosedyren må utføres for alle referanseflater som er lagret i systemdatabasen. Systemgjenkjenningsresultatet er en standard med den beste verdien av prisdeformasjonsfunksjonen.


Et eksempel på deformasjon av en graf i form av et vanlig gitter

Noen publikasjoner indikerer en gjenkjennelseseffektivitet på 95-97% selv i nærvær av forskjellige følelsesmessige uttrykk og endring av ansiktsvinkelen opp til 15 grader. Utviklerne av elastiske sammenligningssystemer på grafer nevner imidlertid de høye beregningskostnadene ved denne tilnærmingen. For eksempel, for å sammenligne inndatabildet med 87 referansebilder, tok det omtrent 25 sekunder når du arbeidet på en parallell datamaskin med 23 transputere (Merk: publikasjonen er datert 1993). I andre publikasjoner om dette emnet er tiden enten ikke angitt, eller det sies at den er lang.

Ulemper: høy beregningsmessig kompleksitet av gjenkjenningsprosedyren. Lav produksjonsevne ved memorering av nye standarder. Lineær avhengighet av kjøretiden på størrelsen på ansiktsdatabasen.

2. Nevrale nettverk

For tiden er det omtrent et dusin typer nevrale nettverk (NN). Et av de mest brukte alternativene er et nettverk basert på en flerlags perceptron, som lar deg klassifisere inngangsbildet / signalet i samsvar med forhåndsinnstillingen / treningen av nettverket.
Nevrale nettverk trenes ved hjelp av et sett med treningseksempler. Essensen av trening kommer ned til å justere vektene til interne forbindelser i prosessen med å løse et optimaliseringsproblem ved å bruke gradient-nedstigningsmetoden. I prosessen med å undervise det nevrale nettverket, trekkes nøkkelfunksjonene automatisk ut, deres betydning bestemmes og relasjonene mellom dem bygges. Det forutsettes at en utdannet NN vil kunne anvende erfaringene fra læringsprosessen på ukjente bilder på grunn av generaliserende evner.
De beste resultatene innen ansiktsgjenkjenning (i henhold til resultatene fra analysen av publikasjoner) ble vist av Convolutional Neural Network eller convolutional neural network (heretter - CNN), som er en logisk utvikling av ideene til slike nevrale nettverksarkitekturer som kognitron og neokognitron. Suksessen skyldes evnen til å ta hensyn til bildets todimensjonale topologi, i motsetning til flerlagsperceptronen.
Karakteristiske trekk ved SNS er lokale reseptorfelt (gir lokal todimensjonal tilkobling av nevroner), generelle vekter (gir deteksjon av noen funksjoner hvor som helst i bildet) og hierarkisk organisering med romlig subsampling. Takket være disse innovasjonene gir SNS delvis motstand mot endringer i skala, forskyvning, rotasjon, endring av perspektiv og andre forvrengninger.


Skjematisk representasjon av arkitekturen til et konvolusjonelt nevralt nettverk

Testing av SNN basert på ORL-databasen, som inneholder bilder av ansikter med små endringer i lyssetting, skala, romrotasjon, posisjon og ulike følelser, viste 96 % gjenkjenningsnøyaktighet.
SNS fikk sin utvikling i utviklingen av DeepFace, som ble kjøpt opp av
Facebook for å gjenkjenne ansiktene til brukerne av sitt sosiale nettverk. Alle arkitektoniske funksjoner er stengt.


Hvordan DeepFace fungerer

Ulemper med nevrale nettverk:å legge til en ny referanseperson i databasen krever en fullstendig omskolering av nettverket på hele det tilgjengelige settet (en ganske lang prosedyre, avhengig av prøvestørrelsen, fra 1 time til flere dager). Problemer av matematisk karakter knyttet til trening: å komme inn i det lokale optimum, velge det optimale optimeringstrinnet, omskolering osv. Vanskelig å formalisere stadiet for valg av nettverksarkitektur (antall nevroner, lag, koblingers natur). Ved å oppsummere alt det ovenstående kan vi konkludere med at NS er en «svart boks» med vanskelige å tolke resultater av arbeidet.

3. Skjulte Markov-modeller (CMM, HMM)

En av de statistiske metodene for ansiktsgjenkjenning er skjulte Markov-modeller (HMM) med diskret tid. HMM bruker de statistiske egenskapene til signaler og tar direkte hensyn til deres romlige egenskaper. Elementene i modellen er: et sett med skjulte tilstander, et sett med observerte tilstander, en matrise med overgangssannsynligheter, en initial sannsynlighet for tilstander. Hver har sin egen Markov-modell. Når man gjenkjenner et objekt, kontrolleres Markov-modellene generert for en gitt base av objekter, og den maksimale observerbare sannsynligheten søkes for at sekvensen av observasjoner for et gitt objekt genereres av den tilsvarende modellen.
Til dags dato har det ikke vært mulig å finne et eksempel på en kommersiell anvendelse av SMM for ansiktsgjenkjenning.

Ulemper:
- det er nødvendig å velge parametrene til modellen for hver database;
– HMM har ikke diskrimineringsevne, det vil si at læringsalgoritmen kun maksimerer responsen til hvert bilde på sin egen modell, men minimerer ikke responsen på andre modeller.

4. Hovedkomponentanalyse (PCA)

En av de mest kjente og velutviklede er metoden for hovedkomponentanalyse (PCA), basert på Karunen-Loev-transformasjonen.
Opprinnelig begynte hovedkomponentanalysen å bli brukt i statistikk for å redusere funksjonsplassen uten betydelig tap av informasjon. I problemet med ansiktsgjenkjenning brukes det hovedsakelig til å representere et ansiktsbilde med en vektor med lav dimensjon (hovedkomponenter), som deretter sammenlignes med referansevektorene som er lagret i databasen.
Hovedmålet med hovedkomponentmetoden er å redusere dimensjonen av funksjonsrommet betydelig på en slik måte at den best mulig beskriver de "typiske" bildene som tilhører mange personer. Ved å bruke denne metoden er det mulig å identifisere ulike variasjoner i treningssettet av bilder av ansikter og beskrive denne variabiliteten på grunnlag av flere ortogonale vektorer, som kalles egenansikter.

Settet med egenvektorer oppnådd én gang på treningssettet med ansiktsbilder brukes til å kode alle andre ansiktsbilder, som er representert av en vektet kombinasjon av disse egenvektorene. Ved å bruke et begrenset antall egenvektorer er det mulig å oppnå en komprimert tilnærming av det inngående ansiktsbildet, som deretter kan lagres i databasen som en vektor av koeffisienter, som samtidig fungerer som en søkenøkkel i ansiktsdatabasen.

Essensen av hovedkomponentmetoden er som følger. Først blir hele treningssettet med ansikter konvertert til én felles datamatrise, der hver rad er én forekomst av ansiktsbildet dekomponert til en rad. Alle ansikter på treningssettet skal reduseres til samme størrelse og med normaliserte histogrammer.


Forvandler treningssettet med ansikter til én felles matrise X

Deretter normaliseres dataene og radene reduseres til 0. gjennomsnitt og 1. varians, og kovariansmatrisen beregnes. For den oppnådde kovariansmatrisen er problemet med å bestemme egenverdiene og de tilsvarende egenvektorene (egenverdiene) løst. Deretter sorteres egenvektorene i synkende rekkefølge av egenverdier og bare de første k vektorene er igjen i henhold til regelen:




PCA-algoritme


Et eksempel på de første ti egenvektorene (egenverdiene) oppnådd på det trente settet med ansikter

= 0.956*-1.842*+0.046

Et eksempel på å konstruere (syntetisere) et menneskelig ansikt ved å bruke en kombinasjon av dets egne ansikter og hovedkomponenter


Prinsipp for å velge et grunnlag fra de første beste egenvektorene


Et eksempel på kartlegging av et ansikt til tredimensjonalt metrisk rom, hentet fra tre egne ansikter og videre gjenkjennelse

Hovedkomponentanalyse har vist seg godt i praktiske anvendelser. Men i tilfeller hvor det er betydelige endringer i belysning eller ansiktsuttrykk i bildet av ansiktet, synker effektiviteten av metoden betydelig. Poenget er at PCA velger et underrom med et slikt mål å tilnærme inputdatasettet så mye som mulig, og ikke å diskriminere mellom klasser av personer.

I en løsning på dette problemet ble det foreslått å bruke den lineære Fisher-diskriminanten (i litteraturen er det et navn "Eigen-Fisher", "Fisherface", LDA). LDA velger et lineært underrom som maksimerer forholdet:

Hvor

Interclass scatter matrise, og

Intra-klasse scatter matrise; m er antall klasser i databasen.

LDA ser etter en dataprojeksjon som gjør klassene så lineært separerbare som mulig (se figuren nedenfor). Til sammenligning ser PCA etter en dataprojeksjon som maksimerer spredningen over hele ansiktsdatabasen (unntatt klasser). Eksperimenter med sterk tank og bunnskyggelegging av ansiktsbilder viste at Fisherface var 95 % effektiv sammenlignet med 53 % for Eigenface.


Den grunnleggende forskjellen mellom dannelsen av projeksjoner PCA og LDA

Forskjellen mellom PCA og LDA

5. Active Appearance Models (AAM) og Active Shape Models (ASM) ()
Active Appearance Models (AAM)
Active Appearance Models (AAM) er statistiske bildemodeller som kan justeres for å passe til det virkelige bildet ved ulike deformasjoner. Denne typen 2D-modell ble foreslått av Tim Coots og Chris Taylor i 1998. Opprinnelig ble aktive utseendemodeller brukt for å estimere parametrene til ansiktsbilder.
Den aktive utseendemodellen inneholder to typer parametere: parametere relatert til form (formparametere) og parametere relatert til den statistiske pikselmodellen til et bilde eller tekstur (utseendeparametere). Før bruk må modellen trenes på et sett med forhåndsmerkede bilder. Bildene merkes manuelt. Hvert merke har sitt eget nummer og definerer et karakteristisk punkt som modellen må finne under tilpasning til et nytt bilde.


Et eksempel på et ansiktsbildemerking fra 68 punkter som danner en AAM-form.

AAM-treningsrutinen begynner med å normalisere formene i de kartlagte bildene for å kompensere for forskjeller i skala, tilt og offset. Til dette brukes den såkalte generaliserte Procrustean-analysen.


Koordinater av punkter i ansiktsformen før og etter normalisering

Hovedkomponentene trekkes deretter ut fra hele settet med normaliserte punkter ved bruk av PCA-metoden.


AAM-formmodellen består av et trianguleringsgitter s0 og en lineær kombinasjon av forskyvninger si i forhold til s0

Videre dannes en matrise fra pikslene inne i trekantene dannet av punktene i formen, slik at hver av kolonnene inneholder pikselverdiene til den tilsvarende teksturen. Det er verdt å merke seg at teksturer som brukes til trening kan være enten enkanals (gråtoner) eller flerkanals (for eksempel RGB-fargerom eller annet). Når det gjelder flerkanalsteksturer, dannes pikselvektorer separat for hver av kanalene, og deretter settes de sammen. Etter å ha funnet hovedkomponentene i teksturmatrisen, anses AAM-modellen som opplært.

AAMs utseendemodell består av en basisvisning A0 definert av piksler innenfor et basisgitter s0 og en lineær kombinasjon av forskyvningene til Ai i forhold til A0

Et eksempel på konkretisering av AAM. Formparametervektor
p = (p_1, p_2, 〖…, p〗 _m) ^ T = (- 54,10, -9.1,...) ^ T brukes til å syntetisere en modell av formen s, og parametervektoren λ = (λ_1, λ_2, 〖…, λ〗 _m) ^ T = (3559,351, -256,...) ^ T for å syntetisere utseendet til modellen. Den endelige ansiktsmodellen 〖M (W (x; p))〗 ^ oppnås som en kombinasjon av to modeller - form og utseende.

Tilpasning av modellen til et spesifikt ansiktsbilde utføres i prosessen med å løse et optimaliseringsproblem, hvis essens er å minimere det funksjonelle

Gradient nedstigningsmetode. Parametrene til modellen funnet i dette tilfellet vil gjenspeile modellens posisjon på et spesifikt bilde.




Et eksempel på tilpasning av en modell til et spesifikt bilde i 20 iterasjoner av gradientnedstigningsprosedyren.

AAM kan brukes til å simulere bilder av objekter som er utsatt for både stiv og ikke-stiv deformasjon. AAM består av et sett med parametere, hvorav noen representerer formen på ansiktet, resten setter teksturen. Deformasjoner er vanligvis forstått som en geometrisk transformasjon i form av en translasjon, rotasjon og skaleringssammensetning. Når du løser problemet med å lokalisere et ansikt i et bilde, utføres søket etter AAM-parametere (plassering, form, tekstur), som representerer det syntetiserte bildet som er nærmest det observerte. Basert på AAMs nærhet til det justerte bildet, tas en avgjørelse om det er et ansikt eller ikke.

Active Shape Models (ASM)

Essensen av ASM-metoden er å ta hensyn til de statistiske sammenhengene mellom plasseringen av antropometriske punkter. På det tilgjengelige eksemplet av ansiktsbilder, tatt forfra. På bildet markerer eksperten plasseringen av de antropometriske punktene. I hvert bilde er punktene nummerert i samme rekkefølge.




Et eksempel på en ansiktsformrepresentasjon som bruker 68 punkter

For å bringe koordinatene på alle bilder til et enkelt system, den såkalte. generalisert rulleanalyse, som et resultat av at alle punkter bringes til samme skala og sentreres. Videre, for hele settet med bilder, beregnes gjennomsnittsformen og kovariansmatrisen. Basert på kovariansmatrisen beregnes egenvektorer, som deretter sorteres i synkende rekkefølge av deres tilsvarende egenverdier. ASM er definert av en matrise Φ og en gjennomsnittlig formvektor s ̅.
Deretter kan enhver form beskrives ved hjelp av en modell og parametere:

Lokalisering av ASM-modellen på et nytt bilde som ikke er inkludert i treningsprøven, utføres i prosessen med å løse optimaliseringsproblemet.


a B C D)
Illustrasjon av prosessen med å lokalisere ASM-modellen på et spesifikt bilde: a) startposisjon b) etter 5 iterasjoner c) etter 10 iterasjoner d) modellen har konvergert

Hovedmålet til AAM og ASM er imidlertid ikke ansiktsgjenkjenning, men den nøyaktige lokaliseringen av ansiktet og antropometriske punkter i bildet for videre behandling.

I nesten alle algoritmer er et obligatorisk trinn som går foran klassifisering justering, som betyr å justere ansiktsbildet til frontposisjonen i forhold til kameraet eller bringe et sett med ansikter (for eksempel i en treningsprøve for å trene en klassifiser) til et enkelt koordinatsystem. For å implementere dette stadiet er det nødvendig å lokalisere antropometriske punkter som er karakteristiske for alle ansikter på bildet - oftest er disse sentrene til pupillene eller hjørnene av øynene. Ulike forskere skiller forskjellige grupper av slike punkter. For å redusere beregningskostnadene for sanntidssystemer, tildeler utviklere ikke mer enn 10 slike poeng.

AAM- og ASM-modellene er designet for å nøyaktig lokalisere disse antropometriske punktene i ansiktsbildet.

6. Hovedproblemene knyttet til utviklingen av ansiktsgjenkjenningssystemer

Belysningsproblem

Hodeposisjonsproblem (ansikt er tross alt et 3D-objekt).

For å vurdere effektiviteten til de foreslåtte ansiktsgjenkjenningsalgoritmene, har DARPA-byrået og US Army Research Laboratory utviklet programmet FERET (ansiktsgjenkjenningsteknologi).

I storskala-tester av FERET-programmet deltok algoritmer basert på fleksibel sammenligning på grafer og ulike modifikasjoner av hovedkomponentanalysen (PCA). Effektiviteten til alle algoritmer var omtrent den samme. I denne forbindelse er det vanskelig eller til og med umulig å skille klart mellom de to (spesielt hvis testdatoer er avtalt). For frontalbilder tatt samme dag er den akseptable gjenkjenningsnøyaktigheten vanligvis 95 %. For bilder tatt med forskjellige enheter og under forskjellige lysforhold faller nøyaktigheten vanligvis til 80 %. For bilder tatt med en forskjell på ett år var gjenkjenningsnøyaktigheten omtrent 50 %. Det bør bemerkes at selv 50 prosent er mer enn akseptabel nøyaktighet av denne typen system.

Hvert år publiserer FERET en rapport om den komparative testen av moderne ansiktsgjenkjenningssystemer basert på mer enn én million ansikter. Dessverre avslører ikke de siste rapportene prinsippene for byggegjenkjenningssystemer, men bare resultatene av driften av kommersielle systemer publiseres. I dag er det ledende systemet NeoFace-systemet utviklet av NEC.

Referanser (googlet på den første lenken)
1. Bildebasert ansiktsgjenkjenning - problemer og metoder
2. Ansiktsgjenkjenning A Survey.pdf
3. Ansiktsgjenkjenning En litteraturundersøkelse
4. En undersøkelse av ansiktsgjenkjenningsteknikker
5. En undersøkelse av ansiktsgjenkjenning, utvinning og gjenkjenning
6. Oversikt over metoder for å identifisere personer basert på ansiktsbilder
7. Metoder for å gjenkjenne en person ved ansiktsbilde
8. Komparativ analyse av ansiktsgjenkjenningsalgoritmer
9. Ansiktsgjenkjenningsteknikker
10. Omtrent én tilnærming til lokalisering av antropometriske punkter.
11. Ansiktsgjenkjenning i gruppebilder ved hjelp av segmenteringsalgoritmer
12. Forskningsrapport 2. trinn om ansiktsgjenkjenning
13. Ansiktsgjenkjenning ved Elastic Bunch Graph Matching
14. Algoritmer for å identifisere en person fra et fotografi basert på geometriske transformasjoner. Avhandling.
15. Forvrengningsinvariant objektgjenkjenning i Dynamic Link Architecture
16. Ansiktsgjenkjenning ved bruk av aktive formmodeller, lokale patcher og støttevektormaskiner
17.Ansiktsgjenkjenning ved bruk av aktive utseendemodeller
18. Aktive utseendemodeller for ansiktsgjenkjenning
19. Ansiktsjustering ved hjelp av aktiv formmodell og støttevektormaskin
20. Aktive formmodeller - deres opplæring og anvendelse
21. Fisher Vector Faces in the Wild
22. Egenansikter vs. Fiskefjesgjenkjenning ved bruk av klassespesifikk lineær projeksjon
23. Egenansikter og fiskeansikter
24. Dimensjonsreduksjon
25. ICCV 2011 veiledning om delebasert deformerbar registrering
26. Begrenset lokal modell for ansiktsjustering, en veiledning
27. Hvem er du - Lærende personspesifikke klassifiserere fra video
28. Gjenkjenning av en person ved ansiktsbilde ved bruk av nevrale nettverksmetoder
29. Ansiktsgjenkjenning A Convolutional Neural Network Approach
30. Ansiktsgjenkjenning ved hjelp av Convolutional Neural Network og Simple Logistic Classifier
31. Ansiktsbildeanalyse med konvolusjonelle nevrale nettverk
32. Metoder for ansiktsgjenkjenning basert på skjulte Markov-prosesser. Forfatter-ferat
33. Anvendelse av skjulte Markov-modeller for ansiktsgjenkjenning
34. Ansiktsgjenkjenning og gjenkjenning ved bruk av skjulte Markovs-modeller
35. Ansiktsgjenkjenning med GNU Octave-MATLAB
36. Ansiktsgjenkjenning med Python
37. Antropometrisk 3D-ansiktsgjenkjenning
38.3D ansiktsgjenkjenning
39. Ansiktsgjenkjenning basert på tilpasning av en 3D Morphable Model
40. Ansiktsgjenkjenning
41. Robust ansiktsgjenkjenning via sparsom representasjon
42. FERET-evalueringsmetodikken for ansiktsgjenkjenningsalgoritmer
43. Søk etter ansikter i elektroniske samlinger av historiske fotografier
44. Design, implementering og evaluering av maskinvaresynssystemer dedikert til sanntidsansiktsgjenkjenning
45. En introduksjon til det gode, det dårlige og det stygge ansiktsgjenkjenningsproblemet
46. ​​Forskning og utvikling av metoder for å oppdage et menneskelig ansikt på digitale bilder. Diplom
47. DeepFace lukker gapet til ytelse på menneskelig nivå i ansiktsverifisering
48. Ta biten av automatisert navngivning av karakterer i TV-video
49. Mot et praktisk ansiktsgjenkjenningssystem Robust justering og belysning ved sparsom representasjon
50. Algoritmer for å oppdage en persons ansikt for å løse anvendte problemer med bildeanalyse og prosessering
51. Ansiktsgjenkjenning og lokalisering i bildet
52. Modifisert Viola-Jones mod
53. Utvikling og analyse av algoritmer for deteksjon og klassifisering av objekter basert på maskinlæringsmetoder
54. Oversikt over
55. Ansiktsgjenkjenningsleverandørtest (FRVT)
56. Om effektiviteten av å bruke SURF-algoritmen i problemet med å identifisere personer

Moderne integrerte sikkerhetssystemer er i stand til å løse problemer av enhver kompleksitet ved alle typer industrielle, sosiale og hjemlige anlegg. Videoovervåkingssystemer er svært viktige verktøy for sikkerhetskomplekser, og kravene til funksjonaliteten til segmentet vokser stadig.

Integrerte sikkerhetssystemer

En enkelt plattform inkluderer moduler for sikkerhets- og brannutstyr, adgangskontroll og administrasjon, videoovervåking eller sikkerhets-tv (SOT). Inntil nylig var funksjonene til sistnevnte begrenset til videoovervåking og registrering av situasjonen ved anlegget og det tilstøtende territoriet, arkivering og lagring av data. Klassiske videosystemer har en rekke betydelige ulemper:

  • Menneskelig faktor. Ineffektivt arbeid fra operatøren ved kringkasting av store mengder informasjon.
  • Umulighet for kirurgisk inngrep, utidig analyse.
  • Betydelig tid brukt på å søke etter og identifisere en hendelse.

Utviklingen av digitale teknologier har ført til opprettelsen av "smarte" automatiserte systemer.

Styrke i intelligens

Grunnprinsippet for intelligent er videoanalyse – en teknologi basert på metoder og algoritmer for mønstergjenkjenning og automatisert datainnsamling som et resultat av videostrømanalyse. Slikt utstyr, uten menneskelig innblanding, er i stand til å oppdage og spore i sanntid de tildelte målene (bil, gruppe mennesker), potensielt farlige situasjoner (røyk, brann, uautorisert interferens med driften av videokameraer), programmerte hendelser og umiddelbart utstede. et alarmsignal. Ved å filtrere videodata uten interesse reduseres belastningen på kommunikasjonskanalene og arkivbasen betydelig.

Det mest populære videoanalyseverktøyet er ansiktsgjenkjenningssystemet. Avhengig av funksjonene som utføres og oppgavene som er tildelt, stilles det visse krav til utstyret.

Firmware og maskinvare

For effektiv drift av systemet brukes flere typer IP-videokameraer med ulike driftsegenskaper. Deteksjonen av et objekt i det kontrollerte området registreres av panoramakameraer med en oppløsning på 1 megapiksel og en brennvidde på 1 mm og skanneenheter sikter mot det. Dette er mer avanserte kameraer (fra 2Mp, fra 2mm), som utfører gjenkjenning ved hjelp av enkle teknikker (3-4 parametere). For å identifisere et objekt brukes kameraer med god bildekvalitet, tilstrekkelig for bruk av komplekse algoritmer (fra 5 Mp, 8-12 mm).

De mest populære programvareproduktene for ansiktsgjenkjenning "Face Intellect" (utviklet av House Control), Face Director (av Synesis) og VOCORD FaceControl (VOCORD) viser:

  • Høy sannsynlighet for gjenstandsidentifikasjon (opptil 99%).
  • Støtte for et bredt spekter av rotasjonsvinkler for videokameraer.
  • Evnen til å fremheve ansikter selv i tette fotgjengermasser.
  • Variabiliteten i utarbeidelsen av analytiske rapporter.

Grunnleggende om mønstergjenkjenning

Eventuelle biometriske gjenkjenningssystemer er basert på å identifisere korrespondansen mellom de leste fysiologiske egenskapene til en person til et bestemt forhåndsbestemt mønster.

Skanning skjer i sanntid. IP-kameraet overfører videostrømmen til terminalen, og ansiktsgjenkjenningssystemet bestemmer korrespondansen mellom bildet og fotografiene som er lagret i databasen. Det er to hovedmetoder. Den første er basert på statiske prinsipper: basert på resultatene av behandlingen av biometriske parametere, opprettes en elektronisk prøve i form av et unikt nummer som tilsvarer en bestemt person. Den andre metoden simulerer en «menneskelig» tilnærming og er preget av selvlæring og robusthet. Personlig identifikasjon ved videobilde tar hensyn til aldersrelaterte endringer og andre faktorer (tilstedeværelsen av hodeplagg, skjegg eller bart, briller). Denne teknologien lar deg jobbe selv med gamle fotografier og om nødvendig med røntgenbilder.

Algoritme for ansiktssøk

Den vanligste ansiktsgjenkjenningsteknikken er bruk av Haar-kaskader (sett med masker).

Masken er et rektangulært vindu med en annen kombinasjon av hvite og svarte segmenter.

Mekanismen til programmet er som følger: videorammen er dekket med et sett med masker, og i henhold til konvolusjonsresultatene (teller piksler som faller inn i de hvite og svarte sektorene), beregnes forskjellen og sammenlignes med en viss terskel verdi.

For å forbedre arbeidet til klassifisereren, opprettes positive (rammer der folks ansikter er til stede) og negative (uten dem) treningsprøver. I det første tilfellet er konvolusjonsresultatet høyere enn terskelverdien, i det andre er det lavere. Ansiktsdetektoren, med en tillatt feil, bestemmer summen av konvolusjonene av alle kaskader og, når terskelen overskrides, signaliserer tilstedeværelsen av ansikter i rammen.

Gjenkjenningsteknologier

Etter deteksjon og lokalisering, på det foreløpige stadiet, skjer lysstyrken og geometrisk justering av bildet. Ytterligere handlinger - beregning av funksjoner og identifikasjon - kan utføres på ulike metoder.

Når du skanner et ansikt forfra i et rom med utmerket belysning, viser algoritmer som fungerer med todimensjonale bilder gode resultater. Ved å analysere de unike punktene og avstandene mellom dem, bestemmer ansiktsgjenkjenningssystemet identifikasjonen av forskjellskoeffisientene mellom det "levende" bildet og den registrerte malen.

Tredimensjonale teknologier er motstandsdyktige mot endringer i lysstrømmen, det tillatte avviket fra frontbildet er opptil 45 grader. Her analyseres ikke bare punkter og linjer, men også egenskapene til overflater (krumning, profil), metrikken til avstandene mellom dem. For at slike algoritmer skal fungere, kreves maksimal kvalitet på videoopptak med en frekvens på opptil 200 bilder / s. Systemet er basert på stereovideokameraer med en matrise på 5 megapiksler, høy optisk oppløsning og minimalisert synkroniseringsfeil. I tillegg er de koblet med en spesiell tidskabel for overføring av synkroniseringspulser.

Status for det moderne systemmarkedet

Førstnevnte, på grunn av deres høye kostnader, ble kun utviklet for statlige militære anlegg og ble først på midten av 90-tallet tilgjengelig for kommersielle organisasjoner. Den raske utviklingen av teknologi har gjort det mulig å øke nøyaktigheten til systemene og utvide omfanget av deres anvendelse. På markedet i vårt land tilhører ledende posisjoner amerikanske og vesteuropeiske produsenter av sikkerhetssystemer. Salgslederen er utstyret til selskapene ZN Vision Technologies og Visionics. De mest lovende blant innenlandske utviklere er forskningen og produktene til Vocord, NTechLab, Soling, VisionLabs og CRT-gruppen, som blant annet også er engasjert i tilpasning av utenlandske komplekser til russiske forhold.

Ansiktskontroll på datamaskin

Det mest omfattende bruksområdet for kontaktløs identifikasjon er kampen mot terrorisme og kriminalitet. Et bilde av forbryterens ansikt er lagret i en database. På overfylte steder (flyplasser, togstasjoner, shopping- og underholdningssentre, idrettsanlegg) blir en menneskelig strøm filmet i sanntid for å identifisere etterlyste personer.

Det neste området er tilgangskontrollsystemer: et utvalg av et fotografi på et elektronisk pass sammenlignes med en modell oppnådd som et resultat av å behandle data fra videokameraer. Prosedyren finner sted umiddelbart, uten at det kreves noen ekstra handlinger fra den som gjennomgår (i motsetning til å skanne netthinnen i øyet eller ta fingeravtrykk).

En annen raskt voksende bransje er markedsføring. En interaktiv reklametavle, etter å ha skannet en persons ansikt, bestemmer kjønn og alder, og gjengir bare de reklamene som potensielt kan være interessante for kunden.

Utviklingstrender og utsikter

Ansiktsgjenkjenningssystemer er etterspurt i banksektoren.

På slutten av fjoråret klarte ledelsen i Post Bank, etter å ha installert 50 000 smarte videokameraer på kontorene sine, å spare millioner av rubler ved å forhindre svindel i utlåns- og betalingssegmentene. Eksperter sier at innen 2021 vil det nødvendige infrastrukturnettverket bli opprettet og eventuelle transaksjoner ved minibanker vil bli mulig først etter biometrisk identifikasjon av klientens ansikt.

I det neste tiåret vil høyteknologi gjøre det mulig å åpne en kjede med fulle selvbetjente butikker: kjøperen passerer foran butikkvinduene, velger produktet han liker og forlater. Ansikts- og bildegjenkjenningssystemet vil bestemme identiteten til kjøperen, kjøpe og trekke det nødvendige beløpet fra kontoen hans.

Det arbeides med å lage systemer for erkjennelse av den psykoemosjonelle tilstanden. Analyse av menneskelige følelser vil være etterspurt i multimediaområder: animasjon, kino, industrien for å lage dataspill.

En av garantiene for livskvalitet i det moderne samfunn er den riktige tilnærmingen til å sikre personlig sikkerhet og sikkerheten til eiendom. Kravene til videoopptakssystemer øker stadig. Et godt overvåkingssystem i disse dager skal ikke bare kunne registrere hva som skjer på flyttbare medier, men også gjenkjenne og identifisere personer i rammen.

Søknadssteder

Funksjonen "ansiktsgjenkjenning" har funnet sin anvendelse i mange aspekter av menneskelivet. Ved hjelp av videoovervåkingssystemer av denne typen kan du:

  • organisere et sjekkpunkt ved virksomheten eller andre stengt fra fremmedlegemer. Videoovervåking kan kobles til turnstiles og et automatisk sjekkpunkt kan organiseres etter prinsippet om "venn eller fiende";
  • organisere et system for å motvirke tyveri i utsalgssteder og andre private eiendommer. Alle butikker, spesielt store, står overfor problemet med avhengigheten av noen besøkende til tyveri. Ofte pleier de samme personene å utføre tyverier på de samme utsalgsstedene. Etter å ha installert kameraer med et ansiktsgjenkjenningssystem, kan du se nærmere på handlingene til en person som allerede har blitt tatt i å stjele. Skanneren vil rapportere til sikkerhetskonsollen så snart den kommer inn i butikken;
  • å organisere et system for å motvirke penetrering inn i territoriet til husholdninger og andre lukkede gjenstander. Noen ganger er det vanskelig for en person å skille en skjult inntrenger fra en busk eller annen gjenstand på skjermen, spesielt hvis kameraene er installert i et svakt opplyst område av terrenget. Men det som er utilgjengelig for en person kan godt gjøres av en datamodul;
  • ansiktskontroll på nattklubber - 100 % beskyttelse mot ubudne gjester.

Driftsprinsipp

Videoovervåkingssystemet med funksjonen "ansiktsgjenkjenning" fungerer etter prinsippet om å sammenligne det mottatte bildet med det i databasen. Det gjennomsnittlige komplekset er i stand til å identifisere et menneskelig ansikt i en avstand som ikke overstiger ti meter fra kameraet. I dette tilfellet vil den besøkende bli gjenkjent selv under hensyntagen til tilstedeværelsen av endringer i de fysiske parametrene i ansiktet: endring av frisyre, skjegg, briller, etc. Analysen er basert på en sammenligning av biometriske parametere for strukturen til hode, individuelt for hver person. I dette tilfellet skjer skanning mens du er på farten, den besøkende trenger bare å snu ansiktet mot skanneren mens han beveger seg. Videoovervåkingssystemet kan kobles til turnstiles og andre enheter autorisert logg inn og arbeid automatisk. Uidentifiserte besøkende vil ikke få tilgang til det beskyttede området, og bildet deres vil bli lagret i databasen for behandling av sikkerhetstjenesten.

Vanligvis er slike systemer installert i store selskaper, der den fremtidige suksessen til selskapet avhenger av sikkerhet, for eksempel et selskap som utvikler nye typer våpen eller mikrokretser, et biologisk laboratorium. Systemet gjenkjenner automatisk alle ansatte og sammenligner dem med databasen. Ved misforhold eller fravær av en person i systemet aktiverer det sikkerhetsprotokollene, et alarmsignal og en rød indikator lyser i sikkerhetsrommet. Stedet for deteksjon av inntrengeren er nøyaktig angitt på det elektroniske kartet over anlegget, og vakten finner inntrengeren i løpet av sekunder.

Arbeidsmetoder

Ansiktsgjenkjenningskameraer fungerer i to moduser, todimensjonale og tredimensjonale. Når det gjelder 2D-systemer, er gjenkjenningen basert på et flatt bilde. Todimensjonale kameraer er svært følsomme for belysningsnivået i rommet; kvaliteten på det endelige bildet avhenger i betydelig grad av denne parameteren. I dårlig lys vil bildet være vanskelig å se. 3D-skjermkameraer gjenskaper et tredimensjonalt bilde fra det resulterende bildet. Dårlig belysning er ikke en spesiell hindring for dem, vanligvis kan det bare forvrenge teksturen i ansiktet litt.

Visninger

Avhengig av målene og målene som er satt for videoovervåkingssystemet med ansiktsgjenkjenningsfunksjonen, er de delt inn i:

  • deteksjon (Kamera fra 1 Mp, brennvidde fra 1 mm). Handlingen til dette sikkerhetssystemet er rettet mot å fikse inntrengninger i kontrollerte objekter. Skanneren er i stand til å skille en person fra en katt eller et ekorn, men vil ikke kunne identifisere ham;
  • gjenkjenning (Kamera fra 2 Mp, brennvidde fra 6 mm). I dette tilfellet er hovedfunksjonen til skanneren å gjenkjenne ansiktene til besøkende på prinsippet om "venn eller fiende". Når du ser på en videosekvens, vil bildet være ganske uskarpt, du vil gjenkjenne kjente ansikter på det, men hvis en tyv har penetrert objektet, vil det være svært vanskelig å finne det fra disse rammene;
  • identifikasjon (Kamera mer enn 2 Mp, brennvidde fra 8 mm) Disse systemene kan utføre alle funksjonene til de tidligere typene, mens kvaliteten på det resulterende bildet vil være nok til å identifisere en inntrenger. Et slikt bilde kan godt overføres til rettsvesenet og rettshåndhevende organer.

I parentes for beskrivelsen av hver type videoovervåkingssystem har vi angitt minimumskravene til kameraoppløsning og objektivets brennvidde. Ved bestilling av utstyr må det tas hensyn til at disse egenskapene er tilstrekkelige under ideelle forhold for skyting. Naturligvis, i praksis, er dette sjelden, derfor, når du velger skannere, er det bedre å kjøpe enheter med en margin, for eksempel for gjenkjenningssystemer - en oppløsning på 2 megapiksler og en brennvidde på 8 mm, for skjermsystemer - en oppløsning på 5 megapiksler og brennvidde på 12 mm.

Naturligvis avhenger sluttresultatet ikke bare av disse egenskapene. Brennvidde og oppløsning er viktig, men belysning, innsynsvinkler og mange andre parametere må tas i betraktning når du monterer et kamera. Derfor er det bedre å overlate valget og installasjonen til fagfolk.

I mai i år investerte Impulse-fondet, tilknyttet Roman Abramovich, i NtechLab. Sistema VC, et venturefond fra AFK Sistema, investerte i VisionLabs i 2016.

I følge analyseselskapet MarketsandMarkets, som leder Bloomberg, vil volumet av ansiktsgjenkjenningsmarkedet i 2021 nå 6,84 milliarder dollar. I 2016 var det halvparten av det - 3,35 milliarder dollar.

Svindlere vil ikke bestå

Grigory Bakunov, som har stillingen som direktør for teknologispredning hos Yandex, har laget en tjeneste som designer en unik tilfeldig sminke som unngår identifikasjon. Han rapporterte dette i sin telegramkanal. Teamets prosjekt var basert på en algoritme som, basert på det originale fotografiet, valgte et nytt bilde etter prinsippet om "anti-likhet". Deretter, basert på det oppnådde resultatet, utarbeidet makeupartisten en sminkeplan, hvoretter den ble påført modellens ansikt. Men så bestemte utbyggeren seg for å legge ned prosjektet. Han forklarte dette trinnet med samvittighetsbetraktninger: "Det er for stor sjanse til å bruke produktet ikke for godt, men til andre formål totalt." Algoritmene som testet denne sminken er allerede utdaterte, og moderne algoritmer gjenkjenner ansiktet selv med slik sminke, sier en representant for VisionLabs.

Den mest omfattende implementeringen av teknologi for ansiktsgjenkjenning blant russiske banker fant sted i Post Bank (skapt av VTB og Russian Post), sier Alexander Khanin, administrerende direktør i VisionLabs. Nå er 50.000 arbeidsplasser til bankansatte utstyrt med spesielle kameraer som kan gjenkjenne ansikter, sier Pavel Gurin, rådgiver for administrerende direktør i Post Bank. Banken har tre bildedatabaser – fotografier av ansatte, bankkunder og svindlere. Hvert bilde lagres kryptert som et sett med tegn. Før man begynner å jobbe med kunder, må en ansatt logge seg inn i bankens system. For å bekrefte identiteten sin skriver han ikke bare inn et passord, men tar også bilder av seg selv. Etter det konverterer et spesielt program bildet til en kode og sammenligner det med koden som er lagret i databasen. Hvis de samsvarer, begynner den ansatte i jobb. Ansiktsgjenkjenningssystemet brukes også til intern attestasjon slik at den ene ikke består tester for den andre og slik at ingen kan gå inn under andres passord og gjennomføre en ulovlig transaksjon.

Når en klient kommer, verifiserer kameraet ham på samme måte. I tillegg sammenligner programvaren kundens bilde med en database med svindlere. Den fylles på både av bankens egen innsats og ved hjelp av interbanksamarbeid.

Penger fra fotografering

Tinkoff Bank har ingen filialer. Men ifølge loven er en bankrepresentant forpliktet til å holde et personlig møte med en klient, så Tinkoff-ansatte tar bilder av ham ved hjelp av en spesiell mobilapplikasjon som konverterer bildet til en upersonlig kode, sier Daria Ermolina, kommunikasjonsdirektør i Tinkoff Bank . Deretter sammenligner systemet koden med databasen. Dette lar deg forsikre deg om at representanten er foran personen som har levert dokumentene, og at han ikke er en svindel, og også redusere behandlingstiden for søknaden.

Otkritie har introdusert pengeoverføringer fra fotografering ved bruk av teknologi for ansiktsgjenkjenning, sa Otkrytie Bank Innovation Director Alexei Blagirev. For å gjøre dette er det nok å ta et bilde av mottakeren i mobilapplikasjonen eller laste opp bildet hans - systemet selv vil finne personens data i databasen for å sende ham penger.

Gjenkjennelse i tall

RUB 1,5 milliarder
det totale beløpet av lån som Post Bank ikke utstedte til svindlere takket være bruken av ansiktsgjenkjenningsteknologi
70%
lovbrudd (inkludert brudd på veiene) avsløres ved hjelp av videoovervåkingssystemer i Moskva
1 milliard bilder fra databasen er i stand til sanntidsgjenkjenning av algoritmen til den russiske oppstarten NtechLab
117 millioner mennesker - fotografiene deres er i det amerikanske politiets ansiktsgjenkjenningsbase, dette er omtrent halvparten av amerikanske voksne

I juli installerte Sberbank en testminibank i Moskva, hvor du bare trenger å ta et bilde for å utføre transaksjoner med en konto, og ikke legge ved et plastkort, sa en bankrepresentant. Eksperimentet vil vare ut 2017, hvoretter banken vil ta stilling til om teknologien skal implementeres videre. Tinkoff Bank annonserte også testing av kundeidentifikasjon i banker.

Sberbank har brukt ansiktsgjenkjenningsteknologi ved utstedelse av lån siden 2014.

Vaksinasjon fra kø

I detaljhandelen brukes ansiktsgjenkjenning for å motivere shoppere, sier Mikhail Ivanov, administrerende direktør i NtechLab. Hvis en person blir gjenkjent ved inngangen til butikken og kjøpshistorikken deres blir sett, så vet de butikkansatte bedre hva de skal tilby, forklarer Ivanov. Hvis han for eksempel kjøpte en TV i en elektronikkbutikk, vil den ansatte kjenne ham igjen, kalle ham ved navn og tilby å kjøpe en ny fjernkontroll.

Dixy testet gjenkjennelsen av kundenes ansikter for å bestemme kjønnssammensetningen til kundene og for målrettet annonsering i kasseområdet og handelsgulvet, sier Vladimir Muravyov, direktør for IT-avdelingen til Dixy Group. X5 Retail Group bruker fortsatt ansiktsgjenkjenningsteknologi i testmodus – for å redusere lengden på køene i kassen og for å optimere butikkplassen. Ansiktsgjenkjenningssystemet kan bestemme hvor mange personer som står i kø og sende et signal om å åpne en ekstra kasse. Videoanalyse hjelper til med å spore hvor flere mennesker passerer i butikken, hva de legger merke til, slik at man senere kan ordne produkter og reklamemateriell på riktig måte.

Høy sikkerhetssone

Det mest utviklede verdensmarkedet for ansiktsgjenkjenningsteknologi er innen sikkerhet, sier Ivanov. I USA er ansiktsbiometri i stor utstrekning implementert på delstatsnivå og brukes av politifolk – blant annet for verifisering ved utstedelse av førerkort, sier han. I tillegg bruker USA og Europa ansiktsidentifikasjon ved passkontrollen når de krysser grensen.

Russiske selskaper tilbyr også å bruke teknologi for ansiktsgjenkjenning innen sikkerhet. Blant hovedkundene til det russiske selskapet "Center of Speech Technologies" er således store stadioner. Når en fan kommer til stadion og bruker et personlig pass til validatoren, bekrefter kameraet over validatoren at det er eieren av passet som prøver å komme inn på stadion. Systemet tillater ikke personer fra fansvartelisten å gå inn i idrettsanlegget. Også "Center for Speech Technologies" introduserte ansiktsgjenkjenningsteknologi på Yuzhno-Sakhalinsk flyplass: når folk som er på ettersøkslisten kommer inn der, sender systemet en melding til politiet og flyplassens sikkerhetstjeneste.

Ashot Gabrelyanovs Magic-selskap lanserte et spill der brukerens ansiktsuttrykk brukes til å kontrollere, sa Gabrelyanov selv på sin Facebook-side. I den første versjonen av spillet må brukeren ødelegge onde karakterer i fire forskjellige farger med et våpen som styres av ansiktsuttrykk - det gjenkjennes ved hjelp av nevrale nettverk. For eksempel, for å bruke en gul kanon, må du skildre glede, for en rød kanon må du lage et sint ansikt.

NtechLab utvikler også et sikkerhetsprodukt som er nødvendig av offentlige etater og spesialtjenester: dette er programvare som finner folk ved hjelp av tilgjengelige databaser, jobber med dokumentene deres.

En stor fremtid

I de kommende årene vil ansiktsanalyseteknologier utvikle seg i to retninger, sa Khanin. Den første er overgangen til å forstå menneskelig atferd: nå er det ikke nok å forstå hvem som er avbildet på et fotografi, det er viktig å vite hvordan en person oppfører seg i forskjellige situasjoner, for eksempel ved et intervju eller når han går ombord på et fly. Den andre retningen er innebygging av brikker med datasyn i enheter slik at de ikke bare kan identifisere brukeren, men også analysere streamingvideoen. Vis for eksempel når en bestemt person kom inn i rommet, eller bygg en 3D-avatar rett på telefonen.

Takket være gjenkjenningsteknologien vil mange fantastiske ting bli virkelige: en person ser bare på vannkokeren - og den vil automatisk varme opp vannet, sier Ivanov.

Høyttaler

Den utgjør en trussel mot sikkerhet og menneskerettigheter, så dens delvise regulering bør erstattes av et fullstendig forbud. Mens hele verden er fascinert av fordelene med ansiktsgjenkjenningsteknologi, mener noen sikkerhetseksperter at den er full av stor skade for menneskeheten. Professor i jus og informatikk Woodrow Hartzog og filosofiprofessor Evan Selinger skisserte sine syn på teknologikontrollteknikker i en Medium-artikkel.

Folket i Troy ville elske det

Det er veldig lett å bukke under for en ytre fristende, men i realiteten feilaktig mening om hvordan menneskehetens fremtid vil bli i en verden som har avslørt alt det skjulte potensialet til teknologi for ansiktsgjenkjenning. Folk vil umiddelbart kunne motta informasjon om fremmede, de trenger ikke lenger å huske mange passord eller være redde for å glemme lommeboken. Det vil være mulig å enkelt finne hendelser med en bestemt person i arkivene til fotografier og videoer, raskt søke etter savnede personer eller kriminelle, og gjøre offentlige steder trygge.

Det ser ut til at teknologi bare har fordeler, absolutt rettferdighet vil herske i verden, menneskehetens mest utrolige ideer vil bli realisert. Men ingen av overvåkingsmekanismene oppfunnet av menneskeheten har en slik fare som ansiktsgjenkjenningsteknologi.

Tillokket av denne utopiske visjonen, vil folk slippe ansiktsgjenkjenningsteknologi inn i hjemmene sine og åpne for tilgang til enhetene deres, slik at den kan innta en sentral scene i alle nye aspekter av livet. Dette vil bety at fellen har smalt, og så kommer den ubehagelige erkjennelsen at teknologien var en slags trojansk hest. Dette ideelle verktøyet for undertrykkelse er for godt til ikke å bli brukt av regjeringer til å etablere autoritær kontroll og altomfattende regimer som vil ødelegge forestillingen om personvern.

Denne trojanske hesten må ikke komme inn i byen.

Aktuelle diskusjoner

American Civil Liberties Union, sammen med 70 andre, krevde at Amazon sluttet å levere ansiktsgjenkjenningsteknologi til regjeringen, og ba også Kongressen om å innføre et moratorium på bruken av den av regjeringen. Media sluttet seg også til dem og uttrykte bekymring. For eksempel mener redaksjonen i Washington Post at kongressen må gripe inn umiddelbart. Parlamentarikere har god grunn til å tenke også: noen av dem er Amazons programvare for ansiktsgjenkjenning med kriminelle.

Redaksjonen i The Guardian stilte seg heller ikke til side. Microsofts president Brad Smith skrev på et blogginnlegg til den amerikanske regjeringen for å regulere teknologi for ansiktsgjenkjenning:

«Den eneste pålitelige måten å kontrollere bruken av teknologi fra myndighetene på, er å kontrollere bruken av teknologien uavhengig, med tanke på mulige omstendigheter. Vi mener at det i dag er et presserende behov for et statlig initiativ for å overvåke legitim bruk av ansiktsgjenkjenningsteknologi basert på avgjørelsen fra en todelt ekspertkommisjon."

Meningen til lederne av selskapene er av ikke liten betydning, så vel som lovlovene som begrenser bruken av teknologien. Men bare delvis støtte og nøye skrevne instruksjoner vil aldri være nok. Lover kan være til stor nytte, men de vil mest sannsynlig begynne å bli introdusert når teknologien blir mye billigere og enklere å bruke. Smith påpeker at Microsoft etterlyste en nasjonal lov på dette området tilbake i 2005. Mer enn ti år har gått, men kongressen har ikke vedtatt en slik lov.

Hvis ansiktsgjenkjenningsteknologi fortsetter å utvikles og implementeres i livet, vil det oppstå en gigantisk infrastruktur som vil sluke menneskeheten. Som historien har vist, kan utbredt fokus på suksess, frykt for utilstrekkelig sikkerhet og en heftig følelse av makt føre til bedrag, endring i bedriftens verdier og til slutt systematisk misbruk av teknologi.

Menneskelig velvære i fremtiden er bare mulig hvis ansiktsgjenkjenningsteknologi blir forbudt før den blir for fast forankret i menneskelivet.

Hvorfor et forbud er nødvendig

Behovet for et fullstendig forbud mot ansiktsgjenkjenningssystemer er påtrengende. Men noen talentfulle forskere, som Judith Donath, anser denne posisjonen for å være feil. De tilbyr en mer teknologisk nøytral taktikk: å forby spesifikke handlinger, samt identifisere verdier og rettigheter som må beskyttes. Denne tilnærmingen er ganske rimelig for nesten alle digitale teknologier.

Men ingen av overvåkingsmekanismene oppfunnet av menneskeheten har en slik fare som ansiktsgjenkjenningsteknologi. Dette er den manglende delen av en allerede farlig menneskelig overvåkingsinfrastruktur, designet fordi denne infrastrukturen er nødvendig av myndigheter og private virksomheter. Og hvis teknologier blir farlige i en slik grad, og balansen mellom fordeler og skader er så forvrengt, er det på tide å tenke på kategoriske forbud. Visse typer farlige digitale teknologier, for eksempel spionprogrammer, er allerede forbudt på lovnivå. Ansiktsgjenkjenningsteknologi medfører mye større risiko, og det ville ikke skade å fortjene spesiell juridisk oppmerksomhet. Det trengs et spesifikt forbud, basert på et robust, helhetlig, verdibasert og stort sett teknologinøytralt regelverk. Et slikt system vil bidra til å unngå regulatoriske situasjoner der lovgivere prøver å ta igjen tekniske trender.

Overvåking ved bruk av ansiktsgjenkjenningssystemer er iboende vilkårlig. Eksistensen av slike systemer, som i seg selv ofte er skjult for menneskelige øyne, er et brudd på sivile friheter, fordi folk oppfører seg annerledes hvis de mistenker at de blir overvåket. Selv lover som garanterer sterke beskyttelsestiltak vil ikke hindre den undertrykkende følelsen av at en persons evne til å uttrykke seg vil bli skadet.

Eksempler på misbruk og ødeleggelse av ansiktsgjenkjenningsteknologi inkluderer:

  • uforholdsmessig oppmerksomhet til ikke-hvite mennesker, andre minoriteter og sårbare mennesker;
  • å erstatte uskyldspresumsjonen med prinsippet om "mennesker hvis skyld ennå ikke er bevist";
  • spredning av vold og brutalitet;
  • fornektelse av grunnleggende rettigheter og muligheter, slik som beskyttelse mot vilkårlig statlig sporing av et individs bevegelser, vaner, holdninger, interesser og tanker;
  • kontinuerlig "arbeid" av loven - som et konstant mål for tilbakeholdenhet;
  • ødeleggelse av konseptet med å lagre informasjon "praktisk talt uklar", når data er i det offentlige domene, men lagret i forskjellige kilder og det er ekstremt vanskelig å finne dem;
  • spredningen av "overvåkingskapitalismen".

AnsiClaire Garvey bemerker at feil i det kan ha fatale konsekvenser:

«Hva skjer hvis et slikt system svikter? I tilfelle en feil vil videoovervåkingssystemer straffeforfølge, avhøre eller til og med arrestere og sikte en uskyldig person for en forbrytelse. Eller bærbare kameraer med et ansiktsgjenkjenningssystem fra politiet: hvis systemet peker på en person som angivelig kan utgjøre en fare for samfunnet, må politimannen umiddelbart bestemme seg for om han vil bruke et våpen. Uskyldige mennesker kan bli skadet som følge av falske varsler.»

Blant annet er det to artikler som tar for seg mange av disse spørsmålene i detalj: det svært verdifulle arbeidet med bruk av ansiktsgjenkjenning av Electronic Frontier Foundation, senioradvokat Jennifer Lynch og Center on Privacy & Technology-studien ved Georgetown University.

Til tross for problemene som er beskrevet i rapportene, er ikke alle overbevist om at forbudet virkelig er nødvendig. Tross alt utgjør andre teknologier ikke mindre trussel: geolokaliseringsdata, informasjon fra profiler på sosiale nettverk, søkeresultater og mange andre informasjonskilder om brukere kan brukes til å tegne et detaljert portrett av dem. Men ansiktsgjenkjenning har fortsatt en annen type fare og skiller seg ut selv sammenlignet med biometriske data: fingeravtrykk, DNA-prøver eller netthinneskanning.

Systemer som behandler bilder av ansikter har fem karakteristiske trekk som gir all grunn til å forby dem. For det første er ansiktet vanskelig å skjule eller endre. Personer kan ikke krypteres som data på digitale medier, i elektroniske eller tekstmeldinger. De kan filmes ved hjelp av eksterne kameraer, og kostnadene for selve teknologien og lagring av bilder i skyen synker stadig, noe som fører til en økende bruk av slike overvåkingssystemer.

For det andre er det databaser med navn og ansikter, for eksempel for førerkort, eller sosiale medier-kontoer som er svært lett tilgjengelige.

For det tredje, i motsetning til typiske overvåkingssystemer, som ofte krever dyrt utstyr eller nye datakilder, er inndata for ansiktsgjenkjenning overalt og kommer direkte fra det øyeblikket kameraene fanges.

For det fjerde, et vendepunkt. Enhver database med personer for identifikasjon av personer som er arrestert eller fanget i synsfeltet til kameraer ved hjelp av noen få linjer med kode kan "sammenlignes" med enhver annen database i sanntid, koblet til bærbare politikameraer eller videoovervåkingssystemer. New Yorks statsguvernør Andrew Cuomo pekte på årsakene til spredningen av teknologi for ansiktsgjenkjenning, og hevdet at en enkel skanning av bilskilt vil virke som en bagatell sammenlignet med mulighetene for å bruke kameraer med innebygd teknologi: den største fordelen med dette instrumentet . Vi går over til ansiktsgjenkjenningsteknologi, og nå vil systemet kunne skanne sjåførens ansikt og sjekke det mot databaser, noe som åpner for helt nye perspektiver.»

For det femte er ansiktet, i motsetning til fingeravtrykk, gange eller netthinnebilder, sentralt for en persons identitet. Ansiktet er et mellomledd mellom det virtuelle og det virkelige livet til en person, en kobling mellom handlingene som en person utfører anonymt, under eget eller andres navn. Det kan lett virke som om det er unødvendig å holde enkeltpersoner konfidensielt som all annen privat informasjon, fordi folk i livet vanligvis ikke skjuler ansiktene sine. Med unntak av land hvor kvinner er pålagt å bære burka, er personer med skjult ansikt mistenksomme.


Å sikre konfidensialiteten til en persons ansikt er virkelig nødvendig fordi folk tidligere har utviklet institusjoner og verdier knyttet til beskyttelse av privat informasjon i en tid da det generelt var vanskelig å identifisere fremmede. På grunn av biologiske egenskaper er menneskelig hukommelse begrenset, og uten en teknologisk overbygning kan han huske bare et lite antall ansikter. Og med tanke på størrelsen og fordelingen av befolkningen, vil en person ikke møte så mange nye mennesker i livet sitt. Disse restriksjonene skaper en slags «blank space», som ga folk en god sjanse til å gå seg vill i mengden.

Nylige avgjørelser fra USAs høyesterett om den fjerde endringen (som forbyr uberettiget ransaking og beslag, og krever at en domstol utsteder ransakingsordrer når det er god grunn) indikerer at kampen for å beskytte personvernet på offentlige steder fortsetter. I sommer bestemte retten i en av rettssakene at geolokaliseringsdata fra mobiltelefoner faller inn under Grunnloven, og informasjon som en person ønsker å holde hemmelig, selv om den er offentlig tilgjengelig, kan beskyttes av Grunnloven.

Hvorfor ansiktsgjenkjenningsteknologi trosser juridisk regulering

På grunn av det faktum at ansiktsgjenkjenningsteknologi utgjør en enorm trussel, kan ikke samfunnet la reguleringen gå av seg selv. Potensiell lønnsomhet vil stimulere ideer om hvordan man kan maksimere teknologiens potensial, og enkeltselskaper vil presse sine interesser i denne retningen.

Samfunnet kan heller ikke vente på fremveksten av populister. Ansiktsgjenkjenningsteknologi vil fortsette å "markedsføres" som en del av de nyeste og mest avanserte applikasjonene og enhetene. Apple kaller allerede Face ID den beste funksjonen på den nyeste iPhone. Det samme gjelder ideologisk drevne nyhetsreportasjer som hevder ansiktsgjenkjenningsteknologi er løsningen på alle problemer.

Til slutt bør samfunnet ikke stole for mye på tradisjonelle reguleringsmetoder. Funksjonene til ansiktsgjenkjenningsteknologi tillater ikke at den holdes innenfor rammen av tiltak som definerer lovlig og ulovlig bruk og prøver å tilpasse den potensielle nytten for samfunnet og den avskrekkende faktoren for angripere. Dette er et av få eksempler hvor det er nødvendig å innføre et fullstendig forbud.

For øyeblikket er det svært få prosjekter for å kontrollere teknologi for ansiktsgjenkjenning og enda færre for å begrense den. Det er anstendige lover om biometriske data i delstatene Illinois og Texas, men de følger en generelt akseptert reguleringsstrategi om at personer som samler inn og bruker disse dataene må overholde et sett med grunnleggende informasjonspraksis og personvernprotokoller. Dette inkluderer kravet om å innhente informert samtykke for innsamling av biometriske data, deres obligatoriske beskyttelse og begrensning av lagringsperioden, forbudet mot bruk for profitt, begrensning av rettighetene til overføring til tredjeparter og private grunner for å fremme krav i tilfelle av brudd på disse reglene.

De foreslåtte lovene innen ansiktsgjenkjenning er like. US Federal Trade Commission anbefaler å innføre samme mekanisme med hensyn til teknologi: advare en person om bruken, gi ham et valg og ærlig begrense bruken av dataene hans. Electronic Frontier Foundations rapport, som fokuserer på å håndheve disse lovene, inneholder lignende, om enn dypere, forslag. Lag for eksempel klare regler for bruk, distribusjon og sikkerhet av data; pålegge restriksjoner på innsamling og lagring av data; et forbud mot å inkludere flere typer biometriske data i én database; obligatorisk varsling, revisjoner og uavhengig tilsyn. I sitt utkast til lov om ansiktsgjenkjenning, Senter for personvern og teknologi, foreslår Georgetown University å i betydelig grad begrense myndighetenes tilgang til ansiktsdatabaser, samt bruken av sanntidsteknologi for ansiktsgjenkjenning.


Dessverre er de fleste av de gjeldende og foreslåtte kravene prosedyremessige. Og til syvende og sist vil ikke spredningen av selve teknologien og utviklingen av den tilsvarende infrastrukturen stoppe. Først og fremst bør det bemerkes at noen av de underliggende forutsetningene om samtykke, varsel og valg som finnes i eksisterende lover er falske. Informert samtykke som en reguleringsmekanisme for overvåking og databehandling er fullstendig ubrukelig. Selv om folk hadde full kontroll over dataene sine, ville de fortsatt ikke kunne dra full nytte av dem.

Likevel prøver lovgivere og industrien selv å komme i gang. Men disse forskriftene, som de fleste personvernforskriftene i den digitale tidsalderen, har mange hull. Noen lover omhandler kun innsamling eller lagring av data og påvirker ikke hvordan de brukes. Andre gjelder kun for selskaper eller myndigheter og er så tvetydige at de unngår konsekvenser for ulike urettmessige handlinger. Og for å oppleve fordelene med den mye omtalte ansiktsgjenkjenningsteknologien vil det kreve flere kameraer, bedre infrastruktur og enorme databaser.

Fremtiden for ansiktsgjenkjenningsteknologi

Ansiktsgjenkjenningsteknologi åpner for uendelige muligheter til å spore informasjon om en persons personlighet og bevegelser. Og også lagre, distribuere og analysere det nesten umiddelbart. Utviklingen av denne teknologien i fremtiden kan føre til at konfidensialiteten til en persons private informasjon stadig vil bli krenket. Menneskelig velvære er bare mulig hvis ansiktsgjenkjenningsteknologier blir forbudt før disse systemene blir for godt forankret i hverdagen. Ellers vil folk bare bli kjent med verden der de, hver gang de vises på et offentlig sted, automatisk blir identifisert, lagt inn i en profil og eventuelt brukt. I en slik verden vil de som motsetter seg teknologi for ansiktsgjenkjenning bli diskreditert, stilnet eller eliminert.