Semantični predpomnilnik za analizo slik z AI

Azure Friday | Azure Analysis Services Visual Model Editor (Junij 2019).

Anonim

Razpoložljivost visoko ločljivih, poceni senzorjev je eksponentno povečala količino podatkov, ki se proizvajajo, kar bi lahko preplavilo obstoječi internet. To je povzročilo potrebo po računalniški zmogljivosti za obdelavo podatkov, ki so blizu robov omrežja, namesto da jih pošljejo v podatkovne centre v oblaku. Računanje robov, kot je znano, ne zmanjšuje samo napetosti na pasovno širino, ampak tudi zmanjšuje zakasnitev pridobivanja inteligence od neobdelanih podatkov. Vendar pa je razpoložljivost virov na robu omejena zaradi pomanjkanja ekonomij obsega, ki infrastrukturo oblaka stroškovno učinkovito upravljajo in ponujajo.

Potencial robnih računalnikov ni nikjer bolj očiten kot pri video analitiki. Video kamere z visoko ločljivostjo (1080p) postajajo običajne v domenah, kot je nadzor, in lahko glede na hitrost slikanja in stiskanje podatkov proizvedejo 4-12 megabitov podatkov na sekundo. Novejše kamere ločljivosti 4K proizvajajo neobdelane podatke o vrstnem redu gigabitov na sekundo. Zahteva za vpogled v takšne video tokove v realnem času spodbuja uporabo tehnik AI, kot so globoka nevronska omrežja za naloge, vključno z razvrščanjem, odkrivanjem in odvzemanjem predmetov ter odkrivanjem anomalije.

V našem kongresnem dokumentu Hot Edge 2018 "Senčni luknjiči: točni ravni natančnega AI sklepanja na hitrosti in ekonomičnosti Edgeja" je naša ekipa na IBM Research-Ireland eksperimentalno ocenila učinkovitost ene tovrstne AI-ja, klasifikacije objektov, uporabo komercialno dostopnega oblaka gostovanje. Najboljši rezultat, ki smo ga lahko zagotovili, je bil klasifikacijski izhod 2 frejma na sekundo, kar je daleč pod standardno hitrostjo 24-ih slik na sekundo. Izvedba podobnega preizkusa na reprezentativni robni napravi (NVIDIA Jetson TK1) je dosegla zahteve glede zakasnitve, vendar je v tem procesu porabila večino virov, ki so na voljo v napravi.

Ta dvojnost razbijemo tako, da predlagamo Semantic Cache, pristop, ki združuje nizko zakasnitev robnih namestitev s skoraj neskončnimi viri, ki so na voljo v oblaku. Uporabljamo dobro znano tehniko predpomnjenja za zakasnitev zakrivanja z izvedbo AI sklepanja za določen vhod (npr. Video okvir) v oblaku in shranjevanje rezultatov na rob proti "prstnemu odtisu" ali kodi razpršitve na podlagi pridobljenih funkcij iz vhoda.

Ta shema je zasnovana tako, da so vhodni elementi, ki so semantično podobni (npr. Pripadajo istemu razredu), opremljeni s prstnimi odtisi, ki so med seboj blizu, v skladu z nekaterim ukrepom na daljavo. Slika 1 prikazuje zasnovo predpomnilnika. Enkoder ustvari prstni odtis vhodnega videokamera in poišče iskalnik za prstne odtise znotraj določene razdalje. Če pride do ujemanja, se rezultati iz sklepanja zagotovijo iz predpomnilnika, s čimer se izognemo potrebi po poizvedovanju storitve AI, ki se izvaja v oblaku.

Prstne odtise najdemo analogno senčnim lutkom, dvodimenzionalnim projekcijam številk na zaslonu, ki jih ustvari svetloba v ozadju. Vsakdo, ki je uporabil prste, da bi ustvaril senčne lutke, bo potrdil, da odsotnost podrobnosti v teh številkah ne omejuje njihove sposobnosti, da bi postala temelj dobrega pripovedovanja zgodb. Prstni odtisi so projekcije dejanskega vhoda, ki se lahko uporabljajo za bogate AI aplikacije, tudi če ni izvirnih podrobnosti.

Razvili smo celovit dokaz koncepta implementacije semantičnega predpomnilnika, ki sledi načrtovnemu pristopu »kot storitev« in izpostavlja storitev uporabnikom robov / prehodov prek vmesnika REST. Naše ocene na številnih različnih robnih napravah (Raspberry Pi 3 / NVIDIA Jetson TK1 / TX1 / TX2) so pokazale, da je bila zakasnitev sklepanja zmanjšana za 3-krat, poraba pasovne širine pa za vsaj 50 odstotkov v primerjavi z oblak- samo rešitev.

Zgodnje ovrednotenje prvega prototipa izvajanja našega pristopa kaže na njegov potencial. Zacetni pristop nadaljujemo z zacetnim pristopom, pri cemer damo prednost eksperimentiranju z alternativnimi tehnikami kodiranja za vecjo preciznost, obenem pa razširjamo evidenco na nadaljnje nizove podatkov in naloge AI.

To tehnologijo predvidevamo, da ima med drugim tudi aplikacije v maloprodaji, predvidevalno vzdrževanje industrijskih objektov in video nadzor. Na primer, semantični predpomnilnik je mogoče uporabiti za shranjevanje prstnih odtisov slik izdelka na blagajno. To se lahko uporabi za preprečevanje izgube zaradi kraje ali napačnega skeniranja. Naš pristop služi kot primer nemotenega preklapljanja med oblakom in robnimi storitvami, da bi zagotovili najboljše rešitve AI na robu.

menu
menu