Če želite, da vas televizor bolje razume

Vladimir Pustan | Apocalipsa | 1.Lucrurile care au fost | Ciresarii TV | 17-februarie-2019 (Junij 2019).

Anonim

Nova raziskava iz Univerze v Waterloo je našla način za izboljšanje glasovne poizvedbe za razumevanje zmožnosti domačih zabavnih platform.

Raziskave v sodelovanju z Univerzo v Marylandu in Comcast Applied AI Research Lab uporabljajo tehnologijo umetne inteligence (AI), da dosežejo najbolj naravne govorne interakcije s televizorji do danes.

"Danes smo se navadili, da se pogovarjamo z inteligentnimi agenti, ki opravljajo naše ponudbe - od Sirija na mobilnem telefonu do Alexe doma. Zakaj ne bi mogli storiti enako s televizorji?" vprašal je Jimmy Lin, profesor na Univerzi v Waterloo in predsedujoči David R. Cheriton na šoli za računalništvo David R. Cheriton.

"Comcast's Xfinity X1 si prizadeva narediti ravno to - platforma ima" glasovno oddaljeno ", ki sprejema govorne poizvedbe. Vaša želja je, da s svojim ukazom povejte svojemu televizijskemu kanalu, da spremenite kanale, ga vprašajte o brezplačnih otroških filmih in celo o vremenu napoved. "

Pri reševanju zapletenega problema razumevanja glasovnih poizvedb so raziskovalci imeli idejo, da izkoristijo najnovejšo tehnologijo AI - tehniko, ki se imenuje hierarhična ponavljajoča nevronska omrežja - za boljši model konteksta in izboljšanje natančnosti sistema.

Januarja 2018 se je v proizvodnji razvil nov model nevronske mreže raziskovalcev, ki je odgovoril na vprašanja iz resničnih uporabnikov v živo. Za razliko od prejšnjega sistema, ki ga je zmedlo približno osem odstotkov poizvedb, novi model obravnava večino zelo zapletenih vprašanj, kar močno izboljšuje uporabniško izkušnjo.

"Če gledalec prosi za" Chicago Fire ", ki se nanaša na dramsko serijo in nogometno ekipo, sistem lahko razloži, kaj zares želite, " je dejal Lin. "Poseben pri tem pristopu je, da izkoristimo kontekst - kot so prej gledali predvajalni in priljubljeni kanali - prilagoditi rezultate in s tem povečati natančnost."

Raziskovalci so začeli razvijati še bogatejši model. Intuicija je, da lahko z analizo poizvedb iz več vidikov sistem bolje razume, kaj gledalec pravi.

V članku je bilo na 24. mednarodni konferenci ACM SIGKDD o odkrivanju znanja in podatkovnem rudarjenju, ki je potekalo nedavno v Združenem kraljestvu, predstavljen članek o učenju z večnimi nalogami z nevronskimi omrežji za glasovno poizvedbo o razumevanju platforme za zabavo. Raziskovanje je opravil Jinfeng Rao, doktorat znanosti. diplomant iz Univerze v Marylandu, njegov svetovalec Lin in mentor Ferhan Ture, raziskovalec v Comcast Applied AI Research Lab.

menu
menu