Boj proti žaljivim jezikom na socialnih medijih z nenadzorovanim prenosom sloga besedila

Poslanca ZL Miha Kordiš in Violeta Tomič o migrantski krizi (Junij 2019).

Anonim

Spletni socialni mediji so postali eden najpomembnejših načinov komuniciranja in izmenjave idej. Na žalost diskurz pogosto omalovažuje zloraba jezika, ki lahko škodljivo vpliva na uporabnike socialnih medijev. Na primer, nedavna raziskava YouGov.uk je ugotovila, da je med informacijami, ki jih delodajalci lahko najdejo na spletu o kandidatih za delo, agresivni ali žaljivi jezik je najbolj profesionalno škodljiva dejavnost družbenih medijev. Spletna omrežja socialnih medijev se običajno ukvarjajo z žaljivim jezikovnim problemom, tako da preprosto filtrirate objavo, kadar je označena kot žaljiva.

V prispevku »Boj proti žaljivim jezikom o socialnih medijih z nepredvidenim prenosom besedilnega besedila«, ki je bil predstavljen na 56. letnem srečanju združenja za računalniško jezikoslovje (ACL 2018), uvajamo povsem nov pristop k reševanju tega problema. Naš pristop uporablja nenadzorovan prenos besedila besedila, da prevedemo žaljive stavke v ustrezne ne-žaljive oblike. Kolikor nam je znano, je bilo vse dosedanje delo, ki je obravnavalo problem žaljivega jezika na socialnih medijih, osredotočeno le na klasifikacijo besedil. Te metode se lahko uporabljajo predvsem za zastavljanje in filtriranje ofenzivne vsebine, vendar naš predlagani pristop gre korak naprej in proizvaja alternativno ne-žaljivo različico vsebine. To ima dve možni koristi za uporabnike socialnih medijev. Za tiste uporabnike, ki nameravajo objaviti žaljivo sporočilo, prejmejo opozorilo, da je vsebina žaljiva in bo blokirana, skupaj z bolj prijazno različico sporočila, ki ga je mogoče objaviti, jih lahko spodbudi, da spremenijo svoje misli in se izognejo nejasnosti. Poleg tega je za uporabnike, ki porabijo spletno vsebino, to omogoča, da še vedno vidijo in razumejo sporočilo, vendar v ne-žaljivem in vljudenem tonu.

Arhitektura za zamenjavo žaljivega jezika

Naša metoda temelji na zdaj priljubljeni arhitekturi neuronskih mrež encoder-dekoderja, ki je najsodobnejši pristop za strojno prevajanje. Pri strojnem prevajanju usposabljanje nevronske mreže kodirnika-dekoderja predvideva obstoj "Rosetta Stone", kjer je isto besedilo napisano tako v izvornem kot v ciljnem jeziku. Ti seznanjeni podatki omogočajo razvijalcem, da zlahka ugotovijo, ali sistem pravilno prevaja in zato usposablja sistem za kodiranje in dekodiranje, da se dobro izvaja. Na žalost, v nasprotju s strojnim prevajanjem, kolikor vemo, ni na voljo podatkovnih nizov seznanjenih podatkov za primer žaljivega do ne-žaljivih stavkov. Poleg tega mora v prenesenem besedilu uporabljati besednjak, ki je pogost na določeni domeni aplikacije. Zato za izvajanje te naloge potrebujejo nenadzorovane metode, ki ne uporabljajo uparjenih podatkov.

Predlagali smo nenadzorovani pristop prenosa sloga v besedilu, sestavljen iz treh glavnih komponent, od katerih je vsaka med vadbo imela ločeno nalogo. Ena (kodirnik RNN) analizira žaljivo stavko in stisne najbolj pomembne informacije v pravi vektor. To bere druga komponenta (dekodirnik RNN), ki ustvarja nov stavek, ki je prevedena različica prvotnega. Prevedeno stavko nato oceni tretja komponenta (klasifikator CNN), da se ugotovi, ali je bil rezultat pravilno preveden iz ofenzivnega sloga v ne-žaljivo. Poleg tega je ustvarjena stavka tudi "nazaj prevedena" od ne-žaljive do žaljive in v primerjavi z izvirnim stavkom preveri, ali je bila vsebina ohranjena. Če rezultati katere koli od zgornjih ocen vsebujejo napake, se sistem ustrezno prilagodi. Kodirnik in dekoder se hkrati vzporedno usposabljata z uporabo nastavitve samodejnega kodiranja, kjer je cilj rekonstrukcija vhodnega stavka. Uporabljamo tudi mehanizem pozornosti, ki pomaga zagotoviti ohranjanje vsebine. Naš glavni prispevek v smislu arhitekture je kombinirana uporaba skupnega klasifikatorja, pozornosti in prenosa.

Prevajanje ofenzivnega jezika

Testirali smo našo predlagano metodo z uporabo podatkov iz dveh priljubljenih družbenih medijskih omrežij: Twitter in Reddit. Ustvarili smo zbirke podatkov žaljivih in neučinkovitih besedil, tako da smo klasificirali približno 10 milijonov delovnih mest z uporabo uveljavljenega jezikovnega razvrščevalnika, ki ga je predlagal Davidson et al. (2017). Naslednja tabela prikazuje primere izvirnih žaljivih stavkov in ne-žaljivih prevodov, ki jih ustvarja način prenosa besedila, ki ga predlaga Shen et al. (2017) in z našim pristopom. Naš sistem je pokazal boljše rezultate pri prevajanju ofenzivnih stavkov v ne-žaljive, pri čemer je ohranil celotno vsebino, včasih pa proizvaja nepremišljene stavke.

To delo je prvi korak v smeri novega obetavnega pristopa za boj proti neprijavljenim delovnim mestom na socialnih medijih. Nepriznani prenos besedilnega besedila je raziskovalno področje, ki je pravkar začelo videti nekaj obetavnih rezultatov. Naše delo je dober dokaz koncepta, da se trenutne nenadzorovane metode prenosa besednega besedila lahko uporabijo za uporabne naloge. Vendar je pomembno opozoriti, da lahko sedanji nenadzorovani pristopi za prenos besedilnega besedila dobro obravnavajo le primere, ko je žaljiva jezikovna težava leksična (kot so primeri, prikazani v tabeli) in se lahko reši s spreminjanjem ali odstranitvijo nekaj besed. Uporabljeni modeli ne bodo učinkoviti v primerih implicitne pristranskosti, kjer se običajno neuničljive besede uporabljajo offensively.

Verjamemo, da se bodo izboljšane različice predlagane metode skupaj z uporabo veliko večjih količin podatkov o usposabljanju lahko spopadle z drugimi zlorabnimi delovnimi mesti, kot so objave, ki vsebujejo sovražni govor, rasizem in seksizem. Predstavljamo si, da bi se naša metoda lahko uporabila za izboljšanje pogovora AI, tako da zagotovimo, da se klepetalnice, ki se učijo z interakcijo z uporabniki na spletu, ne bodo kasneje reprodukovale žaljivega jezika in sovražnega govora. Starševski nadzor je še ena možna uporaba predlaganega sistema.

menu
menu