Ali lahko računalniki pomagajo zaprtim partizanskim delitvam?

Delavnica za upokojence Movie Maker (Julij 2019).

Anonim

Raziskovalci na Univerzi v Wisconsinu-Madisonu uporabljajo računalnike na nove načine, da razvijejo celovito sliko o tem, kako ljudje komunicirajo o politiki in kako lahko te pogovore oblikujejo mediji, socialna omrežja in osebne interakcije.

Kakšna je njihova računalniška analiza, raziskovalci upajo, bi lahko pomagali premostiti razkorak med ljudmi na obeh straneh političnega prehoda, ki se ne morejo združiti za reševanje družbenih težav, ker se ne morejo niti pogovarjati drug z drugim - toliko, da bi bi lahko govorili tudi drugače.

"Za nas je najpomembnejše vprašanje: ali komunikacijski sistem pomaga ljudem razumeti probleme, ki jih opredeljujejo v njihovem družbenem in političnem življenju?" pravi Lewis Friedland, profesor na UW-Madisonovi šoli za novinarstvo in množično komuniciranje. "Ali pa imamo sistem, ki dejansko še povečuje razlike med ljudmi, ki olajša delitev na" skupine "in" izskrbne skupine ", da bi videli druge kot drugačne od nas ali brez vrednosti?"

Na podlagi objav socialnih medijev, anketiranja javnega mnenja, poročanja o novicah in osebnih intervjujev iz vsega Wisconsina, ki se raztezajo do leta 2010, bodo Friedland in sodelavci nazorno prikazali politične interakcije kot življenje, spreminjajoče se okolje - "komunikacijsko ekologijo" - s spletnimi interakcije med ljudmi in institucijami v državi. Podprto s financiranjem pobude UW2020, je eno izmed najbolj ambicioznih prizadevanj, ki jih je kdaj razumelo, kako ljudje v celotni državi govorijo o politiki in kako so se ti pogovori s časom spremenili.

"Nihče ni poskušal modelirati komunikacijskih ekologij na državni ravni, še posebej v osmih letih, " pravi Friedland. "Potrebna je ogromna ustvarjalnost pri zbiranju podatkov, modeliranju odnosov in razvoju metod analize."

Raziskovalci izkoriščajo moč strojnega učenja, v katerem je UW-Madison vodilni inovator, da odkrije, kako ljudje nasprotnih političnih prepričanj dodeljujejo drugačne pomene istim besedam.

Na primer, beseda "uredba" lahko vsebuje znatno različne konotacije - "koristna in potrebna" ali "obremenjena in invazivna" - za liberale in konservativce. Čeprav se ti občutki lahko zdijo intuitivni, je težko natančno opredeliti in kvantificirati, kako ljudje dodeljujejo pomene besedam.

Strojno učenje ponuja rešitev za to težavo s preoblikovanjem besed v geometrijske koncepte, imenovane vektorje, in z uporabo matematičnih operacij za primerjavo.

"Vektorji vam pokažejo nekaj o teh besedah", pravi William Sethares, profesor elektrotehnike in računalništva in sodelavec UW-Madison na projektu. "Enostavne stvari, kot so sopomenke, bodo imele podobne vektorje, vektorji za analogne besede pa bodo imeli enake odnose drug drugemu."

Vektorji so abstraktni predmeti, ki imajo dolžino in smer; v dveh dimenzijah, vektor izgleda kot simbol puščice. Besedilni vektorji so podobni preprostim puščicam, razen če obstajajo v mnogih drugih dimenzijah. Čeprav bi bilo nemogoče izpisati besedne vektorje na ravnem listu papirja, bi predstavitve za "kralja" in "kraljico" v določenem smislu označevale enake smeri glede na druge, kot tiste za "fanta" in "punca".

Po primerjavi vektorjev iz približno 2.000 tweetov, ki so jih objavili liberalci, konzervativci in nepartizani, so raziskovalci identificirali top 10 besed z različnimi uporabami med političnimi ideologijami, vključno z "politikom", "vlado" in "okoljem".

Razkritje teh razlik je zahtevalo nov računski pristop, ki sta ga razvila Sethares in študentka Prathusha Sarma.

Postopek preoblikovanja besed v vektorje se imenuje vdelava in običajno vključuje programiranje algoritmov za vlečenje skozi množično količino besedila, kot je celotna Wikipedija ali vsaka zgodba Google novice kdaj objavljena.

Težava je v tem, da močna splošna vdelana beseda iz ogromnih podatkovnih baz, kot je Wikipedia, pogosto zamegljuje nianse v jeziku, navsezadnje vsaka beseda postane en sam vektor, zato izrazi z več pomeni lahko zmedejo tudi najbolj pametne algoritme (mislite na "kramp", ki lahko opišite bodisi kaj sekira, računalniška invazija ali neltaliran pisec).

Čeprav se lahko v določenih zbirkah podatkov pojavijo te subtilne razlike, kot je besedilo 2.000 političnih tweetov, preprosto ne bi bilo dovolj besed za izdelavo natančnih vektorjev.

"Vsaka majhna niša uporablja svoje besede na svoj način, " pravi Sethares. "Za stvari, ki zelo dobro delujejo, potrebujemo milijarde besed, zato nas ujamejo v past, ker ne moremo vaditi algoritmov na majhen nabor podatkov."

Namesto tega sta Sethares in Sarma našla učinkovito metodo za združevanje moči vdelanih besed iz Wikipedije s specifičnostjo političnih tweetov. Njihov algoritem ni samo določil besede, ki jih konzervativci in liberalci uporabljajo drugače, ampak tudi napovedujejo politično ideologijo avtorja tweet s približno 90-odstotno natančnostjo, ki temelji le na jeziku.

Sethares in sodelavci nameravajo uporabiti enake pristope v zvezi s strojnim učenjem v političnih novicah v Wisconsinu in v kampanjah. Pristop bi jim omogočil, da bi primerjali politični dialog v mestnih in podeželskih skupnostih ter preučevali, kako se je mogoče sčasoma spremeniti pomen partijskih besed.

Nato bodo združili informacije o pomenu besede z dodatnimi sloji podatkov, vključno z vpogledi iz osebnih razgovorov, rezultati volitev in zgodovinske statistike iz javnega mnenja. Izhajajoča komunikacijska ekologija bo ponudila izjemne vpoglede na to, kako se razvija politično okolje v Wisconsinu.

"Okolje postaja hrupnejše in hrupnejše, " pravi Friedland. "Ljudje, ki imajo omejen čas in pozornost, se lahko v danem dnevu osredotočijo le toliko."

In čeprav je zapleten partizanski grid potreben znaten empatij in napor ljudi, ki so v političnem spektru, je razumevanje komunikacijskega okolja pomemben prvi korak k premostitvi razkoraka, dodaja Friedland.

menu
menu