Hur Internet vet om du är lycklig eller sorglig

glad eller ledsen 5 28

Tänk på vad du delade med dina vänner på Facebook idag. Var det känslor av "stress" eller "misslyckande", eller kanske "glädje", "kärlek" eller "spänning"? Varje gång vi publicerar på sociala medier lämnar vi spår av vårt humör. Avlyssningen

Våra känslor är värdefulla varor, och många företag utvecklar automatiserade verktyg för att känna igen dem i en process som kallas sentimentanalys.

Nyligen en läckt rapport avslöjade att Facebook kan identifiera när ungdomar känner sig utsatta, även om företaget har insisterade på att det inte använde analysen Att rikta in användare med annonsering. Facebook ursäktade också i 2014 för en experimentera på "emotionell smitta" där inlägg med antingen "positivt" eller "negativt" sentiment filtrerades från användarens flöden.

Det är klart att förmågan att upptäcka känslor från text är av stort intresse för sociala medier, såväl som annonsörer. Men hur fungerar sentimentsanalys, varför är det användbart och vad är riskerna?

Hur fungerar sentimentsanalys?

Medan detaljerna i Facebook: s egen algoritm inte är offentligt kända faller de flesta sentimentanalysstekniker i två kategorier: övervakad eller obesvarad.

Övervakade metoder bygger på märkta data. Med andra ord, det här är inlägg som har klassificerats manuellt som innehåller positiva eller negativa känslor.

Statistiska metoder används sedan för att träna modeller för att klassificera nya inlägg automatiskt baserat på förekomsten av fördefinierade ord eller fraser, till exempel "stressad" eller "avslappnad".

Unsupervised metoder, å andra sidan, lita ofta på att bygga en ordbok av poäng för olika ord. En sådan ordbok som utvecklats av mina samarbetspartners, bad människor att ge 1 till 9 lyckans poäng till olika ord, och sedan genomsnittet resultaten: "regnbågar", till exempel, gjorde 8.06, medan "värdelös" blir 2.52.

Den övergripande känslan av en fras kan sedan fås genom att titta på alla orden i posten. Till exempel, den genomsnittliga poängen för posten "Min mamma sa alltid" livet är som en låda med choklad "" är en över genomsnittet 6.02 enligt denna ordbok, vilket tyder på att den uttrycker en positiv känsla.

Vad används känslighetsanalys för?

Sentimentanalys används alltmer av marknadsförare till studera trender och gör produktrekommendationer.

Tänk dig att en ny mobiltelefon släpps. en känslighetsanalys av sociala medier inlägg om telefonen kan ge ett företag värdefull, realtidsinsikt om hur det fungerar.

Det finns bredare tillämpningar av sentimentanalys. Forskare har nyligen spårade Donald Trumps Twitter-känsla under de första 100-dagarna i sitt presidentskap och byggt bots för att placera marknaden när han tweets positivt eller negativt om specifika företag.

Forskare kan också följa emotionella trender i andra texter. Till exempel använde vi sentimentanalys för att studera de emotionella bågarna i mer än 1,000-filmer genom sina skärmbilder. Bågen på 2013 Disney film Frozen visas nedan.

Privatliv Emotionsbåg för filmen Frozen.

Många filmer visar liknande mönster: Vanliga toppar och tråg av spänning och släpp, följt av en särskilt stor genomgång av 80% av vägen genom filmen (allt hopp är förlorat!), Innan den slutliga upplösningen och lycklig avslutning. Genom att tillämpa en liknande analys på romaner visade vi det De flesta berättelser följer en av sex grundbågar.

Vi är fortfarande inte så bra på sentimentanalys

Med tanke på att känslighetsanalysen ofta bygger på gruvdrift av sociala medier, väcker det stora etiska problem, och denna debatt är bara nybörjande. Ändå gör den komplexa karaktären av språk och mening att det är benäget för fel.

Ta frasen "Kan kraften vara med dig", som visar 5.35 med hjälp av vår ordboks analys. För alla Star Wars-fanar är det givetvis en enorm positiv fras, men det gjorde måttligt i vårt test, eftersom ordet "force" är rankad under genomsnittet 4.0.

Detta är förståeligt när man värderar ordet isolerat, men i sammanhang är det mindre meningslöst.

Något skepticism om validiteten av Facebooks känslighetsanalys är därför berättigad. Det är helt tänkbart att beskriva någonting som "helt sjukt" på Facebook, en fras av medborgarbeteende, kan leda till att en persons emotionella tillstånd är oklassificerat.

För att förstå när sentimentanalys gör och inte fungerar är det viktigt att undersöka de ord som ger specifika resultat.

För att göra detta använder vi "ordförskjutning"Diagram, som den nedan för Frozen. Detta visar vilka ord som gjorde skärmens klimax sorgligare än dess lyckliga avslutning: mer referenser till "sorg" och "rädsla", men konstigt, mer "vacker".

Privatliv Plot jämföra klimaxen av Frozen till dess lyckliga slut. De blå staplarna mot toppen av diagrammet visar de främsta bidragande orden till skillnaden i poäng.

Löfte och en varning

Sentimentanalys är ett kraftfullt verktyg, men det är bara en ung vetenskap och måste användas med försiktighet.

Forskare måste utveckla verktyg som gör att vi kan jämföra "under huven" och förstå varför vissa algoritmer producerar de resultat de gör. Detta är det enda sättet att diagnostisera problem med olika metoder, och ännu viktigare, att utbilda allmänheten om fältets möjligheter och begränsningar.

Sentimentanalysforskningen har till stor del byggts på stora, offentliga dataset, särskilt från sociala medier. Det är viktigt att vi oavsiktligt ger uppgifterna förstå vad det kan och inte kan användas till, och hur.

Om författaren

Lewis Mitchell, docent in Applied Mathematics, University of Adelaide. Michelle Edwards bidrog till denna artikel.

Den här artikeln publicerades ursprungligen den Avlyssningen. Läs ursprungliga artikeln.

Relaterade böcker:

{amazonWS: searchindex = Böcker; nyckelord = internetsäkerhet; maxresults = 3}

enafarzh-CNzh-TWnltlfifrdehiiditjakomsnofaptruessvtrvi

följ InnerSelf på

facebook-icontwitter-iconrss-icon

Få det senaste via e-post

{Emailcloak = off}