online ligger 6 29

Det finns tre saker du kan vara säker på i livet: döden, skatter – och lögn. Det senare verkar verkligen ha bekräftats av Storbritanniens senaste Brexit-folkomröstning, med en antal av Lämna kampanjens löften letar mer tycka om porkie pajer än fasta sanningar.

Men från internetannonsering, visumansökningar och akademiska artiklar till politiska bloggar, försäkringsanspråk och dejtingprofiler finns det otaliga ställen vi kan berätta digitala lögner. Så hur kan man gå tillväga för att upptäcka dessa onlinefiber? Tja, Stephan Ludwig från University of Westminster, Ko de Ruyter från City University Londons Cass Business School, Mike Friedman från katolska universitetet i Louvain och dina har utvecklat en digital lögndetektor – och den kan avslöja en hel mängd internet-osanningar .

I vår nya forskning, använde vi språkliga ledtrådar för att jämföra tiotusentals e-postmeddelanden som i förväg identifierats som lögner med de som är kända för att vara sanna. Och från denna jämförelse utvecklade vi en textanalytisk algoritm som kan upptäcka bedrägeri. Det fungerar på tre nivåer.

1. Ordanvändning

Sökordssökningar kan vara ett rimligt tillvägagångssätt när man hanterar stora mängder digital data. Så vi upptäckte först skillnader i ordanvändning mellan de två dokumentuppsättningarna. Dessa skillnader identifierar text som sannolikt innehåller en lögn. Vi fann att individer som ljuger i allmänhet använder färre personliga pronomen, som jag, du och han/hon, och fler adjektiv, som briljant, orädd och sublim. De använder också färre förstapersonssingularpronomen, som jag, jag, min, med diskrepansord, som kunde, borde, skulle, samt fler andrapersonspronomen (du, din) med prestationsord (tjäna, hjälte , vinna).

Färre personliga pronomen indikerar en författares försök att ta avstånd från sina ord, medan att använda fler adjektiv är ett försök att distrahera från lögnen genom en uppsjö av överflödiga beskrivningar. Färre förstapersonssingularpronomen i kombination med diskrepansord tyder på bristande subtilitet och en positiv självbild, medan fler andrapersonspronomen i kombination med prestationsord indikerar ett försök att smickra mottagarna. Vi inkluderade därför dessa kombinationer av söktermer i vår algoritm.


innerself prenumerera grafik


2. Strukturgranskning

En annan del av lösningen låg i att analysera variansen av kognitiva processord, som orsak, därför, vet och borde – och vi identifierade ett samband mellan strukturord och lögner.

Lögnare kan inte generera vilseledande e-postmeddelanden från det faktiska minnet så de undviker spontanitet för att undvika upptäckt. Det betyder inte att lögnare använder fler kognitiva processord överlag än människor som talar sanning, men de inkluderar dessa ord mer konsekvent. Till exempel tenderar de att koppla varje mening till nästa - "vi vet att det här hände på grund av detta, för det borde vara fallet". Vår algoritm upptäcker sådan användning av processord i kommunikation.

3. Cross-e-post tillvägagångssätt

Vi studerade också hur en avsändare av ett e-postmeddelande ändrar sin språkliga stil samtidigt som de utbyter ett antal e-postmeddelanden med någon annan. Denna del av studien avslöjade att allt eftersom utbytet fortsatte, desto mer tenderade avsändaren att använda funktionsorden som mottagaren använde.

Funktionsord är ord som bidrar till syntaxen, eller strukturen, snarare betydelsen av en mening – till exempel an, am, till. Och avsändare reviderade den språkliga stilen på sina meddelanden för att matcha mottagarens. Som en konsekvens identifierar och samlar vår algoritm in sådan matchning.

Spännande applikationer

Konsumentvakthundar kan använda denna teknik för att tilldela reklam av tvivelaktig karaktär en "möjligen ljugande" poäng. Säkerhetsföretag och nationella gränsstyrkor kan använda algoritmen för att bedöma dokument, såsom visumansökningar och landningskort, för att bättre övervaka efterlevnaden av regler och bestämmelser för tillträde och inresa. Sekreterare för examenskommittéer för högre utbildning och redaktörer för akademiska tidskrifter kan förbättra sina korrekturverktyg för att automatiskt kontrollera studentuppsatser och akademiska artiklar för plagiat.

Faktum är att de potentiella applikationerna fortsätter och fortsätter. Politiska bloggar kan framgångsrikt övervaka deras interaktioner på sociala medier för textavvikelser, medan dejting- och recensionssajter kan klassificera meddelanden som skickats av användare på basis av deras "möjligen ljuga" poäng. Försäkringsbolagen kan bättre utnyttja sin tid och sina resurser för skaderevision. Revisorer, skatterådgivare och rättsmedicinska specialister kan undersöka bokslut och skatteanspråk och hitta vilseledande rökande vapen genom vår algoritm.

Människor är häpnadsväckande dåliga på att medvetet upptäcka bedrägeri. Verkligen, mänsklig noggrannhet när det gäller att upptäcka en lögn är bara 54 %, knappast bättre än slumpen. Vår digitala lögndetektor är samtidigt 70 % exakt. Det kan sättas i arbete för att bekämpa bedrägeri varhelst det förekommer i datoriserat innehåll och i takt med att tekniken utvecklas kan dess Pinocchio-varningar vara helt automatiserade och dess noggrannhet kommer att öka ytterligare. Precis som Pinocchios näsa reflexmässigt signalerade falskhet, så gör vår digitala lögndetektor det. Fibrer akta dig.

Om författaren

AvlyssningenTom van Laer, universitetslektor i marknadsföring, City University London

Den här artikeln publicerades ursprungligen den Avlyssningen. Läs ursprungliga artikeln.

relaterade böcker

at InnerSelf Market och Amazon