Hur kan differentiell integritet skydda dina data?

Hur kan differentiell integritet skydda dina data? Marco Verch / Flickr, CC BY

Techföretag kan använda differentiell sekretess för att samla in och dela samman data om användarvanor, samtidigt som enskild integritet upprätthålls.

Det är ingen hemlighet att stora företag som Facebook, Google, Apple och Amazon infiltrerar allt mer våra personliga och sociala interaktioner för att samla stora mängder data på oss varje dag. Samtidigt gör personliga brott i cyberspace regelbundet nyhetssidor.

Så hur ska integritet skyddas i en värld där data samlas och delas med ökande fart och uppfinningsrikedom?

Differentiell integritet är en ny modell av cybersäkerhet som förespråkare hävdar kan skydda personuppgifter långt bättre än traditionella metoder.

Matematiken den bygger på utvecklades 10 år sedan, och metoden har antagits av Apple och Google på senare år.

Vad är differentiell integritet?

Differentiell integritet gör det möjligt för tekniska företag att samla in och dela samman information om användarvanor, samtidigt som enskilda användares privatliv upprätthålls.

Till exempel, säg att du ville visa de mest populära vägarna som människor går och går genom en park. Du följer spåren hos 100-personer som regelbundet går genom parken, och huruvida de går på vägen eller genom gräset.

Men i stället för att dela specifika personer som tar varje rutt delar du de sammanlagda data som samlats över tiden. Personer som tittar på dina resultat kanske vet att 60 av 100 föredrar att ta en kort genom gräset, men inte vilka 60-personer.

Varför behöver vi det?

Många av världens regeringar har strikta policyer om hur teknikföretag samlar in och delar användardata. Företag som inte följer reglerna kan möta stora böter. en Belgisk domstol beställde nyligen Facebook för att sluta samla in data om användarnas surfvanor på externa webbplatser eller betala böter på € 250,000 per dag.

För många företag, i synnerhet multinationella företag som är verksamma i olika jurisdiktioner, lämnar det dem i ett känsligt läge när det gäller insamling och användning av kunddata.

Å ena sidan behöver dessa företag användarnas data så att de kan tillhandahålla högkvalitativa tjänster som gynnar användarna, till exempel personliga rekommendationer. Å andra sidan kan de möta avgifter om de samlar för mycket användardata, eller om de försöker flytta data från en jurisdiktion till en annan.

Traditionella integritetsskyddande verktyg, som kryptografi, kan inte lösa detta dilemma eftersom det förhindrar att tekniska företag kan få tillgång till data alls. Och anonymitet minskar värdet av data - en algoritm kan inte erbjuda dig personliga rekommendationer om den inte vet vad dina vanor är.

Hur fungerar det?

Låt oss fortsätta med exempel på vandringsleder genom en park. Om du känner till identiteterna hos dem som ingår i studien, men du vet inte vem som tog vilken väg då kan du anta att privatlivet är skyddat. Men det kanske inte är fallet.

Säg att någon som tittar på dina data vill veta om Bob föredrar att gå igenom gräset eller på vägen. De har fått bakgrundsinformation om de andra 99-personerna i studien, vilket berättar för dem att 40-personer föredrar att gå på vägen och 59 föredrar att gå igenom gräset. Därför kan de härleda att Bob, som är den 100te personen i databasen, är den 60te personen som föredrar att gå igenom gräset.

Denna typ av attack är en kallad differentierad attack, och det är ganska svårt att försvara sig eftersom du inte kan kontrollera hur mycket bakgrundskunskap någon kan få. Differentiell integritet syftar till att försvara sig mot denna typ av attack.

Någon som avlägsnar din vandringsväg kanske inte låter för allvarlig, men om du ersätter vandringsleder med HIV-testresultat kan du se att det finns potential för en allvarlig invasion av privatlivet.

Den olika sekretessmodellen garanterar att även om någon har fullständig information om 99 av 100-personer i en dataset, kan de fortfarande inte avleda informationen om den slutliga personen.

Den primära mekanismen för att uppnå det är att lägga till slumpmässigt buller till aggregatdata. I sökvägsexemplet kan du säga att antalet personer som föredrar att korsa gräset är 59 eller 61, snarare än exakt antal 60. Det felaktiga numret kan bevara Bobs integritet, men det kommer att få mycket liten inverkan på mönstret: runt 60% föredrar folk att ta en kortslutning.

Bullret är noggrant utformat. När Apple anställde differentiell integritet i iOS 10, lade det till ljud för enskilda användarinputs. Det betyder att den kan spåra, till exempel, den mest använda emojisen, men emoji-användningen av en enskild användare maskeras.

Cynthia Dwork, the uppfinnare av differentiell sekretess, har föreslagit underbara matematiska bevis på hur mycket ljud som är tillräckligt för att uppnå kravet på differentiell integritet.

Vilka är dess praktiska tillämpningar?

Differentiell integritet kan tillämpas på allt från rekommendationssystem till platsbaserade tjänster och sociala nätverk. Äpple använder differentiell sekretess att samla anonyma användningsinsikten från enheter som iPhones, iPads och Macs. Metoden är användarvänlig och lagligt i klart.

Differentiell integritet skulle också göra det möjligt för ett företag som Amazon att få tillgång till dina personliga shoppinginställningar medan du gömmer känslig information om din historiska inköpslista. Facebook skulle kunna använda det för att samla beteendetalj för målinriktad annonsering, utan att bryta mot ett lands sekretesspolicy.

Hur kan det användas i framtiden?

Olika länder har olika sekretesspolicyer, och känsliga dokument måste för närvarande kontrolleras manuellt innan de flyttar från ett land till ett annat. Detta är tidskrävande och dyrt.

Nyligen ett lag från Deakin University utvecklad differentierad sekretess teknik för att automatisera sekretessprocesser inom moln dela samhällen över länder.

AvlyssningenDe föreslår att man använder matematiska formler för att modellera varje lands privatlivslagar som kan översättas till "middleware" (programvara) för att säkerställa att data överensstämmer. Att använda differentierad sekretess på detta sätt kan skydda användarnas integritet och lösa en delning av datadelning för tekniska företag.

Om författaren

Tianqing Zhu, docent i Cyber ​​Security, fakulteten för naturvetenskap, teknik och byggnad, Deakin University

Den här artikeln publicerades ursprungligen den Avlyssningen. Läs ursprungliga artikeln.

relaterade böcker

{amazonWS: searchindex = Böcker; nyckelord = personlig integritet; maxresults = 3}

enafarzh-CNzh-TWnltlfifrdehiiditjakomsnofaptruessvtrvi

följ InnerSelf på

facebook-icontwitter-iconrss-icon

Få det senaste via e-post

{Emailcloak = off}