E-post/MSN/Jabber: stefan@gorling.se
Mobil: 070-815 38 26
On the faulty assumption of e-mail as a stable identity identifier
Blogg | Uppdaterad: 2010-08-22
När jag satt och skrev på en helt annan sak kom jag att tänka på en studie som jag gjorde för 2-3 år sedan. Datainsamlingen blev färdig, och jag började skriva på en rapport, som hamnade i en byrålåda.
Eftersom jag nog aldrig kommer att få den färdig, men informationen som sådan är intressant har jag nu publicerat den text jag hade som ett working paper på SSRN. Det är rått, oredigerat och rätt taffligt skrivet. Men låt mig få upprepa argumentet här kort.
Många av de IT-system som konstrueras bygger på antagandet att e-postadresser är stabila, eller åtminstone inte återanvänds. Om jag tappar bort mitt inloggningsnamn till Bokus skickar de mig ett nytt lösenord till min e-postadress. På så sätt kommer jag in i mitt konto med historik och ev. lagrade kreditkortsuppgifter etc.
Samtidigt använder många e-postadresser som är långt ifrån stabila. Arbetsgivarens e-post, din nuvarande internetleverantör eller universitetets. E-postkonton som du inte kommer att ha kontroll över om några år. Vi kan tala om att olika typer av adresser har olika förväntad stabilitet:
Level of portability | Type | Expected lifespan
(approximative) |
Potential problems |
Good | Own domain
(myself@mydomain.com) |
As long as you wish | Some extra complexity and cost managing it. |
Medium | Third-party mail provider
(myself@hotmail.com) |
Medium, 3-6+ years | Third-party company changes service agreement, closes service. |
Poor | ISP / Corporate / University
(myself@comcast.net) |
Short, 2-4 years | You switch ISP, job or graduate from university. |
Jag ville titta närmare på detta och fick tillgång till en adressdatabas (med domändelen av e-postadresserna) från en stor svensk webbsite med 97,000 registrerade adresser för nyhetsbrev, inloggning etc.
Dessa grupperades per domän och jag klassificerade domänerna (med tanke på mängden manuellt arbete jag faktiskt lade ner på detta är det ju på så sätt tragiskt att det aldrig publicerades.). Och så här såg det ut:
Classification
|
Original Dataset
(all rows)
|
Original Dataset
(rows with demographics) |
Weighted for Sweden
|
Unsure, deprecated | 2,16% | 1,81% | 2,48% |
Webmail, non-isp | 46,21% | 48,05% | 59,99% |
ISP mail-service | 34,04% | 34,03% | 24,46% |
Corporate | 13,68% | 12,65% | 9,97% |
School/University | 2,25% | 1,75% | 1,78% |
Private domain | 1,66% | 1,71% | 1,32% |
“The study shows that the use of private domain-names in Sweden today is very limited. Nearly one out of four persons use an address tied to their current ISP, which is likely to increase the hassle of switching ISP, and therefore create lock-in effects on the ISP market. In total one out of three persons use addresses which are not portable and therefore unlikely to survive as identifiers over time. Most people use webmail services, which might be considered better than ISP, corporate or school addresses but remains limited in their uses and ties you to a certain e-mail provider.”
Pappret diskuterar några problem med detta och ett antal möjliga motmedel. Men det viktigaste att ha i åtanke när vi utformar IT-system är ju statt e-postadresser inte är samma sak som personnummer (som i sig inte heller är stabila, men det är en annan historia), och att vi måste ta höjd för att de ändras och diskutera hur vi hanterar det på bästa sätt.
(Vissa länder har börjat föreskriva regler om e-postadressportabilitet på samma sätt som vi har nummerportabilitet. Jag är lite splittrad i den frågan men kan se att det i vissa avgränsade fall kan vara vettigt. Ser med spänning fram emot hur det implementeras i verkligheten dock.)