Auf netzpolitik.org gibt es jetzt eine interaktive Karte der Besucherbewegungen auf der re:publica 2013, visualisiert anhand von Verbindungsdaten der WLAN-APs. Ich finde es bereits kritisch, dass diese Daten überhaupt gespeichert wurden, ohne dass die Besucher vorher darauf hingewiesen wurden. Durch die MAC-Adresse können die Bewegungsprofile an Geräte und somit an Personen geknüpft werden, sie darf daher m.W. nicht im Klartext gespeichert werden. Veröffentlicht wurden die Bewegungsdaten jedenfalls pseudonymisiert; die MAC-Adresse wurde durch eine fortlaufende Gerätenummer ersetzt.
Auch ohne MAC-Adressen kann man allein durch die Abfolge von Zeit und Ort durch z.B. Korrelation mit Tweets, Checkins oder Bildern jede ID einer Person zuordnen. Ähnliches geht auch mit Bewegungsdaten z.B. durch Funkzellen; schon vor Jahren habe ich das mal mit Testdaten eines Location Based Service ausprobiert, wo ich auch ganz ohne irgendeine Personen-Referenz klare Benutzerprofile erstellen konnte, teilweise sogar bis zur Heimatadresse.
Ich halte das für datenschutzrechtlich höchst bedenklich, was hier ohne Ankündigung und Einwilligung geschehen ist.
- Es reichen im Schnitt 7 Datenpunkte zur Personenzuordnung.
- Es geht nicht um Tweets mit GPS-Koordinaten; auch Inhalte, Referenzen auf Vorträge, #stageX hashtags und Fotos von Slides können ausreichen.
- Tweets sind aktiv, ich entscheide, meine Position zu sharen. Hiermit kann ich nachsehen, wo jemand war, als sie nicht getweetet hat. Um wie viel Uhr kam jemand zur rp13, nach Tag geordnet? Wie viel Zeit hat sie in Raucherpausen verbracht? Wie lang war sie auf der Party? Wann auf dem Klo? Aus welchen Sessions ging er verfrüht raus? Etc.pp.
Ich habe persönlich kein Problem damit, meine Daten so auszuwerten oder auswerten zu lassen, so viel Spackeria bin ich dann doch. Aber ich halte es für fahrlässig, anderer Leute Daten so zu veröffentlichen. Für ein Beispiel der Deanonymisierung sei nur an die AOL-Suchanfragen-Sache und so weiter erinnert.
Diverse Stellungnahmen findet ihr in den Kommentaren bei den verlinkten Artikeln.
Update: Weil es relevant ist, ein Guardian-Artikel zum Thema Deanonymisierung und Datenschutz.