nebst dem thema um soziale netzwerke und der möglichen dezentralisierung befasse ich mich mal hier auch mit dem aspekt des datenschutzes und der anonymität.

dieser ist ja in unserer von menschen gestalten internetwelt nicht ganz unerheblich. will man doch einen ungezwungenen und freien umgang miteinander ermöglichen. und nutzer sind auch nicht mehr so sehr bereit, zB gleich überall ihren klarnamen anzugeben, wie es don schön nachgewiesen hat.

über heise bin ich ja zB über die aktion “We Respect Your Privacy” der ak vorrat gestolpert (zu deutsch auch “wir speichern nicht“).

wir speichern nicht

nun finde ich diese kampagne ja gar nicht mal so schlecht.

aber es gibt ein paar kleinigkeiten, die problematisch hinsichtlich der umsetzung sind.

1) die protokollierung des webservers deaktivieren.

würde ich ja gerne, aber das modul ist nicht installiert. ich kann ja mal bei meinem provider anfragen… doch andere betreiber von seiten dürften erhebliche probleme haben, wenn sie wie ich zB nur ein webspacepaket mit domain haben und beschränkt bis gar keinen zugriff auf den webserver haben. große anbieter wie 1und1 oder strato werden sicher auch nicht für eine handvoll leute ausnahmekonfigurationen einrichten. geschweige denn das entsprechende modul in den apache-webserver zu integrieren. und nicht jeder sieht dann eine kostengünstige alternative zum wechseln, um sich dieser kampagne anzuschließen.

2) ich will eine umfangreiche und auswertbare statistik erstellen, die dennoch ohne lesbare IP-adressen auskommt.

mir ist zB die idee gekommen, die IP zusammen mit einem datumsstempel als md5-hash zu speichern. die IP wäre nach heutigem verschlüsselungsstandard recht sicher als einwegschlüssel gespeichert, kann also nicht mal so eben wieder auswertbar herangezogen werden. (die ip allein nicht zu verschlüsseln, sondern auch das tagesaktuelle datum mit heranzuziehen, war eine idee, um auch das mehrfache auftreten der selben IP an verschiedenen tagen nicht sichtbar zu machen, für eine statistik auf tagesbasis auch gut und nutzbar. immerhin ist es mir egal, ob jemand mit einer dauerhaften IP an verschiedenen tagen vorbeischaut.)

aber! die kampagne “untersagt” mir, auch hashwerte von zB der IP zu speichern. (zumindest muss man dafür einen haken setzen – und ich denke, es wird uU ein ausschlusskriterium sein…). warum? ist meine verschlüsselung IP+datum nicht sicher genug? hat jemand md5 schon gehakt? oder soll ich einen anderen algorithmus verwenden, der sicherer ist. darf ich dann mitmachen?

ich bin halt etwas statistikgeil, und um für mich eine aussagekräftige statistik mit für mich vernünftigem nutzerverhalten zu erstellen, wäre es sinnvoll, zumindest die einweg-verschlüsselte IP für EINEN bestimmten tag zu speichern. am nächsten tag kann ich ja gar nicht mehr nachvollziehen, dass zB ein benutzer mit permanenter IP wieder mich besucht, weil der hash einen ganz anderen wert hat.

warum ich den obigen punkt so betone? beispiele aus dem alltag:

ich kaufe milch in einem laden ein. eine halbe stunde später fällt mir ein, dass ich was vergessen habe, das kakaopulver brauche ich auch noch, weil milch allein mir nicht gefällt. je nachdem, was das für ein laden ist und wie gut besucht er ist, kann der/die verkäuferIn/kassiererIn sich an mein gesicht erinnern. vielleicht fällt ihm dann auf, dass zB seine milch und das kakaopulver strategisch ungünstig zueinander im laden positioniert ist und wird es verändern, er will ja seinen absatz/umsatz optimieren. habe ich auch nix dagegen – und der verkäufer konnte dies bewerkstelligen, ohne mich genauer zu kennen.

ähnlich verhält es sich bei der statistik auf einer seite – wenn ich zB etwas optimieren will, wäre es ratsam, für eine gewisse zeit einen benutzer “verfolgen” zu können. ich will aber keine cookies oder gleich gar ein sessionmanagment dazu benutzen. brauch ich ja nicht wirklich, da ich blogs betreibe und besucher, leser und kommentaroren keine festen und fixen aspekte innerhalb meiner maschinerie sind. ich habe keine registrierten leser oder dergleichen.

wie also bewerkstellige ich das erforschen der verhaltensmuster von besuchern, wenn ich ihre IP komplett außen vor lasse, keine cookies oder sessions verwende. wie identifiziere ich also zB innerhalb von 24 stunden jemanden?

über hilfreiche tipps wäre ich dankbar. denn diese kampagne finde ich interessant und unterstützenswert. und diese “bitte auch keine hashwert”-kagge macht mich ein wenig wahnsinnig.

gut, jetzt werde ich erstma meinem hoster schreiben und fragen, ob wir was mit dem apache machen können. bisher habe ich ja gute erfahrungen gemacht, vielleicht auch diesmal.

ich melde mich dann nochmals, wenn ich da positives feedback erhalten habe und euch die möglichkeit, anonym auf der gesamten domain midgardr.net (also einschließlich aller subdomains) surfen könnt.


so ein gang auf klo kann wunder bewirken… mir ist grad eine idee gekommen, über die ich noch n bissle weiter nachdenken werde. ich will ja eigentlich keine cookies verwenden, aber den besucher für eine gewisse dauer beobachten können.

wenn ich also im statistiktool einfach die IP mit einer sessionvariable austausche, müsste es doch eigentlich klappen, oder? also interne sessions arbeiten lassen. um zu verhindern, dass eine IP auch nach mehr als 24 stunden wieder eine session belebt, muss natürlich regelmäßig die sessions vom system geschlossen werden, ist klar.

hat dies chancen auf erfolg? ich denke, möglich wäre es. immerhin ist die sessionvariable ein zufälliger wert, der eben nur für seine gültigkeitsdauer eben immer wieder der IP zugewiesen wird, aber nach einiger zeit verfällt. und damit dürfte ich doch den kriterien der kampagne doch wieder genügen.

Tags: , , ,




blogoscoop