TechNomad.plCyfrowo bez śledzenia. W terenie bez paniki.
TechNomad.plCyfrowo bez śledzenia. W terenie bez paniki.

S01E09 [Prywatność w sieci] — Jak firmy zarabiają na Twoich metadanych

„Z rzeczy istniejących jedne są od nas zależne, inne niezależne.” — Epiktet, Encheiridion

Treść jest głośna.
Metadane są ciche.

Treść trzeba przeczytać, zrozumieć, zinterpretować.
Metadane wystarczy policzyć.

I dlatego to nie treść jest dziś najcenniejsza.
Najcenniejszy jest kontekst, który powstaje mimochodem — nawet wtedy, gdy nie publikujesz, nie piszesz, nie nagrywasz i nie mówisz.

1. Czym naprawdę są metadane — głębiej niż „dane o danych”

W podręcznikach przeczytasz, że metadane to „dane o danych”.
To prawda, ale to definicja tak płytka, że właściwie nic nie mówi.
Może o to chodzi, bo po co drążyć temat?

W praktyce metadane to:

  • czas (kiedy coś robisz),
  • częstotliwość (jak często),
  • intensywność (jak długo),
  • lokalizacja (gdzie),
  • trajektoria (skąd i dokąd),
  • relacje (z kim),
  • urządzenie (na czym),
  • sekwencja (w jakiej kolejności),
  • odchylenia (co jest nietypowe),
  • korelacje (co występuje razem).

To nie są „dodatki” – to jest matematyczny opis Twojego życia.

I co najważniejsze: metadane powstają zawsze, nawet jeśli treść nie powstaje nigdy.

2. Jak powstają metadane — warstwa po warstwie

Każde urządzenie, które łączy się z siecią, generuje metadane w kilku równoległych warstwach:

Warstwa 1 — sieć (IP, routing, BTS, TTL) Tu powstają informacje o:

  • Twojej lokalizacji,
  • Twoim operatorze,
  • Twojej prędkości przemieszczania,
  • Twojej strefie czasowej,
  • Twojej aktywności w czasie.

To jest poziom, którego nie da się wyłączyć.
To jest fundament internetu.

Warstwa 2 — urządzenie (IMEI, MAC, sensory) Tu powstają informacje o:

  • modelu smartfona,
  • stanie baterii,
  • orientacji urządzenia,
  • ruchu (akcelerometr, żyroskop),
  • sile sygnału,
  • pobliskich sieciach Wi-Fi.

Twój smartfone wie, czy biegniesz, jedziesz, siedzisz, śpisz, czytasz, czy tylko odblokowałeś ekran „na sekundę”.

Warstwa 3 — aplikacje (API calls, request headers) Tu powstają informacje o:

  • tym, z jakich aplikacji korzystasz,
  • jak często,
  • o której godzinie,
  • jak długo,
  • w jakiej kolejności.

Aplikacje nie muszą wiedzieć, co robisz.
Wystarczy, że wiedzą kiedy i jak.

Warstwa 4 — zachowanie (pattern analysis) To najcenniejsza warstwa.
Tu powstaje:

  • Twój rytm dnia,
  • Twoje nawyki,
  • Twoje anomalie,
  • Twoje relacje,
  • Twoje podatności.

To nie są dane.
To jest sygnatura człowieka.

3. Fingerprinting — identyfikacja bez ciasteczek

Gdy przeglądarki zaczęły blokować cookies, firmy nie zrezygnowały z identyfikacji.
Przerzuciły się na fingerprinting — technikę, która tworzy unikalny „odcisk palca” Twojego urządzenia.

Składa się na niego m.in.:

  • rozdzielczość ekranu,
  • czcionki,
  • sterowniki,
  • GPU,
  • wersja systemu,
  • język,
  • strefa czasowa,
  • kolejność renderowania elementów,
  • mikroopóźnienia procesora.

Fingerprinting jest tak skuteczny, że potrafi rozpoznać Cię nawet wtedy, gdy:

  • wyczyścisz historię,
  • zmienisz IP,
  • użyjesz VPN,
  • otworzysz okno incognito.

To nie jest „śledzenie”. To jest rozpoznawanie.

4. Korelacja — najpotężniejsze narzędzie analityczne świata

Metadane są jak pojedyncze nuty.
Dopiero korelacja tworzy z nich melodię.

Przykład:

Twój telefon loguje się do BTS-a o 6:42.

O 6:44 loguje się drugi telefon.

O 7:03 oba urządzenia przemieszczają się razem.

O 17:12 znów są w tym samym miejscu.

System nie musi znać treści Waszych rozmów.
Wie, że mieszkacie razem.

To samo działa dla:

  • współpracowników,
  • kochanków,
  • aktywistów,
  • dziennikarzy,
  • informatorów,
  • klientów,
  • polityków.

Korelacja to matematyka relacji.

5. RTB — aukcje Twojej uwagi i Twojego profilu

RTB (Real-Time Bidding) to system, w którym Twoje metadane są sprzedawane w czasie rzeczywistym, zanim strona zdąży się załadować.

Wysyłane są setki parametrów:

  • lokalizacja,
  • model urządzenia,
  • historia aktywności,
  • przewidywany dochód,
  • stabilność finansowa,
  • prawdopodobieństwo zakupu,
  • ryzyko kredytowe,
  • podatność na impuls.

To nie jest reklama.
To jest aukcja Twojej przyszłości.

6. Co można wywnioskować z samych metadanych — bez treści

Z samych metadanych można określić:

  • czy jesteś w związku,
  • czy masz depresję,
  • czy zmieniasz pracę,
  • czy masz problemy finansowe,
  • czy chorujesz,
  • czy jesteś w ciąży,
  • czy masz romans,
  • czy jesteś w grupie ryzyka,
  • czy planujesz wyjazd,
  • czy jesteś podatny na manipulację.

To nie są teorie.
To są modele predykcyjne, które działają na poziomie populacji, a potem dopasowują jednostkę.

7. Dlaczego metadane są cenniejsze niż treść

Treść jest chaotyczna.
Treść trzeba analizować.
Treść trzeba rozumieć.

Metadane są:

  • czyste,
  • strukturalne,
  • przewidywalne,
  • łatwe do korelacji,
  • łatwe do automatyzacji,
  • łatwe do sprzedaży.

Treść mówi, co powiedziałeś.
Metadane mówią, kim jesteś.

8. Najważniejsza prawda o metadanych

Metadane nie są „mniej wrażliwe”.
Metadane są bardziej wrażliwe niż treść.

Bo treść mówi o tym, co robisz.
A metadane mówią o tym, kim jesteś, jak żyjesz i co zrobisz jutro.

Nie muszą znać Twojej treści.
Wystarczy, że znają Twój cień.

A cień — w przeciwieństwie do treści — nigdy nie kłamie.

Nie panujesz nad swoją pracą — możesz ją stracić z dnia na dzień.
Nie masz władzy nad innymi ludźmi — nie zmusisz nikogo, by Cię lubił, szanował czy rozumiał.
Nie kontrolujesz nawet własnego zdrowia i ciała — potrafi odmówić posłuszeństwa w najmniej oczekiwanym momencie.
Nie masz władzy nad niczym, poza możliwością dokonywania słusznych wyborów.

Dlatego tej jedynej władzy, którą naprawdę masz — nie ceduj na systemy,
które z Twojego cienia uczą się przewidywać Twoje zachowania i wpływać na Twoje przyszłe wybory.