A mesterséges intelligencia megtanulja kinyerni a személyes adatokat a felhasználók által látott hirdetésekből
Ez úgy történik, hogy csak azokat a hirdetéseket elemzi, amelyeket az interneten lát.
Az algoritmusok korábban hasonló profilokat építettek fel, de főként világosan meghatározott attribútumokra és statisztikai modellekre támaszkodtak korlátozott számú paraméterrel, mint például a keresési előzmények, a kattintások vagy az emberek által előre besorolt demográfiai adatok. A modern mesterséges intelligencia modellek esetében az elemzés kevésbé áttekinthetővé és elmélyültebbé vált, mivel a rendszer képes rejtett linkeket kinyerni heterogén tartalomból, például egy hirdetéscsoportból anélkül, hogy egyértelmű jelzésekre vagy a használt kritériumok magyarázatára lenne szükség, ami kevésbé irányíthatóvá teszi a folyamatot, és nehezen érthetővé teszi, hogy a rendszer milyen következtetéseket von le és mennyire pontosak az adott személyről.
A reklámok források RejtettAdat
A kutatók több mint 435 000 kontextuális hirdetést tanulmányoztak a közösségi média platformokon, az Australian Ad Observatory projekten belül 891 felhasználó viselkedésén kívül. Az eredmény váratlan volt: a böngészési előzményekhez vagy a személyes adatokhoz való hozzáférés nélkül is nagy pontossággal lehetett következtetni egy személy politikai beállítottságára, iskolai végzettségére és foglalkoztatási státuszára.
Lényegében maguk a reklámok – szigorúan véve – olyan információs nyomot alkotnak, amely nagy nyelvi modellekkel „olvasható”.
Hogyan működik a módszer
A kutatók nagy, modern nyelvi modelleket használtak, és megállapították, hogy képesek a következőkre:
- Személyes tulajdonságok visszaállítása böngészési előzmények nélkül,
- A hirdetésekből származó rövid klipek alapján profilt készíthet egy személyről,
- Pontosabban és következetesebben dolgozzon hasonló feladaton, mint az emberek,
- Ez 50-szer gyorsabb és több mint 200-szor olcsóbb.
Az is kiderül, hogy a felhasználó hosszú távú monitorozása nem szükséges, elegendő a rövid böngészési munkamenetek.
Amit a kutatók mondanak
Az ACM Web Conference 2026-on bemutatott jelentésben, amely évente a webtechnológiák, a nagy adatelemzés és a mesterséges intelligencia rendszerek vezető szakértőit gyűjti össze, a kutatók rámutatnak, hogy „eredményeink azt mutatták, hogy a nagy, kész nyelvi modellek pontosan vissza tudják állítani a felhasználók összetett privát tulajdonságait.”
Megjegyzendő, hogy a megalapozott döntéshozatalt lehetővé tevő profiladatok létrehozása már rövid megfigyelési időszakok alatt is lehetővé vált, ami azt jelzi, hogy a hosszan tartó nyomon követés nem feltétele ezen adatok sikeres kinyerésének.”
Csak a megjelenített hirdetések elemzésével a mesterséges intelligencia a következőkre tud következtetni:
- politikai preferenciák,
- lehetséges ideológiai irányultság,
- iskolai végzettség,
- Foglalkoztatási státusz (dolgozó/nem dolgozó/munka típusa),
- nem, életkor, faj,
- Általános társadalmi és gazdasági helyzet,
- A jövedelemszint vagy életszakasz közvetett mutatói.
Baiyu Chen vezető szerző szerint a hirdetési rendszerek nem eredendően véletlenszerűek. „A legfontosabb, hogy a felhasználók által látott hirdetések nem véletlenszerűek” – mondta. „A hirdetések általános mintája olyan jellemzőkre vonatkozó jeleket hordozhat, mint a nem, az életkor, az iskolai végzettség, a foglalkoztatási státusz, a politikai preferenciák és a szélesebb társadalmi-gazdasági státusz. Kutatásunk kimutatta, hogy a mesterséges intelligencia képes elemezni ezeket a mintákat, és következtetéseket levonni a személyes jellemzőkre kizárólag a hirdetések alapján.”
Forrás: Naukatv.ru