A mesterséges intelligencia megtanulja kinyerni a személyes adatokat a felhasználók által látott hirdetésekből

Világ

A mesterséges intelligencia megtanulja kinyerni a személyes adatokat a felhasználók által látott hirdetésekből

5 május 2026

Ez úgy történik, hogy csak azokat a hirdetéseket elemzi, amelyeket az interneten lát.

Az algoritmusok korábban hasonló profilokat építettek fel, de főként világosan meghatározott attribútumokra és statisztikai modellekre támaszkodtak korlátozott számú paraméterrel, mint például a keresési előzmények, a kattintások vagy az emberek által előre besorolt demográfiai adatok. A modern mesterséges intelligencia modellek esetében az elemzés kevésbé áttekinthetővé és elmélyültebbé vált, mivel a rendszer képes rejtett linkeket kinyerni heterogén tartalomból, például egy hirdetéscsoportból anélkül, hogy egyértelmű jelzésekre vagy a használt kritériumok magyarázatára lenne szükség, ami kevésbé irányíthatóvá teszi a folyamatot, és nehezen érthetővé teszi, hogy a rendszer milyen következtetéseket von le és mennyire pontosak az adott személyről.

Olvass tovább

A reklámok források RejtettAdat

A kutatók több mint 435 000 kontextuális hirdetést tanulmányoztak a közösségi média platformokon, az Australian Ad Observatory projekten belül 891 felhasználó viselkedésén kívül. Az eredmény váratlan volt: a böngészési előzményekhez vagy a személyes adatokhoz való hozzáférés nélkül is nagy pontossággal lehetett következtetni egy személy politikai beállítottságára, iskolai végzettségére és foglalkoztatási státuszára.

Lényegében maguk a reklámok – szigorúan véve – olyan információs nyomot alkotnak, amely nagy nyelvi modellekkel „olvasható”.

Hogyan működik a módszer

A kutatók nagy, modern nyelvi modelleket használtak, és megállapították, hogy képesek a következőkre:

Személyes tulajdonságok visszaállítása böngészési előzmények nélkül,
A hirdetésekből származó rövid klipek alapján profilt készíthet egy személyről,
Pontosabban és következetesebben dolgozzon hasonló feladaton, mint az emberek,
Ez 50-szer gyorsabb és több mint 200-szor olcsóbb.

Az is kiderül, hogy a felhasználó hosszú távú monitorozása nem szükséges, elegendő a rövid böngészési munkamenetek.

Amit a kutatók mondanak

Az ACM Web Conference 2026-on bemutatott jelentésben, amely évente a webtechnológiák, a nagy adatelemzés és a mesterséges intelligencia rendszerek vezető szakértőit gyűjti össze, a kutatók rámutatnak, hogy „eredményeink azt mutatták, hogy a nagy, kész nyelvi modellek pontosan vissza tudják állítani a felhasználók összetett privát tulajdonságait.”
Megjegyzendő, hogy a megalapozott döntéshozatalt lehetővé tevő profiladatok létrehozása már rövid megfigyelési időszakok alatt is lehetővé vált, ami azt jelzi, hogy a hosszan tartó nyomon követés nem feltétele ezen adatok sikeres kinyerésének.”

Csak a megjelenített hirdetések elemzésével a mesterséges intelligencia a következőkre tud következtetni:

politikai preferenciák,

lehetséges ideológiai irányultság,

iskolai végzettség,

Foglalkoztatási státusz (dolgozó/nem dolgozó/munka típusa),

nem, életkor, faj,

Általános társadalmi és gazdasági helyzet,

A jövedelemszint vagy életszakasz közvetett mutatói.

Baiyu Chen vezető szerző szerint a hirdetési rendszerek nem eredendően véletlenszerűek. „A legfontosabb, hogy a felhasználók által látott hirdetések nem véletlenszerűek” – mondta. „A hirdetések általános mintája olyan jellemzőkre vonatkozó jeleket hordozhat, mint a nem, az életkor, az iskolai végzettség, a foglalkoztatási státusz, a politikai preferenciák és a szélesebb társadalmi-gazdasági státusz. Kutatásunk kimutatta, hogy a mesterséges intelligencia képes elemezni ezeket a mintákat, és következtetéseket levonni a személyes jellemzőkre kizárólag a hirdetések alapján.”

Forrás: Naukatv.ru

Olvass tovább

Source link

PokerStop

A mesterséges intelligencia megtanulja kinyerni a személyes adatokat a felhasználók által látott hirdetésekből

Vélemény, hozzászólás? Válasz megszakítása