Dell Asharq Al-Awsatnak: A mesterséges intelligencia Szaúd-Arábiában a gyártási tesztbe lép be, nem a kísérletbe

Világ

Dell Asharq Al-Awsatnak: A mesterséges intelligencia Szaúd-Arábiában a gyártási tesztbe lép be, nem a kísérletbe

20 május 2026

Az Ikrektől az okosszemüvegekig… íme a Google Developers Conference legjelentősebb bejelentései

A Google I/O 2026 nem csupán alkalom volt új mesterséges intelligencia modellek bejelentésére. A tágabb üzenet az volt, hogy a Google az AI-t egy különálló eszközről egy olyan rétegre akarta áthelyezni, amely a keresés, a levelezés, a videó, a vásárlás, a kiterjesztett valóság fejhallgatók és a fejlesztői eszközök között működött.

A kérdés már nem csak: Mit tud válaszolni a modell? Inkább: Hogyan válhat a mesterséges intelligencia az internet, az eszközök és a napi szolgáltatások használatának részévé?

Sundar Pichai, a Google vezérigazgatója beszél a konferencián (AFP)

A kutatás az ügynök fázisba lép

A konferencia csúcspontja a mesterséges intelligencia körüli kutatási tapasztalatok folyamatos újraépítése volt. A Google bejelentette, hogy az „AI Overviews” több mint 2,5 milliárd havi aktív felhasználót ért el, ez a szám azt mutatja, hogy a mesterséges intelligencia által hajtott keresés már nem elhanyagolható élmény. Azt is elmondta, hogy az „AI Mode” egy éven belül meghaladta az egymilliárd havi aktív felhasználót, és ezt a keresés történetének egyik legnagyobb átalakulásának nevezte.

Ez az eltolódás azt jelenti, hogy a Google többé nem csak linklistaként kezeli a keresést; Inkább válaszok generálására, információk szintetizálására, lépések biztosítására és esetleg későbbi feladatok végrehajtására alkalmas interfész. Így jelenik meg az „ügynökkorszak” fogalma, amelyre a vállalat fókuszált. Ahelyett, hogy a felhasználó egyszerűen információt kérne a keresőtől, a Google azt szeretné, ha a mesterséges intelligencia segíthetne a különböző termékek tervezésében, kiválasztásában, összehasonlításában és megvalósításában.

A „Gemini” olyan asszisztenssé válik, amely több alkalmazáson és eszközön dolgozik, és jobban képes megérteni szöveget, képeket, hangot és videót (Reuters)

Az „Ikrek” a rendszer középpontjában áll

A Google jelentős frissítésekkel látta el a Gemini családot az új modellek bejelentésével, mint például a Gemini 3.5 és a Gemini Omni. Az alapötlet az, hogy a „Gemini” már nem csak egy chatbot; Inkább a feladatok, a média és az alkalmazások közötti interakció központja.

A cég bemutatása szerint a „Gemini 3.5 Flash” egy új generáció része, amely egyesíti a sebességet és a bonyolultabb lépések végrehajtásának képességét. A Google a proxyhasználat, a programozás és a hosszú távú feladatok fejlesztéseiről beszélt. A Gemini Omni egy másik trendet képvisel, mint egy multimédiás modell, amely képes kezelni a különböző típusú bemeneteket, és egyértelműen a video- és médiaszerkesztésre helyezi a hangsúlyt.

Ez a pont fontos; Mert feltárja a mesterséges intelligencia versenyének trendjét. A nagyvállalatok már nem csak egy jobb szöveget író modellért versenyeznek; Inkább egy olyan modellen alapul, amely képes megérteni a szöveget, képeket, hangot, videót és személyes kontextust, majd a termékek és szolgáltatások között mozog.

A konferencia közleményei egyértelműen az intelligens ügynökökre helyezték a hangsúlyt, amelyek képesek segíteni a felhasználót a napi feladatok (AP) elvégzésében.

Az asszisztens nem várja meg a felhasználót

A feltűnő bejelentések között szerepel a „Gemini Spark” megjelenése is, amelyet személyi asszisztensként mutattak be, amely képes a háttérben dolgozni, és nyomon követni a feladatokat az eszközökön és alkalmazásokon keresztül. Az ötlet az, hogy a mesterséges intelligencia nem csak a kérdés és válasz pillanatához kötődik; Még feladatokat is szervezhet, információkat gyűjthet, és adatokat kapcsolhat össze különböző szolgáltatásokból, például levelekből, térképekből és naptárból.

Ez a tendencia a Google-t közvetlen konfrontációba állítja más vállalatokkal, amelyek olyan mesterséges intelligencia ügynököket próbálnak kiépíteni, amelyek képesek a felhasználó nevében dolgozni. A Google esetében azonban ez más dimenziót ölt, mert a cég a napi termékek széles rendszerével rendelkezik, mint például a kereső, a Gmail, a YouTube, az Android, a Chrome, a Workspace és a térképek. Minél többet tud a Gemini működni ezeken a szolgáltatásokon belül, annál közelebb kerül egy személyes működési réteghez a felhasználó digitális életében.

A fejlesztői eszközök a hirdetések nagy részét kapták, elsősorban az intelligens űrlapok (AP) segítségével történő gyorsabb alkalmazások létrehozására összpontosítva.

Levél, videó és vásárlás

Az AI jelenléte nem korlátozódik a kutatásra; A bejelentések új funkciókat tartalmaztak a Gmailben, a YouTube-ban és a vásárlásban. A javasolt ötletek között szerepel: fejlettebb hangos interakció a leveleken belül, új élmények a videók kereséséhez vagy a YouTube-on belüli tartalommal kapcsolatos kérdések feltevéséhez, valamint olyan vásárlási eszközök, amelyek megpróbálják segíteni a felhasználót az összehasonlításban, az ajánlatok nyomon követésében és a vásárlások intelligensebb lebonyolításában.

Ez azt jelenti, hogy a Google be akarja építeni a mesterséges intelligenciát a használat gyakorlati mozzanataiba, mint például üzenetírás, videókeresés, termékválasztás, árak összehasonlítása, vagy egy olyan apró feladat elvégzése, amivel a felhasználó nem akar hosszú időt tölteni. Így a mesterséges intelligencia kevésbé válik független tapasztalattá egy adott alkalmazáson belül, és inkább segítő réteggé válik, amely szükség szerint megjelenik az egyes termékeken belül.

A Google újra bevezette az okosszemüveget az Android XR-en keresztül, és összekapcsolta őket a mesterséges intelligenciával és a felhasználót körülvevő kontextussal (AFP)

Az okosszemüveg visszatérése

Az okosszemüveg-fájl erőteljesen visszatért a konferencián; A Google bemutatta elképzelését az Android XR-re épülő és a Geminivel integrált szemüvegekről, olyan cégekkel együttműködve, mint a Samsung, a Warby Parker és a Gentle Monster. Az üzenet az, hogy az okosszemüvegekkel végzett éveken át tartó, akadozó kísérletek után a Google úgy véli, hogy a mesterséges intelligencia lehet az az elem, amely hasznosabbá teszi ezeket az eszközöket.

A különbség az, hogy az új szemüveget nem csak kameraként vagy kis képernyőként mutatják be a szem előtt; Inkább azért, hogy kontextuális segítséget kapjunk a való világban. A modell láthatja, amit a felhasználó lát, hallja, mi történik körülötte, élő fordítást biztosít, segít eligazodni, vagy válaszol az előtte álló jelenettel kapcsolatos kérdésekre.

Ennek az útnak a sikere azonban nem csak a technológián múlik. A szemüvegnek társadalmilag elfogadhatónak, kényelmesnek kell lennie, tiszteletben kell tartania a magánéletet, és nem kell megismételnie a hordható eszközök első generációjának hibáit. Ezért a Google szemüvegekre szakosodott márkákkal működik együtt, nem csak technológiai cégekkel. Mert a forma és a napi elfogadás döntő lesz.

Fejlesztői eszközök

A Google nem feledkezett meg a fejlesztői közönségről, amely az I/O konferencia magja. A bejelentések olyan eszközöket tartalmaztak, amelyek lehetővé teszik alkalmazások, interfészek vagy programozási élmények létrehozását természetes parancsok használatával, valamint az objektumorientált programozási paradigmák fejlesztését. Ez azért fontos, mert az AI-csata nem csak a fogyasztói termékekben dől el; Inkább a fejlesztők és a vállalatok azon képessége, hogy alkalmazásokat építsenek a modellekre.

A Google szeretné gyorsabbá tenni az alkalmazások építését, és lehetővé tenni a vállalatok számára, hogy modelljeit többféle környezetben is használják. Itt intenzív a verseny az Open AI, az Anthropic és a Microsoft között. Főleg a programozásban és az üzleti automatizálásban. Ezért a Google a sebességre, a költségekre és a modellek azon képességére összpontosított, hogy összetett feladatokat hajtsanak végre, nem csak szöveges válaszokat.

A legnagyobb kihívás ebben a szakaszban továbbra is a válaszok pontossága, a magánélet, az ügynökök korlátai, valamint a mesterséges intelligencia kiadókra és webhelyekre gyakorolt hatása (Reuters)

A mesterséges intelligencia, mint új felület

A hirdetések közti közös szál az, hogy a Google szorgalmazza, hogy a mesterséges intelligencia új felhasználói felületté váljon. A múltban a felhasználó megnyitott egy alkalmazást, keresett, koppintott, kiválasztotta és végrehajtotta. A Google által javasolt modell ezeket a lépéseket igyekszik csökkenteni: Ön kérdez, a rendszer értelmezi, javasolja, rendszerezi, esetleg megvalósítja.

Ez nem jelenti azt, hogy minden készen áll vagy garantált. Nagy kérdések merülnek fel a válaszok pontosságával, az adatvédelemmel, az ügynökök korlátaival, valamint azzal kapcsolatban, hogy miként lehet megelőzni a hibákat, amikor a mesterséges intelligencia megkezdi a feladatok végrehajtását, ahelyett, hogy javaslatokat tenne. A mesterséges intelligencia bevezetése a keresésbe szintén megváltoztathatja a kiadók és a terjesztési platformokkal rendelkező oldalak kapcsolatát. Mert a felhasználó összetett választ kaphat anélkül, hogy mindig az eredeti forráshoz fordulna.

Mit jelent ez a felhasználók és a vállalkozások számára?

Az átlagfelhasználó számára ezek a változások fokozatosan megjelenhetnek az interaktívabb keresés, az intelligensebb levelezés, a jelenlevőbb asszisztens, a közvetlenebb vásárlási élmény és esetleg a való világ tetejére információs réteget hozzáadni képes szemüveg formájában.

Ami a cégeket illeti, a legfontosabb üzenet az, hogy a mesterséges intelligencia már nem mellékes projekt. Ha az olyan eszközök, mint a Gemini a keresés, a levelezés, a videó és az eszközök részévé válnak, a szervezeteknek át kell gondolniuk, hogyan jelennek meg ezek az új élmények, és hogyan kezelik adataikat, tartalmaikat és szolgáltatásaikat, miközben a mesterséges intelligencia közvetítővé válik a felhasználó és az internet között.

A Google egyetlen elszigetelt hirdetést sem jelentetett meg; Inkább egy kísérlet arra, hogy termékeit egy ötlet köré rendezze át, vagyis hogy a „Gemini” nem egy kiegészítő alkalmazás. Inkább a személyes és üzleti internet következő szakaszának működési rétege. Ez az a pont, ami miatt fontos a Google I/O 2026, nem csak azért, mert új modellt mutatott be; Inkább azt mutatta meg, hogy a Google hogyan szeretné, ha a mesterséges intelligencia a beszélgetési ablakból a napi digitális élmény középpontjába kerülne.

Source link