A ChatGPT megjelenése után mindenki számára elérhetőek és kézzelfoghatóak lettek a mesterséges intelligenciában rejlő lehetőségek. A berobbanása után több mint 1800 aláíró, köztük Elon Musk, Gary Marcus és Steve Wozniak (az Apple társalapítója), hat hónapos szünetet kért, mielőtt kiadnák a GPT-4-nél fejlettebb rendszereket.
Ám úgy tűnik, ez az MI fejlesztésére látszólag nem volt nagy hatással (hacsak a ChatGPT látványos butulása nem ennek tudható be). A technológia továbbra is gyorsan fejlődik, a kutatók pedig egyre újabb és hatékonyabb modelleket hoznak létre.
kép forrása: lumiere-video.github.io
Az idén január végén a Google bemutatta a Lumiere-t, egy olyan mesterséges intelligenciát, amely képes például szövegből meglepően valósághű rövid videókat generálni. A közzétett videóból és a tudományos előzetes tanulmányból látszik, hogy az MI videógeneráló és -szerkesztő eszközök milyen gyorsan fejlődtek az elmúlt években. A Lumiere annak a Google DeepMind kutatócsoportnak a terméke, amely korábban olyan áttöréseket ért el, mint az AlphaGo és az AlphaZero (ezek azok a programok, amelyek úgy győzték le az embereket a go játékban, hogy sikerült túlszárnyalniuk az emberek több ezer éves tapasztalatát). A Lumiere a legújabb generációs GPT-4 modellre épül, mely képes több mint száz nyelven megérteni és létrehozni a szöveget. Ám a videók generálásához nem csupán szöveget, hanem képeket, hangokat és mozgásokat is használ, amit a Google több milliárd online tartalomból tanított meg neki. Többféle videógenerálási lehetőséget is kínál, például szöveget videóvá, képet videóvá vagy egy bizonyos stílusban, esetleg a videó csak egy részét animálva, de a videó egy területét átszínezve vagy mintázva is képes videót létrehozni. Például ha egy festményt, gyerekrajzot vagy rajzfilmet használunk referenciaként, akkor a program képes átalakítani a már meglévő videót a megadott stílusra. Elég csak annyit mondanunk neki, hogy a „fényképen szereplő emberek öleljék meg egymást” vagy „legyen mindenki piros színű ruhában”.
A Lumiere ugyanolyan kockázatokat rejt magában, mint a képalkotó programok. A Google elismeri, hogy a technológiával hamis vagy káros tartalmakat is létre lehet hozni. Tervezi, hogy eszközöket fejlesszen a rosszindulatú felhasználás észlelésére, garantálva a technológia biztonságos és tisztességes alkalmazását. Ezért sem tették még szabadon elérhetővé, mivel aggódnak a potenciális visszaélések és etikai kérdések miatt. A Google vezérigazgatója, Sundar Pichai azt nyilatkozta, hogy a Lumiere-t csak bizonyos partnerekkel és ügyfelekkel osztják meg, akik megfelelnek a Google mesterséges intelligenciára vonatkozó irányelveinek. Pichai azt is elmondta, hogy a programot folyamatosan felügyelik és tesztelik, hogy garantálják a minőségét és a biztonságát. A Lumiere egy rendkívül innovatív és kreatív mesterséges intelligencia, mely új lehetőségeket nyit meg a vizuális tartalom létrehozásában. Miután elérhetővé válik a nagyközönség számára is, legalább annyira változtathatja meg a videókészítést, mint a ChatGPT az esszéírást.
Fontos megjegyezni, hogy fent említett petíció és az ilyen fejlesztések nem feltétlenül állnak szöges ellentétben egymással. A petíció egyik célja volt az is, hogy ráirányítsa a figyelmet a MI fejlődésének potenciális kockázataira, és ösztönözze a fejlesztőket, a szabályozókat, hogy ezeket vegyék figyelembe. Nem feltétlenül kell a fejlesztésnek teljesen leállnia, inkább etikus és felelősségteljes módon kell történnie. És úgy tűnik, valamennyire mégiscsak volt hatása a petíciónak, hiszen jelenleg is folynak a tárgyalások egy mesterséges intelligenciáról szóló jogszabályról (AI Act — AIA), melyet folyamatosan finomítanak, és várhatóan az év végére hatályba is lép.