Project Genie, Google's AI-prototype voor het creƫren van interactieve werelden.

  • Project Genie combineert Genie 3, Nano Banana Pro en Gemini om interactieve virtuele werelden te creĆ«ren op basis van tekst of afbeeldingen.
  • De toegang is beperkt tot Google AI Ultra-abonnees in de Verenigde Staten, met sessies van maximaal 60 seconden en een resolutie van ongeveer 720p.
  • Met de tool kun je in realtime werelden schetsen, verkennen en combineren, maar de tool kampt met problemen op het gebied van realisme, latentie en beperkte personagebesturing.
  • Het vermogen van de game om bekende spellen na te bootsen, leidt tot discussies over auteursrecht en baart een deel van de videogame-industrie zorgen.

AI-project voor het genereren van interactieve werelden

Google heeft een nieuwe stap gezet in zijn offensief. kunstmatige intelligentie toegepast op videogames en virtuele werelden Met de lancering van Project Genie, een prototype waarmee gebruikers interactieve omgevingen kunnen genereren en erdoorheen kunnen navigeren op basis van een paar tekstuele aanwijzingen of een afbeelding, presenteert het bedrijf de tool als een experiment dat nog in de testfase verkeert. De eerste demonstraties hebben echter zowel enthousiasme als twijfel binnen de branche gewekt.

Voorlopig is de toegang beperkt tot abonnees van het Google AI Ultra-abonnement in de Verenigde Statenmet korte sessies en prestaties die duidelijk gekenmerkt worden door het experimentele karakter van het systeem. Desondanks wijst het project naar een toekomst waarin elke gebruiker Creƫer in enkele seconden een kleine 'speelbare wereld'., zonder dat je hoeft te weten hoe je moet programmeren of met grafische engines moet werken.

Wat is Project Genie en welke technologieƫn combineert het?

Wereldgenerator met kunstmatige intelligentie

Project Genie is een onderzoeksprototype ontwikkeld door Google DeepMind en Google AI die functioneert als een interactieve wereldgenerator. De technische basis rust op drie pijlers: het Genie 3-model, gespecialiseerd in het simuleren van dynamische omgevingen; Nano Banana Pro, verantwoordelijk voor de visuele aspecten en schetsen; en Gemini, het multimodale model dat gebruikersinstructies interpreteert en als assistent fungeert tijdens het creatieproces.

Het hart van het systeem is Genie 3, een "wereld"-model dat frame voor frame kan voorspellen wat er op het scherm gebeurt.In tegenstelling tot eerdere technologieën die alleen statische 3D-scènes genereerden, zorgt deze aanpak ervoor dat de omgeving in realtime reageert op de bewegingen van de speler, met een resolutie van ongeveer 720p en een visuele coherentie van enkele minuten volgens interne experimenten van DeepMind.

Het is op die basis geïntegreerd. Nano Banana Pro, verantwoordelijk voor het genereren van het initiële beeld van het podium. Aan de hand van een beschrijvende tekst of een referentieafbeelding dient dit eerste beeld als schets om de grafische stijl, de compositie van de wereld en het uiterlijk van het personage dat tijdens de verkenning bestuurd zal worden, te bepalen.

Tenslotte Gemini fungeert als een orkestratielaag en assistent.Het interpreteert instructies in natuurlijke taal, helpt de wereld dynamisch aan te passen en vergemakkelijkt taken zoals het veranderen van het perspectief (eerste of derde persoon), het aanpassen van een reeds gecreƫerde omgeving of het combineren van verschillende ideeƫn tot ƩƩn speelbaar scenario.

Hoe virtuele werelden worden gecreƫerd en verkend

Interactieve werelden gegenereerd door AI

De werking van Project Genie is gestructureerd rondom een een progressief proces in drie fasen Google vat het samen als schetsen, verkennen en werelden combineren. Het doel is dat iedereen zonder extra hulpmiddelen van een idee naar een kleine interactieve ervaring kan gaan.

In de eerste fase schrijft de gebruiker een beschrijving van de wereld die hij of zij wil creƫren, of uploadt een referentieafbeelding. Op basis van die invoer, Nano Banana Pro genereert een statische preview. De setting kan een bos in low-poly-stijl zijn, een futuristische stedelijke omgeving, een historisch landschap, of wat dan ook in de tekst wordt beschreven. Het personagetype, de cameramodus en enkele basisbewegingsparameters worden in deze fase ook gedefinieerd.

Zodra de schets is goedgekeurd, komt Genie 3 in actie om de speler in staat te stellen Verken de omgeving vrij met behulp van de gebruikelijke pc-besturingselementen zoals de W-, A-, S- en D-toetsen.Het model genereert dynamisch wat er voor het personage verschijnt, waarbij elk frame wordt voorspeld op basis van de voorgaande frames en een zekere consistentie wordt behouden wanneer de camera wordt gedraaid of terugkeert naar een reeds bezocht gebied.

De derde belangrijke vaardigheid is de combinatie en hermix van wereldenHet systeem stelt gebruikers in staat om eerder gegenereerde scenario's opnieuw te bekijken, aan te passen met nieuwe parameters, samen te voegen of zelfs vooraf gegenereerde werelden van Google als basis te gebruiken om variaties te creƫren. Bovendien kunnen video's van de sessies worden gedeeld, zodat andere gebruikers ze kunnen bekijken of als inspiratie kunnen gebruiken.

Dit alles wordt aangestuurd vanuit een webapplicatie, vergelijkbaar met andere AI-diensten van Google, zodat Er hoeven geen extra programma's te worden geĆÆnstalleerd en geavanceerde technische kennis is niet vereist.Open de tool, voer de instructie in en begin met het testen van combinaties totdat je een interessant resultaat vindt.

Technische beperkingen: tijd, prestaties en realisme.

Beperkingen van een AI-prototype voor virtuele werelden

Google staat erop Project Genie te definiëren als een onderzoeksprototype met een uitgesproken experimenteel karakterDat label is niet zomaar een formaliteit: de huidige ervaring laat een aantal duidelijke beperkingen zien die het praktische gebruik van het instrument, afgezien van aanvankelijke nieuwsgierigheid, beïnvloeden.

De meest voor de hand liggende is de Limiet van 60 seconden per generatie en verkenningssessieNa die minuut valt de wereld stil en begint een nieuwe ervaring. Het bedrijf legt uit dat deze beperking zorgt voor een betere verdeling van de computerbronnen, omdat elke sessie een eigen chip reserveert voor de gebruiker die aan het spelen is.

Wat de prestaties betreft, beschrijven openbare tests het volgende: een resolutie van ongeveer 720p en een frequentie van tussen de 20 en 24 beelden per secondeDeze functies gaan gepaard met een merkbare vertraging bij het bewegen van het personage of het veranderen van de camera. Volgens sommige vroege testers voelt de ervaring meer aan als een interactieve video dan als een volledig vloeiend, traditioneel videospel.

Het is ook belangrijk om te vermelden dat Genie 3 Het is geen klassieke grafische engine, maar een model dat het volgende frame voorspelt. Op basis van het bovenstaande leidt dit tot vreemd gedrag: paden die zonder duidelijke reden van textuur veranderen, elementen die verdwijnen, onwaarschijnlijke natuurkundige principes of animaties die willekeurig vervormen.

Google waarschuwt zelf dat de gegenereerde werelden "Ze lijken misschien niet helemaal echt of voldoen niet altijd aan de aanwijzingen of de wetten van de fysica."En de besturing van de personages kan onnauwkeurig zijn. Met andere woorden, de technologie is veelbelovend, maar biedt nog lang geen verfijnde game-ervaring op het gebied van gameplay en visuele stabiliteit.

Beperkte toegang en internationale routekaart

Beperkte toegang tot een AI-prototype

In deze eerste fase is Project Genie alleen beschikbaar voor Google AI Ultra-klanten in de Verenigde StatenHet meest geavanceerde abonnement van het bedrijf is gericht op bedrijven en makers die behoefte hebben aan krachtige AI-functionaliteiten. Het is een premium service, waardoor het aantal gebruikers met toegang tot het experiment beperkt is.

Het besluit om het testen te beperken wordt verklaard door zowel de rekenkosten van elke sessie Dit komt doordat Google graag gedetailleerde feedback verzamelt voordat de tools op grotere schaal worden uitgerold. Shlomi Frutcher, onderzoeksdirecteur bij DeepMind, benadrukte dat het "spannend" is om deze tools voor meer mensen beschikbaar te stellen en meningen over het gebruik in de praktijk te verzamelen, maar er is vooralsnog geen specifieke datum voor de introductie in Europa of andere markten.

Vanuit het perspectief van Spaanse en Europese gebruikers en studies vertaalt dit zich in het feit dat, in ieder geval op de korte termijn, De meest realistische rol zal die van waarnemer zijn.Volg de tests nauwlettend, analyseer de video's die al op sociale media circuleren en beoordeel in hoeverre deze technologie kan worden geïntegreerd in workflows voor leveldesign, rapid prototyping of ideeënvisualisatie.

Google heeft aangegeven dat het van plan is om Toegang geleidelijk uitbreiden Mits de prestaties, kosten en juridische aspecten dit toelaten. Het tempo van deze uitbreiding zal echter ook afhangen van de reactie van de gemeenschap en hoe de debatten rond auteursrecht en het verantwoord gebruik van content van derden zich ontwikkelen.

Het vermogen om bekende spellen na te bootsen en het debat over auteursrecht.

Een van de meest delicate punten van Project Genie is de het vermogen om, met wisselend succes, werelden na te maken die duidelijk geĆÆnspireerd zijn door bestaande videogamesSommige gespecialiseerde journalisten zijn erin geslaagd scenario's te bedenken die overduidelijk leken op titels als Super Mario 64, Metroid Prime of The Legend of Zelda: Breath of the Wild.

In het geval van Zelda zijn ze zelfs gezien. personages die een paraglider inzetten bij het springenDit gebaar wordt nauw geassocieerd met het Nintendo-spel. Deze overeenkomsten suggereren dat het model is getraind met behulp van een groot aantal openbaar beschikbare gameplayvideo's, wat vragen oproept over de behandeling van intellectueel eigendom bij AI-training.

Na diverse tests waarbij werelden geïnspireerd op zeer herkenbare franchises werden nagebootst, is Google begonnen met Blokkeer de generatie van bepaalde scenario's en personagesVooral wanneer specifieke namen of handelsmerken worden genoemd. In sommige gevallen verhindert de tool direct het creëren van werelden gebaseerd op bepaalde sagen, onder verwijzing naar "belangen van externe contentaanbieders".

Het bedrijf legt uit dat Project Genie ā€œvoornamelijk getraind met openbaar beschikbare webgegevensā€Maar onthoud dat deze inhoud nog steeds onder het auteursrecht valt. Het resultaat is een moderatiesysteem dat nog in ontwikkeling is, waarin sommige pogingen om auteursrechtelijk beschermde werken te reproduceren expliciet worden geblokkeerd, terwijl andere erdoorheen glippen zolang er maar geen al te directe verwijzingen worden gemaakt.

Dit onregelmatige gedrag wakkert het debat aan over In hoeverre kan of moet AI zich laten inspireren door bestaande spellen? En waar trekken we de grens tussen eerbetoon, imitatie en kopiƫren? Deze discussie zal naar verwachting met name relevant zijn in regio's zoals de Europese Unie, waar de regelgeving rond trainingsdata en auteursrecht in AI nog in ontwikkeling is.

Potentiƫle impact op de videogame-industrie

Naast de media-aantrekkingskracht van het kijken naar... Werelden "zoals Mario" of "zoals Zelda" worden in seconden gegenereerd.Project Genie maakt deel uit van een bredere wedloop tussen grote technologiebedrijven om generatieve AI toe te passen op game-ontwikkeling. Microsoft heeft bijvoorbeeld projecten zoals Muse onthuld om delen van het ontwerp- en productieproces te automatiseren, en andere bedrijven onderzoeken vergelijkbare oplossingen om kosten te verlagen en de ontwikkeling te versnellen.

In deze context is het doel van het voorstel van Google om te worden een tool voor snelle prototyping en experimenten Dit kan interessant zijn voor zowel onafhankelijke studio's als grote uitgevers. De mogelijkheid om een ​​speelbaar scenario te bouwen op basis van een schets of een alinea tekst kan vroege validatie van ideeĆ«n, het maken van interne demo's of het testen van spelmechanismen vergemakkelijken zonder maandenlang werk te hoeven investeren.

De opkomst van dit soort oplossingen baart echter sommigen in de sector zorgen. Enerzijds, Er bestaat bezorgdheid over de mogelijke gevolgen voor bepaalde beroepsgroepen. Als een deel van de inhoud automatisch wordt gegenereerd, is dat een optie. Aan de andere kant zijn veel ontwikkelaars huiverig voor bedrijfsmodellen waarbij AI wordt getraind op reeds gepubliceerde werken zonder duidelijke compensatie voor de auteurs.

In de Europese en Spaanse markten, waar het debat over de bescherming van cultureel erfgoed bijzonder intens is, zal het cruciaal zijn om te zien hoe instrumenten zoals Project Genie in toekomstige regelgeving passen. Aspecten zoals transparantie over trainingsdata, opt-out-systemen voor rechthebbenden en de toeschrijving van gegenereerde content kunnen het verschil maken tussen een verstandige implementatie en voortdurende conflicten met ontwikkelaars en uitgevers.

Project Genie bevindt zich momenteel nog in een vroeg stadium. Het functioneert meer als een openbaar laboratorium dan als een afgewerkt product.De verdere ontwikkeling ervan, en hoe Google omgaat met de bijbehorende juridische en ethische kwesties, zal bepalen of het uiteindelijk in de workflow van studio's wordt geĆÆntegreerd of een opvallend maar beperkt experiment blijft.

Het uiterlijk van dit prototype maakt echter duidelijk dat grote technologiebedrijven hierin een potentieel zien. Automatische generatie van interactieve werelden Een strategisch terrein van de eerste orde. Hoewel het huidige gebruik ervan beperkt is en kampt met technische onvolkomenheden, is de richting duidelijk: modellen die steeds beter in staat zijn om tekst en afbeeldingen om te zetten in speelbare ervaringen, en een industrie die zal moeten beslissen hoe ze met deze nieuwe tools wil samenleven.

Gerelateerd artikel:
Definitie van virtual reality Wat u moet weten!