OpenAI, dat zich bezighoudt met de ontwikkeling van kunstmatige intelligentie, heeft een zogenaamde Retro Contest aangekondigd. Deelnemers moeten een ai-agent insturen die vervolgens onbekende custom Sonic-levels gaat spelen.
Volgens OpenAI is de competitie bedoeld om een algoritme voor reinforcement learning, een vorm van machine learning, te evalueren. Dit gebeurt door te kijken hoe het op basis van eerdere 'ervaringen' kan generaliseren. In plaats van een bekende omgeving te gebruiken zowel voor het trainen als voor de competitie zelf, krijgen deelnemers beschikking over een trainingset aan levels uit verschillende Sonic-retrogames. Hun agent moet tijdens de competitie voor de ontwikkelaars onbekende levels zien te doorstaan binnen een tijdsbestek van achttien uur per level. OpenAI heeft de te gebruiken benchmark eveneens gepubliceerd.
De competitie duurt twee maanden en loopt tot 5 juni. De winnaar is degene met de hoogste score op de ranglijst. Deelnemers kunnen hun agent insturen in de vorm van een Docker-container. OpenAI heeft zelf een aantal basisalgoritmes vrijgegeven, die deelnemers kunnen gebruiken als beginpunt. Daarnaast heeft de organisatie de Gym Retro Beta-omgeving beschikbaar gemaakt, die te vergelijken is met een soort emulator voor de Atari 2600 en Sega Genesis die gebruikt kan worden om games als trainingsomgevingen in te zetten. OpenAI gebruikte al eerder dit soort Gyms voor training met games.
In de aankondiging vermeldt OpenAI nog dat agents soms exploits vinden in games, afhankelijk van hoe de beloningsfunctie is ingesteld. Zo ontdekte een van zijn agents dat het mogelijk was om door een muur heen te glitchen en zo een hogere score te behalen.