April 30, 2024

OpenAI kan Engels in code vertalen met nieuwe machine learning-software Codex

AI-onderzoeksbureau OpenAI lanceert een nieuwe tool voor machine learning die Engels in code vertaalt. de Een programma genaamd Codex Het is ontworpen om het werk van professionele programmeurs te versnellen en om hobbyisten te helpen aan de slag te gaan met programmeren.

In Codex-demo’s laat OpenAI zien hoe de software kan worden gebruikt om eenvoudige websites en rudimentaire games te maken met behulp van natuurlijke taal, maar ook om te vertalen tussen verschillende programmeertalen en data science-query’s te verwerken. Gebruikers typen opdrachten in het Engels in het programma, zoals “Maak een webpagina met menu aan de zijkant en adres bovenaan”, en Codex vertaalt dit in code. Het programma is verre van verkeerd en vereist wat geduld om te draaien, maar het kan van onschatbare waarde blijken te zijn om codering sneller en gemakkelijker toegankelijk te maken.

zei Greg Brockman, chief technology officer bij OpenAI en mede-oprichter van de rand. Programmeren bestaat uit twee delen: je moet ‘goed nadenken over een probleem en het proberen te begrijpen’ en ‘die kleine stukjes toewijzen aan bestaande code, of het nu een bibliotheek, een functie of een API is. “Deel twee Het is saai, zegt hij, maar dat is het beste van Codex. Er zijn mensen nodig die echt geprogrammeerd zijn en het harde werk wegnemen.”

OpenAI gebruikte een eerdere versie van Codex om een ​​tool te bouwen genaamd tweede piloot Voor GitHub, een coderepository die eigendom is van Microsoft, die zelf een bestand is Nauwe partner van OpenAI. Copilot is vergelijkbaar met de tools voor automatisch aanvullen in Gmail en biedt suggesties voor het afwerken van regels code terwijl gebruikers ze typen. Desondanks is de nieuwe OpenAI-versie van Codex geavanceerder en flexibeler, en het gaat niet alleen om het voltooien van de code, maar ook om het genereren.

Codex is gebouwd bovenop GPT-3, OpenAI’s taalgeneratiemodel, dat op een groot deel van het internet is getraind, waardoor het geschreven woord op indrukwekkende wijze kan worden gegenereerd en geanalyseerd. Een van de toepassingen die GPT-3-gebruikers vonden, was het genereren van code, maar Codex verbetert de mogelijkheden van zijn voorgangers en is specifiek getraind in open source-coderepositories die van internet zijn gehaald.

Dit laatste punt bracht veel programmeurs ertoe te klagen dat OpenAI is Onterecht profiteren van hun werk. De Copilot-tool van OpenAI suggereert vaak codefragmenten die bijvoorbeeld door anderen zijn geschreven, en de volledige kennisbank van de software is uiteindelijk afkomstig uit open source-werk, dat wordt gedeeld ten behoeve van individuen in plaats van bedrijven. Dezelfde kritiek zal waarschijnlijk worden geuit op Codex, hoewel OpenAI zegt dat het gebruik van deze gegevens wettelijk wordt beschermd door redelijk gebruik.

Toen hem werd gevraagd naar deze klachten, antwoordde Brockmann: “Er komt nieuwe technologie aan, we hebben deze discussie nodig, en er zullen dingen zijn die we doen waar de gemeenschap goede punten over heeft en we gaan feedback nemen en dingen anders doen. ” Hij stelt echter dat de bredere cryptogemeenschap uiteindelijk zal profiteren van het werk van OpenAI. “Het echte netto-effect is zeer waardevol voor het ecosysteem”, zegt Brockmann. “Uiteindelijk geloof ik dat dit soort technologieën onze economie kunnen hervormen en een betere wereld voor ons allemaal kunnen creëren.”

Codex zal zeker waarde creëren voor OpenAI en zijn investeerders. Hoewel het bedrijf in 2015 zijn leven begon als een non-profitlaboratorium, is het Overgeschakeld naar een “vastgestelde winst”-model In 2019 om externe financiering aan te trekken, en hoewel Codex aanvankelijk werd gelanceerd als een gratis API, zal OpenAI ergens in de toekomst kosten gaan aanrekenen voor toegang.

OpenAI zegt geen eigen tools te willen bouwen met Codex, omdat het in een betere positie is om het onderliggende model te verbeteren. “We wisten dat als we een van deze zouden volgen, we een van onze andere paden zouden afsnijden”, zegt Brockmann. “Je kunt een startup kiezen om in één ding de beste te zijn. En voor ons lijdt het geen twijfel dat dit betere versies van al deze modellen maakt.”

Natuurlijk, hoewel Codex er erg opwindend uitziet, is het moeilijk om het volledige scala van zijn mogelijkheden te beoordelen voordat echte programmeurs het onder de knie krijgen. Ik ben zelf geen programmeur, maar ik heb Codex in actie gezien en heb wat ideeën over de software.

Brockman en Codex OpenAI President Wojciech Zaremba lieten me het programma online zien, waarbij hij Codex gebruikte om eerst een eenvoudige website te bouwen en daarna een rudimentair spel. In de gamedemo vond Brockman een silhouet van een persoon op Google Afbeeldingen en vroeg Codex om “deze afbeelding van een persoon van de pagina toe te voegen” voordat hij de URL plakte. Het silhouet verscheen op het scherm en vervolgens verkleinde Brockmann het (“Maak de persoon een beetje groter”) voordat het bestuurbaar werd (“Maak het nu bestuurbaar met de linker- en rechterpijltjestoetsen”).

Alles werkt zeer vlot. Het nummer begon over het scherm te draaien, maar al snel hadden we een probleem: het verdween steeds van het scherm. Om dit te stoppen, gaf Brockman de computer aanvullende instructies: “Controleer continu of de persoon van de pagina is en breng ze terug naar de pagina als dat het geval is.” Dit hield het uit het zicht, maar ik was benieuwd hoe nauwkeurig deze instructies zouden moeten zijn. Ik stelde voor om een ​​andere aanpak te proberen: “Zorg ervoor dat de persoon niet van de pagina af kan.” Dit werkte ook, maar om redenen die noch Brockman noch Zarimba kunnen verklaren, veranderde hij ook de weergave van de figuur en verpletterde deze op het scherm.

“Soms weet je niet precies wat je moet vragen”, lacht Brockman. Heeft een paar pogingen gedaan en komt dan met een commando dat werkt zonder die ongewenste verandering. “Dus je moest een beetje nadenken over wat er aan de hand is, maar niet te diep”, zegt hij.

Dat is prima in onze kleine demo, maar het zegt veel over de beperkingen van dit soort software. Het is geen magische geest die je hersenen kan lezen en elk commando in onberispelijke code kan veranderen – en OpenAI beweert dat ook niet te zijn. In plaats daarvan moet je nadenken en een beetje vallen en opstaan ​​​​om het te gebruiken. Codex zal niet-programmeurs niet van de ene op de andere dag in deskundige programmeurs veranderen, maar het is zeker intuïtiever dan welke andere programmeertaal dan ook.

OpenAI is optimistisch over het vermogen van Codex om programmeren en computergebruik in het algemeen te transformeren. Brockman zegt dat het kan helpen bij het oplossen van het tekort aan programmeurs in de Verenigde Staten, terwijl Zarimba het ziet als de volgende stap in de historische ontwikkeling van codering.

“Wat er met Codex gebeurt, is al eerder gebeurd”, zegt hij. In de begintijd van de computer werd programmeren gedaan door fysieke ponskaarten te maken die in machines moesten worden ingevoerd, waarna mensen de eerste programmeertalen uitvonden en deze gingen verfijnen. “Deze programmeertalen beginnen op Engels te lijken, met woordenschat als ‘print’ of ‘exit’ zodat meer mensen kunnen programmeren.” Het volgende deel van dit pad is om helemaal af te komen van gespecialiseerde programmeertalen en deze te vervangen door Engelse commando’s.

“Elk van deze fasen vertegenwoordigt de programmeertalen die steeds hoger worden”, zegt Zaremba. “En we denken dat Codex computers dichter bij de mens brengt, waardoor ze Engels kunnen spreken in plaats van machinecode.” Codex zelf kan meer dan een dozijn codeertalen spreken, waaronder JavaScript, Go, Perl, PHP, Ruby, Swift en TypeScript. Het is echter het meest efficiënt in Python.

Codex heeft ook de mogelijkheid om andere programma’s te besturen. In een demo laat Brockman zien hoe met de software een audio-interface voor Microsoft Word kan worden gemaakt. Omdat Word zijn eigen API heeft, kan Codex code invoeren die is gegenereerd op basis van gesproken opdrachten van een gebruiker. Brockman kopieert een gedicht naar een Word-document en vertelt Word (via Codex) om eerst alle streepjes te verwijderen, dan de regels te nummeren, dan de frequentie van bepaalde woorden te tellen, enz. Het is erg flexibel, hoewel het moeilijk te zeggen is hoe goed het werkt buiten de grenzen van een vooraf afgesproken demo.

Indien succesvol, kan Codex niet alleen programmeurs helpen, maar een nieuwe interface worden tussen gebruikers en computers. OpenAI zegt dat het het vermogen van Codex heeft getest om niet alleen Word te besturen, maar ook andere programma’s zoals Spotify en Google Agenda. En hoewel de Word-demo slechts een proof of concept is, zegt Brockmann, lijkt Microsoft al geïnteresseerd in het verkennen van de mogelijkheden van het programma. “Ze zijn erg enthousiast over het model in het algemeen en verwachten de creatie van veel Codex-applicaties”, zegt hij.