October 3, 2024

Met OpenAI kan iedereen zijn nieuwe stemassistent gebruiken in apps van derden: BNN Bloomberg

(Bloomberg) — OpenAI stelt bedrijven en ontwikkelaars in staat hun realtime stemassistent in hun eigen apps in te sluiten, waardoor de weg wordt vrijgemaakt voor meer gebruikers om realistisch klinkende gesproken gesprekken te voeren met het AI-systeem voor een breed scala aan taken.

De functie, die lijkt op de nieuwste stemassistent die beschikbaar is voor Chatbot ChatGPT-gebruikers, zal naar verwachting dinsdag beschikbaar zijn voor degenen die apps en services bouwen met behulp van de OpenAI application programming interface of API. OpenAI zei dat bedrijven software kunnen ontwikkelen zoals een spraakgebaseerde klantenservicebot of een reisapp die namens een gebruiker belt. Sommige bedrijven hebben de nieuwe spraakmogelijkheden al getest, waaronder de app Healthify voor gezondheidscoaching en de app voor het leren van talen Speak. De spraakintegratie van derden is een van een aantal updates die OpenAI dinsdag aankondigt tijdens een ontwikkelaarsevenement in San Francisco. De conferentie biedt OpenAI de mogelijkheid om te laten zien hoe het van plan is de steeds drukker wordende markt voor AI-software voor te blijven terwijl het een grote financieringsronde lijkt af te sluiten. Het komt ook dagen nadat verschillende leiders, waaronder Chief Technology Officer Mira Moratti, aankondigden dat ze van plan waren de startup te verlaten – de laatste in een reeks hooggeplaatste werknemers die de afgelopen maanden zijn vertrokken. Terwijl OpenAI afgelopen november op zijn allereerste ontwikkelaarsconferentie een nieuw AI-model onthulde, zei het bedrijf dat dit dit jaar niet zou gebeuren. In plaats daarvan concentreert OpenAI zich op het demonstreren van de mogelijkheden van de nieuwe API en het ontmoeten van enkele van de 3 miljoen ontwikkelaars die met de software werken in verschillende delen van de wereld. Het evenement van dinsdag zal de eerste van drie evenementen zijn, terwijl andere evenementen zullen plaatsvinden in Londen en Singapore. Op een persconferentie voorafgaand aan het evenement demonstreerden OpenAI-medewerkers de nieuwe audiofunctie met behulp van een fictieve reisapp. Romain Huet, hoofd ontwikkelaarservaring bij OpenAI, liet de nep-app contact opnemen met een nepbedrijf, Ilan's Strawberry, en 400 met chocolade bedekte bessen bestellen, terwijl het budget onder de $ 1.500 bleef. Onmiddellijk belde de app – een functie die mogelijk werd gemaakt, zo werd uitgelegd, door het gebruik van een API van cloudcommunicatiebedrijf Twilio Inc. – Naast Huet ging een telefoon. Huet pikte zijn stem op, deed alsof hij een aardbeienhandelaar was en kreeg een commando van de stemassistent. De aardbeien zullen ongeveer $1.200 kosten, zei hij.

De stem die in de demo werd gebruikt, identificeerde zichzelf niet als een AI-stemassistent, wat sommige gebruikers, maar ook voorstanders van privacy en digitale rechten, zou kunnen verontrusten als deze op daadwerkelijke apps zou worden toegepast. OpenAI zei na de demo dat het niet vereist dat ontwikkelaars gebruikers op een specifieke manier informeren wanneer ze met AI omgaan. Maar het bedrijf merkte op dat overheidsontwikkelaars in hun gebruiksbeleid gebruikers over het algemeen moeten vertellen wanneer ze AI gebruiken, tenzij dit duidelijk wordt via het type uitwisseling.

“Er bestaat geen strikte richtlijn voor hoe je dit moet doen”, zegt Olivier Godment, productleider bij OpenAI's API. “We willen er gewoon zeker van zijn dat het duidelijk is voor de gebruiker.”

OpenAI plaagde in mei voor het eerst de realtime audiofunctie voor ChatGPT, waarmee werd gedemonstreerd hoe het snel kan reageren op gebruikers als reactie op schriftelijke en visuele aanwijzingen. Maar de maand daarop stelde OpenAI de lancering van de optie uit om aan potentiële veiligheidsproblemen te werken. Na de vertraging zei OpenAI dat het product de manier waarop anderen spreken niet zou kunnen nabootsen. Het bedrijf zei ook dat het nieuwe filters heeft toegevoegd om ervoor te zorgen dat de software sommige verzoeken om muziek of andere vormen van auteursrechtelijk beschermde audio te maken kan detecteren en afwijzen.

In juli bood OpenAI de functie aan een beperkt aantal ChatGPT Plus-klanten aan. Vorige maand begon de startup het uit te rollen naar alle betalende ChatGPT-gebruikers.

©2024 Bloomberg L.P