May 8, 2024

Technologiebedrijven proberen AI-beeldgeneratoren populair te maken en tegelijkertijd betere bescherming tegen misbruik te bieden

Technologiebedrijven proberen AI-beeldgeneratoren populair te maken en tegelijkertijd betere bescherming tegen misbruik te bieden




Matt O’Brien, de Associated Press

Gepubliceerd donderdag 21 september 2023 om 21:06 EST


Hulpmiddelen voor kunstmatige intelligentie die via schriftelijke opdrachten bizarre kunstwerken of realistisch ogende beelden kunnen oproepen, begonnen het publiek vorig jaar te verbazen. Maar de meeste mensen gebruiken ze niet echt op het werk of thuis.

Dat zou kunnen veranderen als toonaangevende technologiebedrijven concurreren om tekst-naar-afbeelding-generatoren populair te maken door ze te integreren in Adobe Photoshop, YouTube en andere bekende tools.

Maar eerst proberen ze gebruikers en toezichthouders ervan te overtuigen dat ze een deel van het Wilde Westen-karakter van vroege AI-beeldgeneratoren hebben getemd met sterkere waarborgen tegen diefstal van auteursrechten en verontrustende inhoud.

Een jaar geleden begon een relatief kleine groep early adopters en hobbyisten te spelen met geavanceerde beeldgeneratoren zoals Stable Diffusion, Midjourney en DALL-E van OpenAI.

“Ervaringen uit het verleden waren interessant”, zegt David Trugue, analist bij marktonderzoeksgroep Forrester, maar bedrijven zijn voorzichtig geweest.

Er volgde een terugslag, waaronder rechtszaken over auteursrechten van kunstenaars en het fotobedrijf Getty, en er werd opgeroepen tot nieuwe wetten om het misbruik van AI-technologie om misleidende politieke advertenties of aanstootgevende seksuele afbeeldingen te maken aan banden te leggen.

Die problemen zijn nog niet opgelost. Maar de wildgroei aan nieuwe beeldgeneratoren zegt dat ze er deze keer klaar voor zijn.

“Alexa, maak een foto van kersenbloesems in de sneeuw”, is het type prompt waarmee Amazon zegt dat Amerikaanse klanten later dit jaar kunnen praten om een ​​persoonlijke weergave op hun Fire TV-scherm te creëren.

Adobe, ruim dertig jaar geleden vooral bekend om zijn grafische editor in Photoshop, was dit jaar het eerste bedrijf dat een AI-generator lanceerde die is ontworpen om de juridische en ethische problemen te vermijden die worden veroorzaakt door concurrenten die hun AI-modellen hebben getraind op enorme verzamelingen afbeeldingen die uit de computer zijn gehaald. Internet. .

“Als we met klanten over generatieve technologie praten, horen we vaak dat veel van de technologie echt cool is, maar dat ze het gevoel hebben dat ze deze vanwege deze vragen niet kunnen gebruiken”, vertelde de Chief Technology Officer van Adobe aan digitale media. Zaken, Eli Greenfield.

Dat is de reden waarom Adobe’s product, Firefly genaamd, is gemaakt op basis van de eigen verzameling Adobe Stock-afbeeldingen en gelicentieerde inhoud. Aandeelhouders ontvangen ook enige compensatie uit de regeling, aldus Greenfield.

“Adobe Firefly is juridisch schoon, terwijl andere dat niet zijn”, zegt Truog van Forrester. “Daar maak je je niet echt druk om als je gewoon iemand bent die van generatieve AI houdt.”

Maar als u een bedrijfseigenaar of creatieve professional bent en overweegt om afbeeldingen op uw website, in apps, in gedrukte lay-outs, advertenties of e-mailmarketingcampagnes te gebruiken, “is dat nogal een probleem”, zegt Trueg. ‘Je wilt niet in de problemen komen.’

Sommige concurrenten merken dit op. OpenAI, de maker van ChatGPT, onthulde woensdag zijn derde generatie DALL-E 3-beeldgenerator, waarbij de nadruk werd gelegd op de indrukwekkende mogelijkheden en toekomstige integratie met ChatGPT, samen met nieuwe garanties om verzoeken af ​​te wijzen waarin om een ​​live artist-style afbeelding wordt gevraagd. Makers kunnen er ook voor kiezen om hun afbeeldingen uit te sluiten van het trainen van toekomstige modellen, hoewel Truog erop wijst dat OpenAI niets heeft gezegd “over het compenseren van auteurs die hun werk gebruiken voor training, zelfs niet met toestemming.”

Tijdens afzonderlijke showcase-evenementen in New York City op donderdag onthulden Microsoft en YouTube, eigendom van Google, ook nieuwe producten die zijn doordrenkt met het maken van kunstmatige intelligentie-afbeeldingen.

Microsoft, een grote investeerder in OpenAI, liet zien hoe het al begonnen is met het integreren van DALL-E 3 in zijn grafische ontwerptools, voornamelijk voor achtergrondbewerking, evenals in de Bing-zoekmachine en chatbot. YouTube heeft een nieuw droomscherm voor korte YouTube-video’s onthuld waarmee makers een nieuwe achtergrond naar keuze kunnen creëren.

Eerder deze maand sloten Adobe en Stable AI, de maker van Stable Diffusion, zich aan bij een grotere groep grote AI-aanbieders, waaronder Amazon, Google, Microsoft en OpenAI, die instemden met vrijwillige waarborgen die waren ingevoerd door de regering van president Joe Biden.

Eén waarborg vereist dat bedrijven methoden zoals digitale watermerken ontwikkelen om mensen te helpen weten of afbeeldingen en andere inhoud door kunstmatige intelligentie zijn gemaakt.

Leidinggevenden van Microsoft zeiden dat het bedrijf filters heeft gebouwd om de soorten afbeeldingen te identificeren die kunnen worden gegenereerd op basis van tekstprompts in Bing, waarbij ze de afbeeldingen aanhalen die zijn gemaakt met prominente politieke figuren als inhoud om te controleren.

Het doel is “ervoor te zorgen dat het niet de soorten inhoud produceert die we nooit zouden willen produceren, zoals haatinhoud”, zegt Sarah Bird, Global Head of Responsible AI bij Microsoft.

In een demonstratie voor een verslaggever van Associated Press werd donderdag een verzoek van Microsoft’s nieuwe tool voor een foto van “Hillary Clinton rotsklimmen” afgewezen.

‘Oeps!’ ‘Probeer nog een prompt’, was het antwoord. ‘Het lijkt erop dat er op dit moment enkele woorden automatisch worden geblokkeerd.’

AP Business Schrijvers Cora Lewis en Hallelujah Hadero hebben bijgedragen aan dit rapport.