Midjourney- Fantastische beelden van de werkelijkheid
Midjourney is een text-to-image programma voor Artificial Intelligence dat is gemaakt door het onafhankelijke onderzoekslaboratorium Midjourney, Inc in San Francisco. Midjourney genereert afbeeldingen op basis van beschrijvingen in natuurlijke taal, “prompt” genaamd, vergelijkbaar met OpenAI’s DALL-E en Stable Diffusion.
Nieuwe Midjourney 5.2 feature: Zoom Out
Midjourney 5.2 is uit. Dat op zich is al een aankondiging waard, hoewel ze hier zelf vrijwel geen aandacht aan gegeven hebben. Maar het allervetste van deze update is dat je je afbeeldingen nu kunt uitzoomen als je ze gegenereerd hebt. Alsof je achteruit loopt, weg van het object. De omgeving wordt er dan bijgemaakt, net zoals de “Generative fill” functionaliteit van Adobe Firefly.
Zo werkt “Zoom Out”
- Je begint met je basis afbeelding. Dat wordt je middelpunt.
- Met de “Zoom Out” button neem je als het ware 2 stappen terug. De afbeelding die je dan nog niet kon zien wordt erbij gegenereert.
- Je kunt met de “Zoom Out” button steeds verder uit blijven zoomen, zover als je wilt.
- Wat een gamechanger is, is dat je met “Custom Zoom” ook de prompt kunt blijven veranderen. Hierdoor verander je de omgeving waar je originele afbeelding in stond.
Dit is een blog van Matt Wolfe, één van mijn favoriete AI-vloggers:
Ik ga hier in de komende dagen absoluut mee aan de slag om weer nieuwe stoere afbeeldingen te genereren voor mijn klanten.
Wil je op de hoogte blijven, volg me dan persoonlijk op LinkedIn, of volg mijn hashtag “stoereai“.
Laatste update: 27-06-2023
Dit blog is een Work In Progress (WIP). Alles wat hieronder staat is gebaseerd op de huidige stand der dingen! Dit kan radicaal veranderen en morgen kan de AI-wereld er helemaal anders uitzien. Ik pas dit blog regelmatig aan, zodat jullie altijd de meest actuele informatie krijgen en er je voordeel uit kunnen halen. Kom dus regelmatig terug om te zien wat er nieuw en veranderd is.Inhoudsopgave van dit blog
- Wat kun je met Midjourney?
- Wat kost Midjourney
- Midjourney account aanmaken
- Prompts correct gebruiken
- Prompt structuur
- Basisparameters
- Hoe zit het met copyrights?
- Praktijkervaringen
- Mijn mening
Dit is een long-read, want het is een complex thema dat je moet begrijpen om de voordelen voor jou in te kunnen schatten. Om de pijn wat te verlichten begin ik met een rustgevende afbeelding die ik zelf in Midjourney gemaakt heb.
Wat kun je met Midjourney?
Met Midjourney kun je hele mooie afbeeldingen maken van alles wat je je kunt voorstellen. Je kunt alles combineren, van kunstenaars, tot stijlen, vormen, etc. Echt alles wat je je kunt voorstellen.
Door de training van de dataset heeft Midjourney een eigen “stijl”. Je herkent de beelden direct die met deze AI-tool gemaakt zijn, door de fantastierijke, futuristiche en vaak dystopische uitstraling.
Voordelen
- Je kunt als designer met je klant concepten creëren en nieuwe richtingen voor de beeldtaal ontwikkelen.
- Voor bepaalde afbeeldingen is Midjourney perfect, denk bijvoorbeeld aan landschappen, muziek covers (platenhoezen), generieke sfeerbeelden voor een blog, etc.
Nadelen
- De techniek ik nog niet zo ver dat het goed genoeg is om commercieel te gebruiken, vind ik zelf. Er zitten vaak nog oneffenheden of fouten in (zoals het aantal vingers) waardoor de gemiddelde stockfoto nog nét beter is.
- Hoewel versie 5 afbeeldingen nu twee keer zo grote afbeeldingen maakt, zijn ze toch nog te klein om op echt groot formaat te gebruiken. Er zijn wel AI tools om een afbeelding te “upscalen”, maar wat er niet inzit kun je er ook niet uithalen.
- Door de heel eigen stijl van Midjourney zien je afbeeldingen er net zo uit als alle andere die je in het internet vindt.
Wat kost Midjourney
Er is een gratis proefperiode die je kunt gebruiken door een account aan te maken zoals hierboven beschreven. Je bent dan beperkt in je mogelijkheden. Je mag maar 0,4 uur snelle GPU-tijd gebruiken, 3 prompts tegelijkertijd renderen en 10 prompts in de wachtrij zetten.
Betaalde accounts kosten € 10, € 30 of € 60 per maand en daarmee kun je je eigen ‘Midjourney server’ aanmaken. Dan heb je je eigen omgeving waarin je de afbeeldingen maakt en heb je niks te doen met de andere gebruikers. Voor wie serieus met Midjourney wil werken is een betaald account onmisbaar.
Midjourney account aanmaken
Het gebruik van Midjourney is voor de meeste mensen echt een uitdaging. Zelf een accountje aanmaken en mooie afbeeldingen maken is niet zo gemakkelijk als het klinkt. Dit moet je doen om Midjourney te kunnen gebruiken:
- Ga naar de Midjourney website en maak een account aan door op ‘Join the beta’ te klikken.
- Maak een account aan bij Discord. Discord is een nerd-app die de zelfs ik moeilijk vind om mee te werken. De meeste mensen zal dit afschrikken.
- Log in bij Discord.
- Selecteer één van de newbie-bots aan de linkerkant.
- Type ‘/imagine‘ en voer je prompt in om afbeeldingen te creëren. Je afbeelding verschijnt dan in de tijdlijn tussen alle honderdduizend andere gebruikers van dat newbie-kanaal.
Prompts correct gebruiken
Met Midjourney kan iedereen ineens mooie beelden maken met geschreven woorden. Niet door het zelf te tekenen of schilderen, maar gewoon door een afbeelding te beschrijven. Dit doe je met de zogenaamde “prompts”.
Dit klinkt heel eenvoudig, maar niets is minder waar. Je moet hele goede prompts schrijven als je een goede image output wilt creëren. De opbouw en achterliggende techniek van de prompts is erg complex. Zo werkt het:
Prompt structuur
Een basisprompt kan zo simpel zijn als een enkel woord, zin of emoji. Geavanceerde prompts kunnen één of meer afbeeldings-URL’s, meerdere tekstzinnen en één of meer parameters bevatten. Dit is de basis structuur:
- Image prompt: Afbeeldings-URL’s kunnen worden toegevoegd om de stijl en inhoud van het eindresultaat te beïnvloeden. Afbeeldings-URL’s staan altijd vooraan in een prompt.
- Tekst prompt: De tekstbeschrijving van de afbeelding die je wilt genereren. Goed geschreven aanwijzingen helpen bij het genereren van geweldige afbeeldingen. Belangrijk daarbij zijn het onderwerp, medium, belichting, kleur, stemming, grammatica, compositie, etc.
- Parameters: Parameters veranderen de manier waarop een afbeelding wordt gegenereerd. Ze kunnen beeldverhoudingen, modellen, upscalers en nog veel meer veranderen. Parameters komen aan het einde van de prompt.
Stoere tip: Laat ChatGPT je prompt schrijven
Je kunt ChatGPT een goede prompt laten schrijven, gebaseerd op jouw wensen. Je beschrijft wat je in de prompt opgenomen wilt hebben en ChatGPT bouwt een goed werkende prompt voor je.Basisparameters
De parameters bepalen een heel groot deel van de afbeelding die Midjourney gaat maken. Deze parameters kun je in je prompts gebruiken:
––aspect
De chaos parameter verandert hoe gevarieerd de resultaten zullen zijn. Hogere waarden produceren meer ongewone en onverwachte afbeeldingen.
––chaos
De chaos parameter verandert hoe gevarieerd de resultaten zullen zijn. Hogere waarden produceren meer ongewone en onverwachte afbeeldingen.
––no
Dit is wat ze noemen de “negative prompting”. Door bijvoorbeeld ‘–no clouds’ te gebruiken zal Midjourney geen wolken in je afbeelding genereren.
––quality
Hoeveel rendering kwaliteit wil je aan je afbeelding toekennen? Dit geef je aan met ‘–q <.25, .5, 1, or 2>’. Het standaard nummer is 1. Hoe hoger de waarde, des te duurder is de rendering.
––seed
De Midjourney-bot kan een visuele ruis creëren, zoals statische televisie. Door ‘<integer between 0–4294967295>’ te gebruiken en dezelfde prompt worden vergelijkbare eindafbeeldingen geproduceerd.
––stop
Gebruik de stop parameter om een job midden in het proces te stoppen. Dit genereert een onscherpere, minder gedetaileerde afbeelding. Je gebuikt hiervoor de ‘<integer between 10–100>’ waarden.
––style
Switch tussen de verschillende Model Versie 4 stijlen met de ‘<4a, 4b or 4c>’ parameter.
––stylize
De stijl parameter beïnvloed hoe sterk de standaard esthetische stijl toegepast wordt. Gebruik hiervoor de ‘–s <number>’ parameter.
––uplight
Als je een prompt hebt gerenderd, dan kun je met de ‘U’ functie alternatieve afbeeldingen laten maken die dicht bij de oorspronkelijke afbeelding liggen. Deze zijn dan minder gedetailleerd en vloeiender.
––upbeta
De upbeta-upscaler kun je gebruiken in combinatie met de Uplight functie. De alternatieve afbeeldingen liggen dan dicht bij de oorspronkelijke afbeelding, maar hebben aanzienlijk minder details.
De fantasie van Midjourney
Een leuk experiment is om Midjourney te vragen hoe bepaalde thema’s of onderwerpen eruit zien. Bijvoorbeeld deze van het ziektebeeld STXPB1 voor een website die ik momenteel aan het maken ben. Je ziet hier heel goed dat Midjourney probeert om een realistisch beeld te maken, maar komt nog niet eens in de buurt. Het blijft te fantasierijk en is daarmee niet voor een wetenschappelijke publicatie te gebruiken.Deze afbeelding doet ie wel heel goed. Zeer realistisch, uiteraard gebaseerd op honderdduizenden afbeeldingen uit het internet.
Hoe zit het met copyrights?
De grote vraag is natuurlijk; mag ik de afbeeldingen die ik Midjourney laat maken professioneel gebruiken?
Alleen als je een betaald abonnement hebt, ben je vrij om je afbeeldingen op vrijwel elke gewenste manier te gebruiken. Het enige wat niet mag, is de afbeeldingen als NFT verkopen via de blockchain.
Als je een bedrijf bent dat meer dan $1.000.000 USD aan bruto-inkomsten per jaar verdient, dan moet je het Pro-abonnement aanschaffen om de afbeeldingen commercieel te gebruiken. Lees hiervoor de Terms of Service.
Praktijkervaringen
Met elke prompt die je uitprobeert leer je wat bij. Midjourney is fantastisch, maar je kunt heel moeilijk naar een gewenst eindresultaat sturen. Het is dus vooral veel en gericht experimenteren met een secure woordkeuze, de juiste terminologie en stijlkeuze. Dit zijn mijn praktijkervaringen waar jij als gebruiker hopelijk wat aan heb:
- Midjourney blijft altijd zijn eigen mening en saus vermengen met jouw prompt. Vraag je bijvoorbeeld om een “man die midden in een kamer staat”, dan kan het zijn dat je iemand aan een bureau in je afbeelding krijgt.
- Als je dezelfde prompt meteen drie keer achter elkaar ingeeft krijg je verschillende afbeeldingen. Je kunt dit met opzet testen om te zien wat het beste uitgangspunt is voor de finetuning.
- Verander je één klein woordje, dan is je resultaat ook anders. Hou dus goed in de gaten wát je verandert, zodat je begrijpt waar de verandering door veroorzaakt wordt.
- De prompt die je vandaag gebruikt geeft morgen een heel ander resultaat. Als je dus een “winning streak” hebt, ga dan door met prompten, want morgen ziet het er heel anders uit.
- Engelstalige prompts werken beter dan Nederlandstalige. De afbeelding hieronder kwam uit Midjourney met deze prompt: “Een prachtige groene grasvlakte, –no huis, bomen” 😳
Mijn mening
Dit is een voorlopige mening die gebaseerd is op de huidige stand der dingen:
- De afbeeldingen die Midjourney genereert zijn waanzinnig mooi. Maar omdat het zo’n sterke eigen stijl heeft zie je overal dezelfde soort afbeeldingen verschijnen. Het is nog heel moeilijk om uniek te zijn en afbeeldingen in je eigen stijl te genereren.
- Het is nu nog vrijwel onmogelijk om exact afbeeldingen te genereren, want het algoritme giet zijn eigen stijl over alles wat je ingeeft. Als je een prompt meerdere keren invoert, krijg je telkens een andere set afbeeldingen.
- Sommige mensen die met Midjourney werken noemen zich “AI artist”. Ben je nu al een kunstenaar omdat je een prompt kunt maken waardoor een AI-tool een afbeelding voor je maakt?
- De copyrightvrije afbeeldingen voelt dubbel. Omdat er een “maker” is mag je die afbeeldingen gebruiken, hoewel ze gebaseerd zijn op het originele werk van échte kunstenaars.
Blijf op de hoogte van de ontwikkelingen van Midjourney
Wil je op de hoogte blijven van de ontwikkelingen van Midjourney voor de branding sector? Meld je dan aan voor onze nieuwsbrief of bezoek regelmatig deze pagina.
Aanmelden nieuwsbrief