Midjourney – Fantastische beelden van de werkelijkheid
Midjourney is een text-to-image programma voor AI (Artificial Intelligence) dat is gemaakt door het onafhankelijke onderzoekslaboratorium Midjourney, Inc in San Francisco. Midjourney genereert afbeeldingen op basis van beschrijvingen in natuurlijke taal, “prompt” genaamd, vergelijkbaar met OpenAI’s DALL-E en Stable Diffusion.
Nieuwe Midjourney 5.2 feature: Zoom Out
Midjourney 5.2 is uit. Dat op zich is al een aankondiging waard, hoewel ze hier zelf vrijwel geen aandacht aan gegeven hebben. Maar het allervetste van deze update is dat je je afbeeldingen nu kunt uitzoomen als je ze gegenereerd hebt. Alsof je achteruit loopt, weg van het object. De omgeving wordt er dan bijgemaakt, net zoals de “Generative fill” functionaliteit van Adobe Firefly.
Zo werkt “Zoom Out”
- Je begint met je basis afbeelding. Dat wordt je middelpunt.
- Met de “Zoom Out” button neem je als het ware 2 stappen terug. De afbeelding die je dan nog niet kon zien wordt erbij gegenereert.
- Je kunt met de “Zoom Out” button steeds verder uit blijven zoomen, zover als je wilt.
- Wat een gamechanger is, is dat je met “Custom Zoom” ook de prompt kunt blijven veranderen. Hierdoor verander je de omgeving waar je originele afbeelding in stond.
Dit is een blog van Matt Wolfe, één van mijn favoriete AI-vloggers:
Ik ga hier in de komende dagen absoluut mee aan de slag om weer nieuwe stoere afbeeldingen te genereren voor mijn klanten.
Wil je op de hoogte blijven, volg me dan persoonlijk op LinkedIn, of volg mijn hashtag “stoereai“.
Laatste update: 27-06-2023
Dit blog is een Work In Progress (WIP). Alles wat hieronder staat is gebaseerd op de huidige stand der dingen! Dit kan radicaal veranderen en morgen kan de AI-wereld er helemaal anders uitzien. Ik pas dit blog regelmatig aan, zodat jullie altijd de meest actuele informatie krijgen en er je voordeel uit kunnen halen. Kom dus regelmatig terug om te zien wat er nieuw en veranderd is.Inhoudsopgave
- Wat kun je met Midjourney?
- Doorontwikkeling in kwaliteit
- Wat kost Midjourney
- Midjourney account aanmaken
- Prompts correct gebruiken
- Prompt structuur
- Basisparameters
- Hoe zit het met copyrights?
- Praktijkervaringen
- Nieuwe “beroepsgroepen”?
- Mijn mening
Dit is een long-read, want het is een complex thema dat je moet begrijpen om de voordelen voor jou in te kunnen schatten. Om de pijn wat te verlichten begin ik met een rustgevende afbeelding die ik zelf in Midjourney gemaakt heb.
Wat kun je met Midjourney?
Met Midjourney kun je hele mooie afbeeldingen maken van alles wat je je kunt voorstellen. Je kunt alles combineren, van kunstenaars, tot stijlen, vormen, etc. Echt alles wat je je kunt voorstellen.
Door de training van de dataset heeft Midjourney een eigen “stijl”. Je herkent de beelden direct die met deze AI-tool gemaakt zijn, door de fantastierijke, futuristiche en vaak dystopische uitstraling.
Doorontwikkeling in kwaliteit
Met elke update wordt Midjourney beter. Feitelijk is geen enkele afbeelding hetzelfde. Dezelfde prompt op twee verschillende momenten of dagen geeft een ander resultaat Hier zie je het verschil van dezelfde prompt in 2023 en 2025:
Prompt: beautiful evening landscape with islands flying in the sky, in the style of the movie Avatar, fantasy, photorealistic, intricate detail, cinematic lighting, 8k, –ar 3:2 –s 250 – Upscaled
2023
2025
Je kunt Midjourney ook afbeeldingen laten maken op basis van je eigen beeldmateriaal, bijvoorbeeld een foto van jezelf. Hieronder zie de interpretaties die Midjourney maakt van mijn avatar. 🤩
Voordelen
- Je kunt als designer met je klant concepten creëren en nieuwe richtingen voor de beeldtaal ontwikkelen.
- Voor bepaalde afbeeldingen is Midjourney perfect, denk bijvoorbeeld aan landschappen, muziek covers (platenhoezen), generieke sfeerbeelden voor een blog, etc.
Nadelen
- De techniek vind ik nog niet zo ver dat het goed genoeg is om commercieel te gebruiken voor onze opdrachten. Er zitten vaak nog oneffenheden of fouten in (zoals het aantal vingers) waardoor de gemiddelde stockfoto nog nét beter is.
- Prompt engineering is vaak heel moeilijk. Het beste werkt als je de prompt in het Engels maakt, maar dan nog moet je bepaalde begrippen, stijlen, codes en parameters gebruiken om je afbeelding zo te krijgen zoals je die voor ogen hebt. Ongeveer.
- Hoewel versie 5 afbeeldingen nu twee keer zo grote afbeeldingen maakt, zijn ze toch nog te klein om op echt groot formaat te gebruiken. Er zijn wel AI tools om een afbeelding te “upscalen”, maar wat er niet inzit kun je er ook niet altijd uithalen.
- Door de heel eigen stijl van Midjourney zien je afbeeldingen er net zo uit als alle andere die je in het internet vindt. Je moet extreem veel moeite doen om van de standaard look-and-feel af te wijken.
Wat kost Midjourney
Er is een gratis proefperiode die je kunt gebruiken door een account aan te maken zoals hierboven beschreven. Je bent dan beperkt in je mogelijkheden. Je mag maar 0,4 uur snelle GPU-tijd gebruiken, 3 prompts tegelijkertijd renderen en 10 prompts in de wachtrij zetten.
Betaalde accounts kosten $10, $30, $60 of $120 per maand en daarmee kun je je eigen ‘Midjourney server’ aanmaken. Dan heb je je eigen omgeving waarin je de afbeeldingen maakt en heb je niks te doen met de andere gebruikers. Voor wie serieus met Midjourney wil werken is een betaald account onmisbaar.
Midjourney account aanmaken
Het gebruik van Midjourney is voor de meeste mensen echt een uitdaging. Zelf een accountje aanmaken en mooie afbeeldingen maken is niet zo gemakkelijk als het klinkt. Dit moet je doen om Midjourney te kunnen gebruiken:
- Ga naar de Midjourney website en log in of maak een account aan door op ‘Sign up’ te klikken.
- Maak een account aan bij Discord. Discord is een nerd-app die de zelfs ik moeilijk vind om mee te werken. De meeste mensen zal dit afschrikken.
- Log in bij Discord.
- Selecteer één van de newbie-bots aan de linkerkant.
- Type ‘/imagine‘ en voer je prompt in om afbeeldingen te creëren. Je afbeelding verschijnt dan in de tijdlijn tussen alle honderdduizend andere gebruikers van dat newbie-kanaal.
Prompts correct gebruiken
Met Midjourney kan iedereen ineens mooie beelden maken met geschreven woorden. Niet door deze zelf te tekenen of schilderen, maar gewoon door een afbeelding te beschrijven. Dit doe je met de zogenaamde “prompts“. Mensen die effectieve prompts kunnen maken heten “prompt engineers“. Vermoedelijk een nieuwe beroepsbeschrijving…
Dit klinkt heel eenvoudig, maar niets is minder waar. Je moet hele goede prompts schrijven als je een goede image output wilt creëren. De opbouw en achterliggende techniek van de prompts is erg complex. Zo werkt het:
Prompt structuur
Een basisprompt kan zo simpel zijn als een enkel woord, zin of emoji. Geavanceerde prompts kunnen één of meer afbeeldings-URL’s, meerdere tekstzinnen en één of meer parameters bevatten. Dit is de geavanceerde prompt structuur. De ‘Text Prompt’ is de basis structuur:
- Image prompt: Afbeeldings-URL’s kunnen worden toegevoegd om de stijl en inhoud van het eindresultaat te beïnvloeden. Afbeeldings-URL’s staan altijd vooraan in een prompt.
- Tekst prompt: De tekstbeschrijving van de afbeelding die je wilt genereren. Goed geschreven aanwijzingen helpen bij het genereren van geweldige afbeeldingen. Belangrijk daarbij zijn het onderwerp, medium, belichting, kleur, stemming, grammatica, compositie, etc.
- Parameters: Parameters veranderen de manier waarop een afbeelding wordt gegenereerd. Ze kunnen beeldverhoudingen, modellen, upscalers en nog veel meer veranderen. Parameters komen aan het einde van de prompt.
Stoere tip: Laat ChatGPT je prompt schrijven
Je kunt ChatGPT een goede prompt laten schrijven, gebaseerd op jouw wensen. Je beschrijft wat je in de prompt opgenomen wilt hebben en ChatGPT bouwt een goed werkende prompt voor je.Basisparameters
De parameters bepalen een heel groot deel van de afbeelding die Midjourney gaat maken. Deze parameters kun je in je prompts gebruiken:
––version
Midjourney introduceert regelmatig nieuwe modelversies om de coherentie, efficiëntie, kwaliteit en stijl te verbeteren. Je kunt modelversies wisselen met de parameter ‘––version’ of ‘––v’. Verschillende modellen blinken uit in het produceren van verschillende typen afbeeldingen.
Switch tussen de verschillende modelversies met deze parameter:
- ‘––version’ accepteert de volgende waarden 1, 2, 3, 4, 5, 5.0, 5.1, 5.2, 6, en 6.1.
- ‘––version’ kan afgekort worden als ‘––v’
Parameter voorbeeld: ––version 6.1
Alternatief kun je ook het Discord Settings Command gebruiken. Typ ‘/settings’ en selecteer de voorkeursversie uit de keuzelijst.
–style
De parameter ‘––style’ vervangt de standaardesthetiek van sommige Midjourney modelversies.
‘––style raw’ gebruikt bijvoorbeeld een alternatief model dat goed kan werken voor gebruikers die al vertrouwd zijn met prompting en meer controle willen over hun afbeeldingen. Afbeeldingen die zijn gemaakt met deze style hebben minder automatische verfraaiing, wat kan resulteren in een nauwkeurigere match bij het prompten voor specifieke stijlen.
Modelversies 6, 5.2, 5.1 en Niji 6 accepteren –style raw.
Parameter voorbeeld: ‘––style raw’
––aspect
De chaos parameter verandert hoe gevarieerd de resultaten zullen zijn. Hogere waarden produceren meer ongewone en onverwachte afbeeldingen.
––chaos
De chaos parameter verandert hoe gevarieerd de resultaten zullen zijn. Hogere waarden produceren meer ongewone en onverwachte afbeeldingen.
––no
Dit is wat ze noemen de “negative prompting”. Door bijvoorbeeld ‘–no clouds’ te gebruiken zal Midjourney geen wolken in je afbeelding genereren.
––quality
Hoeveel rendering kwaliteit wil je aan je afbeelding toekennen? Dit geef je aan met ‘–q <.25, .5, 1, or 2>’. Het standaard nummer is 1. Hoe hoger de waarde, des te duurder is de rendering.
––seed
De Midjourney-bot kan een visuele ruis creëren, zoals statische televisie. Door ‘<integer between 0–4294967295>’ te gebruiken en dezelfde prompt worden vergelijkbare eindafbeeldingen geproduceerd.
––stop
Gebruik de stop parameter om een job midden in het proces te stoppen. Dit genereert een onscherpere, minder gedetaileerde afbeelding. Je gebuikt hiervoor de ‘<integer between 10–100>’ waarden.
––stylize
De Midjourney Bot is getraind om afbeeldingen te produceren die de voorkeur geven aan artistieke kleuren, compositie en vormen.
De parameter ‘––stylize of ‘––s’ beïnvloedt hoe sterk deze training wordt toegepast:
- Lage stylize-waarden produceren afbeeldingen die nauw aansluiten bij de prompt, maar minder artistiek zijn.
- Hoge stylize-waarden creëren afbeeldingen die zeer artistiek zijn, maar minder verbonden met de prompt.
De standaardwaarde van ‘––stylize’ is 100 en accepteert gehele getallen van 0 tot 1000, bij gebruik van de huidige modellen.
Parameter voorbeeld: ‘––stylize 400’ 0f ‘––s 400’
Alternatief kun je ook het Discord Settings Command gebruiken. Typ ‘/stylize’ en selecteer de voorkeur style uit de keuzelijst.
––uplight
Als je een prompt hebt gerenderd, dan kun je met de ‘U’ functie alternatieve afbeeldingen laten maken die dicht bij de oorspronkelijke afbeelding liggen. Deze zijn dan minder gedetailleerd en vloeiender.
––upbeta
De upbeta-upscaler kun je gebruiken in combinatie met de Uplight functie. De alternatieve afbeeldingen liggen dan dicht bij de oorspronkelijke afbeelding, maar hebben aanzienlijk minder details.
De fantasie van Midjourney
Een leuk experiment is om Midjourney te vragen hoe bepaalde thema’s of onderwerpen eruit zien. Bijvoorbeeld deze van het “ziektebeeld STXPB1” voor een website waar ik aan gewerkt heb. Je ziet hier heel goed dat Midjourney probeert om een realistisch beeld te maken, maar komt nog niet eens in de buurt. Het blijft te fantasierijk en is daarmee niet voor wetenschappelijke publicaties te gebruiken. Het zijn overigens wel hele stoere afbeeldingen!Deze afbeelding doet ie wel heel goed. Zeer realistisch, uiteraard gebaseerd op honderdduizenden afbeeldingen uit het internet.
Hoe zit het met copyrights?
De grote vraag is natuurlijk; mag ik de afbeeldingen die ik Midjourney laat maken professioneel gebruiken?
Alleen als je een betaald abonnement hebt, ben je vrij om je afbeeldingen op vrijwel elke gewenste manier te gebruiken. Het enige wat niet mag, is de afbeeldingen als NFT verkopen via de blockchain.
Als je een bedrijf bent dat meer dan $1.000.000 USD aan bruto-inkomsten per jaar verdient, dan moet je het Pro-abonnement aanschaffen om de afbeeldingen commercieel te gebruiken. Lees hiervoor de Terms of Service.
Onze praktijkervaringen
Met elke prompt die je uitprobeert leer je wat bij. Midjourney is fantastisch, maar je kunt heel moeilijk naar een gewenst eindresultaat sturen. Het is dus vooral veel en gericht experimenteren met een secure woordkeuze, de juiste terminologie en stijlkeuze. Dit zijn mijn praktijkervaringen waar jij als gebruiker hopelijk wat aan heb:
- Midjourney blijft altijd zijn eigen mening en saus vermengen met jouw prompt. Vraag je bijvoorbeeld om een “man die midden in een kamer staat”, dan kan het zijn dat je iemand aan een bureau in je afbeelding krijgt.
- Als je dezelfde prompt meteen drie keer achter elkaar ingeeft krijg je verschillende afbeeldingen. Je kunt dit met opzet testen om te zien wat het beste uitgangspunt is voor de finetuning.
- Verander je één klein woordje, dan is je resultaat ook anders. Hou dus goed in de gaten wát je verandert, zodat je begrijpt waar de verandering door veroorzaakt wordt.
- De prompt die je vandaag gebruikt geeft morgen een heel ander resultaat. Als je dus een “winning streak” hebt, ga dan door met prompten, want morgen ziet het er heel anders uit.
- Engelstalige prompts werken beter dan Nederlandstalige. De afbeelding hieronder kwam uit Midjourney met deze prompt: “Een prachtige groene grasvlakte, –no huis, bomen” 😳
Nieuwe “beroepsgroepen”?
Door de komst van Midjourney zijn er minstens twee nieuwe beroepsgroepen ontstaan:
- Prompt Engineer: Persoon die een goede prompt kan schrijven. Dit is niet te onderschatten, want prompting vereist veel kennis en ervaring.
- AI Artist: Persoon die zich kunstenaar noemt omdat ie afbeeldingen met Midjourney maakt. Ben je werkelijk een kunstenaar als je een AI-tool afbeeldingen laat maken?
Mijn mening
Dit is een voorlopige mening die gebaseerd is op de huidige stand der dingen:
- De afbeeldingen die Midjourney genereert zijn waanzinnig mooi. Maar omdat het zo’n sterke eigen stijl heeft zie je overal dezelfde soort afbeeldingen verschijnen. Het is nog heel moeilijk om uniek te zijn en afbeeldingen in je eigen stijl te genereren.
- Het is nu nog vrijwel onmogelijk om exact afbeeldingen te genereren, want het algoritme giet zijn eigen stijl over alles wat je ingeeft. Als je een prompt meerdere keren invoert, krijg je telkens een andere set afbeeldingen.
- Sommige mensen die met Midjourney werken noemen zich “AI artist”. Ben je nu al een kunstenaar omdat je een prompt kunt maken waardoor een AI-tool een afbeelding voor je maakt? Ik trek niet in twijfel dat het resultaat prachtig kan zijn, maar je hebt feitelijk niks zelf gemaakt.
- De copyrightvrije afbeeldingen voelt dubbel. Omdat er een “maker” is mag je die afbeeldingen gebruiken, hoewel ze gebaseerd zijn op het originele werk van échte kunstenaars.
Blijf op de hoogte van de ontwikkelingen van Midjourney
Wil je op de hoogte blijven van de ontwikkelingen van Midjourney voor de branding sector? Meld je dan aan voor onze nieuwsbrief of bezoek regelmatig deze pagina.
Aanmelden nieuwsbrief