Wstęp

Dziś napiszę o tym jak AI – sztuczna inteligencja – wspomaga mnie w tworzeniu grafiki i obrazów na mojego bloga.

Pozyskiwanie zdjęć i grafiki

Kiedyś musiałem ręcznie zdobywać zdjęcia na mojego bloga. Dzięki generowaniu obrazów przez AI, zwanym też sztuką generatywną, oszczędzam czas i pieniądze. Obecnie korzystam z “w połowie podróży” – Midjourney bot to generate stunning images from simple text prompts in seconds.

Wyszukiwanie zdjęć

Najczęściej przeszukiwałem strony oferujące darmowe i/lub płatne zdjęcia. Zajmowało mi, to sporo czasu, a znalezione zdjęcia były przymusowym kompromisem. Wybrane zdjęcia nigdy nie były nawet bliskie temu, czego oczekiwałem. Najczęściej korzystałem z Pexels – Darmowe zdjęcia z galerii, obrazy z galerii bez opłat licencyjnych i zdjęcia bez praw autorskich.

Pexels - Darmowe zdjęcia z galerii, obrazy z galerii bez opłat licencyjnych i zdjęcia bez praw autorskich - Mentor Junior Java Developer
Pexels – Darmowe zdjecia z galerii, obrazy z galerii bez oplat licencyjnych i zdjecia bez praw autorskich – Mentor Junior Java Developer

Zlecanie wykonania grafiki

Kolejnym sposobem pozyskania właściwych zdjęć było zlecanie wykonania grafiki na takich portalach, jak Fiverr – Freelance Services Marketplace. Tutaj była wolna amerykanka i ruletka, jeżeli chodzi o jakość wykonywanych usług. Pamiętam, jak w “nieskończoność” pisałem z osobą, której zlecałem stworzenie grafiki za $5. Można powiedzieć, że promptowałem osobę zamiast obecnie chatbota.

Fiverr - Freelance Services Marketplace - Mentor Junior Java Developer
Fiverr – Freelance Services Marketplace – Mentor Junior Java Developer

Generowanie grafiki z AI

Obecnie wystarczy kilka sekund na stworzenie tekstowego opisu obrazu, który chcę uzyskać, a po chwili otrzymuję wygenerowany obraz z użyciem AI. Dla mnie wystarczy kilka powtórek/iteracji, aby uzyskać obraz, który jest w 90% zgodny z moimi oczekiwaniami.

Sposób korzystania z samego narzędzia Midjourney wybiega poza zakres tego artykułu, poniżej link do oficjalnej dokumentacji.

Midjourney Quick Start Guide

Z oficjalnej dokumentacji dowiemy się jak korzystać z Midjourney oraz jak połączyć go z Discord. Źródło: https://docs.midjourney.com/docs/quick-start

Po mimo, że 90% jest zgodnych z moimi oczekiwaniami, to zdarzają się różne sytuacje, jak generowanie sześciu palców u ręki lub jak na poniższym obrazku.

Dla wygenerowanych żyraf wpisałem prompt:
/imagine giraffe on the top eiffle tower.

Niestety nie otrzymałem, tego, czego oczekiwałem. Wygląda, na to, że duży model językowy nie znalazł nigdzie w internecie grafiki z żyrafą na wieży Eiffla. Tym samym nie wiedział jak wygenerować, to o, co prosiłem.

Jak Midjourney pomaga mi generować obrazy z użyciem AI - żyrafa na wieży Eiffla, brak obrazu - Mentor Junior Java Developer
Jak Midjourney pomaga mi generowac obrazy z uzyciem AI – zyrafa na wiezy Eiffla, brak obrazu – Mentor Junior Java Developer
Jak Midjourney pomaga mi generować obrazy z użyciem AI - żyrafa na wieży Eiffla, selfie - Mentor Junior Java Developer
Jak Midjourney pomaga mi generowac obrazy z uzyciem AI – zyrafa na wiezy Eiffla, selfie – Mentor Junior Java Developer

Więcej o generowaniu obrazów za pomocą Midjourney oraz Discord napiszę w dalszej części artykułu. Na razie, poniżej praktyczny przykład użycia Midjourney.

Przykład użycia Midjourney

Generowanie obrazów – prompt /imagine

Należy zacząć od wspomnianego tekstowego opisu zwanego prompt:

/imagine two monitors desktop set

Poniżej wynik generowania obrazów, dostajemy cztery wersje, na których operujemy, działamy. Na wygenerowanie obrazu musimy chwilę poczekać.

Modyfikacja – Version, Upscale, Re-run

Za pomocą przycisków V1, V2, V3, V4 (V – version; wersja) – Image Variation – wybieramy obraz do ponownego wygenerowania na podstawie otrzymanego wyniku.

Używając przycisków U1, U2, U3, U4 (U – upscale, to increase the size; scope, or scale of (something); “powięszkenie”) – Image Selection – wybieramy “finalny” obraz, który ponownie generujemy w lepszej jakości oraz rozdzielczości.

Midjourney prompt /imagine two monitors desktop set - Mentor Junior Java Developer
Midjourney prompt /imagine two monitors desktop set – Mentor Junior Java Developer

Do “modyfikacji”, ponownego wykonania tekstowego opisu – prompt – należy użyć przycisku 🔄. UWAGA: opcja remiksowania prompt musi zostać włączona za pomocą oddzielnego polecenia. Use the /settings command and select 🎛️ Remix from the pop-up.

Poniżej wybrany obraz (U4 – Upscale) do dalszej obróbki, jak widać na zrzucie ekranu. Dostajemy dużo więcej opcji np. Vary, Zoom. Zachęcam do eksperymentowania z wygenerowaną grafiką. Wykracza, to poza treść artykułu, odsyłam do oficjalnej dokumentacji – How to Use Remix Mode with Vary (Region).

Midjourney, upscale; wybrany obraz do dalszej edycji - Mentor Junior Java Developer
Midjourney, upscale; wybrany obraz do dalszej edycji – Mentor Junior Java Developer

Wyjaśnienie pojęć

Uważam, że zawsze należy wyjaśnić pojęcia, które dotyczą nowych narzędzi oraz technologii. Bez znajomości podstawowych pojęć czujemy się jeszcze bardziej zagubieni w świecie nowych rozwiązań, niezależnie, od tego, czy, to AI, czy nowy nowy program komputerowy.

Midjourney

Midjourney to program i usługa generatywnej sztucznej inteligencji stworzona i prowadzona przez niezależne laboratorium badawcze Midjourney, Inc. z siedzibą w San Francisco. Midjourney generuje obrazy na podstawie opisów w języku naturalnym, zwanych promptami. Źródło Wikipedia: https://en.wikipedia.org/wiki/Midjourney.

Discord

Discord to komunikator internetowy i platforma społecznościowa VoIP, która umożliwia komunikację za pośrednictwem połączeń głosowych, połączeń wideo, wiadomości tekstowych oraz multimediów i plików. Źródło Wikipedia: https://en.wikipedia.org/wiki/Discord.

Dlaczego Midjourney wymaga Discord?

Na oficjalnej stronie można znaleźć informacje jak używać Discord z Midjourney oraz drobną wzmiankę, dlaczego trzeba używać takie połączenie: “The community is supportive, encouraging, and eager to share their knowledge with users just starting out.”. Źródło: Midjourney – Discord Interface.

ChatGPT zapytany o “Why midjourney uses discord?”

Odpowiada: “By leveraging Discord, Midjourney can maintain an active, engaged, and collaborative community, essential for its mission of fostering new modes of thought and creativity.”.

Co z prawami autorskimi?

Ciężko mi było znaleźć jakieś konkretne informacje odnośnie praw autorskich i/lub plagiatów związanych z wygenerowanymi obrazami za pomocą Midjourney i innych podobnych narzędzi korzystających z AI.

Can I use my images commercially?

Midjourney subscribers own all the images they’ve created, even if their subscription has expired, and they’re free to use those images however they’d like. There are two small exceptions:

– If you upscale an image of another user, that upscale is owned by the original creator, not by you. It will appear in their gallery on the website instead of yours, and you’ll need their permission to use it.
– If you are a business grossing more than $1,000,000 USD a year, you need a Pro or Mega Plan to use your images commercially for your company.

Full details can be found in the Midjourney Terms of Service, Section 4: Copyright and Trademark.

Źródło: https://help.midjourney.com/en/articles/8150363-can-i-use-my-images-commercially

OpenAI broni swoich klientów

Nie wiemy jak Midjourney, ale OpenAI broni swoich klientów. Na blogu OpenAI można przeczytać “OpenAI stara się chronić swoich klientów za pomocą wbudowanych zabezpieczeń praw autorskich w naszych systemach.”.

Copyright Shield

OpenAI is committed to protecting our customers with built-in copyright safeguards in our systems. Today, we’re going one step further and introducing Copyright Shield—we will now step in and defend our customers, and pay the costs incurred, if you face legal claims around copyright infringement. This applies to generally available features of ChatGPT Enterprise and our developer platform.

Źródło: https://openai.com/blog/new-models-and-developer-products-announced-at-devday

Podsumowanie

Dziś, ciężko mi wyobrazić sobie tworzenie grafiki bez narzędzi do generowania obrazów wspieranych przez sztuczną inteligencję. Kilkadziesiąt złotych zapłacone za Midjourney zwraca się z nawiązką z każdą wygenerowaną grafiką. Pisząc ten artykuł nauczyłem się nowych rzeczy o Midjourney. Zachęcam do nieustannej nauki nowych technologii, które mogą zautomatyzować, ułatwić naszą pracę.