Bild: Stable Diffusion, lokale Installation, mit Automatic1111 sowie InvokeAI als Oberfläche.
Für: Schnelle Entwürfe und ein paar Texturen, jeweils zum weiterverwursten. Die "Mumien" im letzten ZFX-Game waren praktisch 100% KI, aber basierend auf grober Form-Vorskizze, KI, grob drüberpinseln, nochmal 25% KI usw., am Ende Freistell-Retusche. Richtig brauchbar wird es dann, wenn ich z.B. auf dieser Basis mehrere Varianten erstelle. Beim Prozess fielen schon ein paar weitere ab.
Für den Menü-Hintergrund habe ich einen Ingame-Screenshot als Basis genommen.
In der Stammtischversion waren z.B. Vasentexturen und Hieroglyphendecals 100% KI.
Beruflich warten wir u.a. einfach auf die nächste PSD-Version. Bild-KI wird dann wahrscheinlich zu 99% eingesetzt bei Upscaling, Retusche und fehlendem Anschnitt (z.B. Bild zu schmal für das Format). KI für Entwurf macht bei uns nur sehr bedingt Sinn, aber unsere Kunden werden damit sicher um die Ecke kommen. Wir bereiten uns hauptsächlich darauf vor, mitreden zu können und Qualitätssicherung zu bieten.
Text: ChatGPT, also das allererste von Ende 2022 (ist das noch 3 oder inzwischen 3.5?), also das ohne Plus-Upgrade/Gebühr. Weil ich das zu selten nutze als dass sich eine Monatsgebühr privat lohnen würde.
Auch hier habe ich für das ZFX-Projekt z.B. einen Titel gesucht. Man braucht ein wenig Geduld, am besten GPT wie einen willigen Praktikanten ansehen.
ich: "I'm looking for a nice title for a computer game. It's about a tomb raider in egypt. But I can't call it "Tomb Raider", it already exists. Any suggestions?"
gpt: "
Pharaoh's Secret: Tomb Raider
Sands of Adventure: Tomb Raider
Curse of the Pyramids: Tomb Raider
Sahara's Treasure: Tomb Raider
Anubis' Legacy: Tomb Raider
Egypt's Enigma: Tomb Raider
Nefertiti's Quest: Tomb Raider
Osiris' Tomb: Tomb Raider
The Mummy's Curse: Tomb Raider
Sphinx's Riddle: Tomb Raider
"
Nach einem Hinweis hat es dann aber geantwortet "Understood! ..." und neue Vorschläge geliefert.
"Cursed Gypt" war dann meine eigene Idee, aber für's Brainstorming haben die Listen geholfen.
Testweise (ohne konkrestes Projekt):
Mehrfach für Storytelling getestet. Wenn man das richtig Stück für Stück aufbaut, funktioniert das ganz gut. Ich hasse das Wort "Prompt-Engineering", aber darauf kommts wirklich an. (IRobot: "Das, Detective, war die richtige Frage.")
Tipp z.B.: statt "Schreibe mir einen spannenden Krimi" vielleicht "Kannst du eine ScoobyDoo-Story entwickeln, die noch nicht existiert?" (evtl. plus zwei drei Komponenten als Eckpfeiler), und im nächsten Schritt dann Namen und Stil ändern. Das Gerüst wird wahrscheinlich ein besseres sein als komplett from scratch.
Oder auch Rätsel-/Aufgabenentwicklung im Weltkontext, rückwirkend mit Logikprüfung. Nie wasserdicht, nie überraschend oder komplex, eher wie ein Sparringpartner, der nur Ideen mit in den Pot wirft, und nicht komplett eigenständig kreiert.
Auch für Charakterentwicklung (Backstory, Verhalten in bestimmten Situationen ausloten, ...) ist es ziemlich gut.
Kann übrigens auch deutsch. Oder Stile imitieren, z.B. einen Dialog in mehr mittelalterlich anmutendes Geschwurbel "übersetzen".
Code: Privat nicht, beruflich habe ich nur selten mit Code zu tun, alle Schaltjahre mal InDesign Scripting. Hierfür auch ChatGPT. Sprache ist JavaScript, die Aufgaben eher überschaubar, das Schwierigste dabei ist das komplexe InDesign-Objektmodell, und das in einer dynamisch typisierten Sprache. Ich hasse es, allem muss man in der Referenz hinterherjagen um 10 Ecken in 3 Varianten.
GPT kann ich direkt nach konkreten Anwendungsbeispielen fragen und offene Fragen zu den Objekten und Parametern klären. Hat schon geholfen.
Konkrete komplexere Aufgaben schaffte GPT3 natürlich nicht auf Anhieb. Z.B. nur bestimmte markierte Spalten in Tabellen tauschen, aber nur Inhalte, nicht das Format, mit ein paar Bedingungen. Wurde zumindest teilweise gelöst, funktionierte so weit dass ich daran bequem weiterarbeiten konnte. War dann schneller als GPT in mehreren Stufen rückwirkend korrigieren zu lassen.
Der Rest ist eher vage experimenteller oder sogar nur beobachtender Natur (grob in die Richtungen Bild und 3D, Depth- und Normalmaps, Radiance Fields, Posing, Animation, 3D-Scans, ...).
Interessieren würde mich noch Text-to-Soundeffekt, um Sounds gezielter einsetzen und mehr variieren zu können. Weil Soundarchiv-Suche ein Zeitfresser ist.
Endgegner hat geschrieben: ↑26.05.2023, 00:58
nur noch machen lassen
Ja, mein ständiger Alptraum vor Augen wenn das mal in allen Mailprogrammen ist: Der eine hat keinen Bock ausformulierte E-Mails zu schreiben, gibt nur ein paar Stichpunkte an und lässt die KI schwurbeln. Der andere hat keinen Bock das alles zu lesen, und lässt die KI Stichworte rausfiltern. Oder gleich mit ähnlichem Geschwurbel antworten, v. v.
Meine Weltuntergangsprognose: Wir werden an generierten KI-Daten ersticken die keiner benötigt, nichtmal die KI selbst, und ohne dass sie böse Absichten verfolgt. Und neue KIs werden dann großteils mit diesen Daten trainiert ... ;)