5 tipů od Petra, vydání #151
Dnešní menu: Nálož AI novinek od Midjourney, Udio a Mety. Kdy se v Chat GPT dočkáš pokročilého hlasového režimu? A jaká byla největší akvizice týdne na poli AI grafiky?
Nová verze Midjourney
Tak a máme Midjourney ve verzi 6.1! Jaké vylepšení nám vývojáři naservírovali?
Tady je výčet těch nejvýraznějších:
mnohem lepší kvalita obrazu (snížené množství pixelových artefaktů, vylepšené textury, kůže, 8bitové retro atd.)
přesnější, detailnější a správnější drobné obrazové prvky (oči, malé obličeje, vzdálené ruce atd.)
více souvislých obrázků (ruce, nohy, ruce, těla, rostliny, zvířata atd.)
zhruba o 25 % rychlejší pro standardní úlohy s obrázky
nové upscalery s mnohem lepší kvalitou obrazu / textur
vylepšená přesnost textu (při kreslení slov pomocí "uvozovek" v nápovědách)
nový model personalizace s lepšími nuancemi, překvapením a přesností
verzování personalizačního kódu (při použití libovolného personalizačního kódu ze starých úloh lze použít personalizační model a data z dané úlohy)
nový režim --q 2, který (někdy) trvá o 25 % déle, než přidá více textury za cenu snížení soudržnosti obrazu
věci by měly vypadat "obecně krásněji" ve všech oblastech
A protože jeden, resp. v tomto případě dva obrázky vydají za 124 slov v odrážkách výše, tady je ukázka verze 6.1 a 6.
Vypadá to, že progres tam je.
Skutečně i ta práce s textem je lepší a uživatel dostává na výstupu přesný text častěji než dříve. Tady je nástřel loga fiktivní death metalové kapely Rotorotor :-)
Canva se pustila do nákupu
Nákupem týdne se v oblasti AI grafiky stala akvizice nástroje Leonardo.ai Canvou.
Leonardo.ai je jedním z nástrojů na vytváření AI grafiky. A nutno říci, že z těch, které umožňují aspoň nějakou tvorbu zdarma, je rozhodně jeden z nejlepších. A Canvu asi taky znáš - oblíbený a jednoduchý online editor grafiky a videí.
Celá akvizice dává ještě větší smysl. Pokud s Canvou pracuješ a využíváš její dosavadní AI pro tvorbu grafiky, tak asi víš, že za moc nestojí.
Leonardo.ai bude prý i nadále fungovat samostatně, Canva bude financovat jeho další vývoj a samozřejmě, že integraci do svých služeb.
Jako předplatitel Canvy tleskám! :-)
Další hrátky AI s videem
A co takhle nějaké novinky od samotného Marka?
Meta tento týden ukázala AI model Segment Anything Model 2 (SAM 2), který dokáže v reálném čase identifikovat a sledovat objekty ve snímcích videa.
SAM 2 navazuje na předchozí schopnosti segmentace obrazu modelů společnosti Meta a řeší problémy, jako je rychlý pohyb a zákryt objektů.
Model dokáže segmentovat libovolný objekt ve videu a vytvářet výřezy na několik kliknutí - bezplatnou ukázku si můžete vyzkoušet zde.
A fakt to funguje celkem dobře. I když to demo je zatím spíš jen na hraní, než že bys z toho dostal(a) něco reálně použitelného.
Model SAM 2 bude přístupný jako open-source a k tomu Meta zveřejňuje i velkou anotovanou databázi 50 000 videí, která byla použita pro trénink.
Kdy si pořádně pokecáme s Chat GPT?
A ještě jsme nebyli u Open AI. I tam jsou nějaké novinky a já si vybral zprávu o tom, že platící uživatelé Chat GPT už postupně získávají možnost používat “pokročilý hlasový režim”.
Ten umožňuje vést konverzace v reálném čase a schopnost umělé inteligence rozpoznávat emoce a reagovat na ně (na tohle jsem zvědavý - jak to zvládne pracovat s ironií a sarkasmem :-)).
Postupné zavádění bude celkem rozvážné - všichni uživatelé placeného Chat GPT se pokročilého hlasového režimu dočkají až během podzimka.
Další očekávané funkce, které byly dříve představeny v rané ukázce schopností OpenAI - tedy sdílení videa a obrazovky, budou spuštěny "později".
AI, zahraj nějakou pěknou písničku
Novou verzi má i nástroj na tvorbu AI muziky Udio.
Nyní umožňuje tvořit na jeden zápřah AI songy dlouhé až 2:10 min (dosud šlo max. 32 s - ty bylo možné “prodlužovat” pomocí generování návazných částí písničky; prodlužovat songy jde i teď). Nová verze má lepší kvalitu zvuku a jednotlivé nástroje jsou v ní čitelnější.
Nově je možné i remixovat nahranou hudbu. To bude asi dost využívaná featurka.
Jeden praktický tip - pokud tvoříš muziku s textem, tak si to chce fakt vyhrát s jeho délkou (aby odpovídala stopáži songu), protože jinak si AI začne vymýšlet a část songu odzpívá svoji “hatmatilkou”.
Díky ti za přečtení tohoto vydání 5 tipů od Petra! Užij si pěkný víkend!
P.S. Další tvorbu 5 tipů od Petra, můžeš podpořit na tomto odkazu jednorázovým příspěvkem podle tvého uvážení.
Já ti za to předem moc děkuji a slibuji, že tvůj příspěvek použiji na čerstvou dávku kofeinu pro povzbuzení při psaní! :-)