5 tipů od Petra, vydání #208
Dnešní menu: Kimi - lepší LLM model než ChatGPT, Gemini atd. Music-to-video nástroj. Food truck, kde vaří robot. Bere AI práci freelancerům (studie)? Coca Cola a AI v její vánoční kampani.
Kimi K2 Thinking: Tichý zabiják zavedených AI modelů?
Většina pozornosti v AI světě pořád míří na OpenAI, Google nebo Anthropic. Mezitím se ale v tichosti zrodil model, který podle některých testů válcuje konkurenci. A navíc je open source. Jmenuje se Kimi K2-Chat (v2), a vznikl pod čínským startupem Moonshot AI, který podporuje například Alibaba.
Kimi se dostal do čela několika nezávislých žebříčků výkonu velkých jazykových modelů (LLM), včetně LMSYS Chatbot Arena, kde překonal i GPT-4 Turbo a Claude 2.1. Vyniká v tzv. „long context reasoning“ a zvládne zpracovat více než 2 miliony tokenů, tedy stovky stran textu naráz. To ho dělá fakt silným parťákem pro rešerše, analýzu dokumentů nebo automatizované zpracování komplexních zadání.
Moonshot se netají ambicemi vytvořit AI, která dokáže „dlouhodobě a hloubkově přemýšlet“. Zatímco ostatní modely se často zamotají do vlastních výstupů při delších konverzacích, Kimi drží kontext pevně v ruce. Pro firmy to znamená reálné využití třeba ve zpracování smluv, analýze zákaznických dat nebo generování reportů na základě dlouhých vstupních materiálů.
Zatím je Kimi dostupný hlavně v Číně, ale díky open-source variantám (např. Kimi-v1) se s ním už experimentuje i v západních AI nástrojích. Jestli se tahle „Moonshot“ trefa skutečně stane novou stálicí AI nebe, uvidíme. Ale už teď je to velmi zajímavý signál, že špičková AI nemusí nutně stát na západních miliardách.
Na druhou stranu… země původu modelu vyvolává jistou obezřetnost, pokud jde o bezpečnost, že…
Z hudby rovnou video? Ale ano!
Že jsou nástroje typu text-to-image, text-to-video nebo image-to-video nuda? A co takhle music-to-video?
Přesně tohle umí AI nástroj Revid. Dokáže vzít skladbu, kterou nahraješ, a automaticky k ní vytvořit hudební klip.
Samozřejmě, že to není žádné kouzlo, ale spíš chytré spojení několika AI modelů. Revid analyzuje rytmus, náladu i dynamiku skladby a k jednotlivým pasážím pak přiřazuje tematické záběry z rozsáhlé knihovny stock videí. Nebo generuje vlastní AI záběry. Jako celek pak video působí celkem konzistentně a není to jen chaotická smršť efektů a záběrů.
Pro hudebníky, labely, podcasty nebo social media tvůrce je tohle možná docela trefa. Videa z Revidu můžeš rovnou použít na Instagram, YouTube Shorts nebo TikTok. V základní verzi je to zdarma (i když 20 kreditů nedovoluje vygenerovat nic víc než krátký klip) a exporty mají sice watermark, ale na testování to úplně stačí.
Robotický food truck, který vaří líp než já (a nejspíš i ty)
Na letošním TechCrunch Disruptu v San Franciscu, což je ta akce, kde dřív začínaly firmy jako Dropbox nebo Trello, se objevil projekt, která vypadá trochu jako sci-fi.
Projekt se jmenuje Shin Starr a je to v podstatě restaurace narvaná do náklaďáku, kde vaří roboti. Bez kuchařů. Jo, fakt bez lidí.
Celý systém je poháněný AI a šéfuje mu virtuální kuchař, kterého naučil vařit jeho lidský protějšek. Robot přitom hlídá věci jako vlhkost nebo přesnou teplotu a podle dat se přizpůsobuje. Jinými slovy: pokud si objednáš bulgogi, dostaneš přesně takové, jaké sis představoval. Bez výpadků nálady obsluhy nebo nepozorného učně.
Shin Starr tvrdí, že díky tomu může zmenšit personál o 80 %, a to je už na provozních nákladech dost znát.
Navíc to není jen nápad na předvádění se na konferencích nebo tak něco. První food trucky už normálně fungují a do budoucna se plánují mikropobočky třeba na letištích. Objednáš z mobilu, přijdeš si k okénku, vezmeš jídlo. A nikdo tě neignoruje, protože má zrovna poradu s kolegou u friťáku… :-)
Co mě na tom zaujalo? Není to jen “nějaký robot, co míchá rýži“. Ale je to něco, co mění samotný formát food truckového podnikání.
AI zatím práci freelancerům nebere. Ale trénuje na to
Hláška, že nějaká profese nebude mít brzy co žrát, je ve světě AI celkem populární. I tady párkrát zazněla. Vychází z toho, že schopnosti AI jsou už na takové úrovni, že panují obavy o to, že některé profese již může 100% nahradit.
Ale je tomu tak i ve skutečnosti? Jak blízko je dnešní AI tomu, aby nahradila člověka v reálné zakázce?
Nová studie Remote Labor Index (RLI) přináší zatím nejpřesnější nebo možná spíš nejaktuálnější odpověď. Výzkumníci vzali 240 projektů ze skutečných freelance platforem - tasků jako jsou grafika, 3D modely, datová vizualizace, videa, animace, architektura a zadali je špičkovým AI agentům. Výsledek? Jen 2,5 % výstupů bylo podle expertů na takové úrovni, že by je reálný klient přijal.
Tohle číslo je… je prostě nízké. Zároveň ale důležité. Ukazuje, že ačkoliv AI zvládá testy a benchmarky, skutečná práce je prostě jiná liga.
Většina selhání pramenila z úplně základních věcí: špatné formáty, nekompletní výstupy, nepřesnosti v zadání, technické chyby… Mimochodem, vidíte tu i příčiny, za které může lidský zadavatel a ne AI zhotovitel.
Tam, kde AI něco odevzdala, to často vypadalo jako první návrh, který by ještě potřeboval ruce designéra, kodéra nebo editora. Prostě byl by ještě potřeba lidský zásah k dotažení do smysluplného výsledku.
Zároveň ale platí, že mezi jednotlivými modely byly rozdíly a že schopnosti jdou pomalu nahoru. Když se místo binárního „splnil/nesplnil“ měřila relativní kvalita výstupů (pomocí tzv. Elo skóre), bylo vidět, že novější modely jako Manus nebo Grok 4 překonávají starší generace.
Co si z toho vzít? AI dnes freelancery zatím nenahradí. Ale už se pilně učí. A pokud se tenhle trend udrží, může se to během pár let změnit. Zatímco teď zvládá hlavně zvuk, jednoduché vizualizace a generování obrázků (a i tam jsou ty lidské ruce ještě potřeba), příště možná překvapí v oblastech, které dnes považujeme za „bezpečné“.
Vánoce jsou tady, Vánoce jsou tady
Jestli se ti vybavila melodie z vánoční reklamy Coca Coly, tak titulek splnil účel :-)
A proč sem tahám zrovna tuhle vánoční kampaň?
Protože letošní svátky přináší v podobě reklamy tohoto nápojového giganta něco nového - spoty, které kompletně vytvořila umělá inteligence. A to nejen jako pomocník v zákulisí.
Celé reklamy vznikly v AI studiích během 30 dní, přičemž na nich pracoval minitým o pěti lidech. Výsledek? 70 tisíc vygenerovaných klipů a příběh, který vypadá překvapivě přirozeně, díky animovaným zvířatům místo loňských „divně lidských“ postav.
Co si z toho vzít? Tak asi to, že AI je nová norma. I když loňská reklama sklidila kritiku a část kreativní branže má z AI stále obavy, Coca-Cola se rozhodla pokračovat. Podle globálního šéfa značky už „džina vypuštěného z láhve ven už zpátky nedostaneme“.
Možná je to odvážné. Možná lehce riskantní. Ale právě díky těmhle experimentům se AI posouvá z testovacích laboratoří do běžné praxe. A to se mi líbí.
A ta reklama? Tady je:
Děkuji ti za přečtení tohoto vydání 5 tipů od Petra a přeji ti pěkný podzimní víkend!
P.S. Další tvorbu 5 tipů od Petra, můžeš podpořit na tomto odkazu jednorázovým příspěvkem podle tvého uvážení.
Já ti za to předem moc děkuji a slibuji, že tvůj příspěvek použiji na čerstvou dávku kofeinu pro povzbuzení při psaní! :-)
5 tipů od Petra můžeš také doporučit svým kamarádům. Stačí kliknout na toto tlačítko:



