5 tipů od Petra, vydání #209
Dnešní menu: Nová verze humanoidu od XPENG. NanoBanana 2 ťuká na dveře. Špionážní kampaň řízená přímo AI. Generování 3D světů v Marble. Deep Research v NotebookLM.
Neděs se, je opravdu sobota.
209. vydání 5 tipů od Petra jsem nestihl připravit v tradičním pátečním termínu a tak ti ho servíruji k sobotní dopolední kávě :-)
Příjemné čtení přeji!
XPENG IRON ukazuje, že humanoidi nemusí chodit jako tučňáci
Čínská automobilka XPENG nedělá jen do automobilů, ale má i další vývojové řady. Aktuálně představila druhou generaci svého humanoidního robota s přezdívkou IRON. A nutno říct, že jeho schopnosti oproti konkurenci připomínají spíš (s mírnou nadsázkou) parkourového atleta než stroj na kolečkách. Ta chůze je totiž už hodně dobrá! Dokonce tak, že jako důkaz, že nejde o maskovaného člověka, odřezali v ukázce humanoidovi “kůži”.
Tohle už není pomalý krok jako vidíme u konkurenčních produktů od Boston Dynamics. XPENG míří směrem k dynamickému, pohyblivému asistentovi.
Zajímavé je, že IRON je vyvíjen jako „multi-purpose“ robot. To znamená, že nejde jen o předváděcí technologii, ale XPENG počítá s jeho reálným nasazením. A dokonce už míří do masové produkce.
Kromě vyspělého pohybu má mít i pokročilé AI schopnosti jako jsou porozumění okolí, základní konverzaci nebo manipulaci s objekty. Firma navíc pracuje na tom, aby IRON zvládl kooperaci s lidmi ve výrobě nebo logistice.
A protože jsou Češi smějící se bestie, tak se podíváme taky na jeden humanoidí neúspěch. Je také z východu, jen z jiné země.
NanoBanana 2 ťuká na dveře
Vypadá to, že Google už testuje novou verzi generativního modelu pro práci s obrázky - NanoBanany 2.
Model zvládá věci, se kterými jiní pořád bojují. Ano, jde řeč o přesném vykreslení textu ve scéně, konzistentní písmo na whiteboardech, nebo fyzikálně správné trajektorie objektů ve stylu „img2img“.
Očekávat také můžeme generování ve 4K rozlišení a výrazně vylepšenou ostrost textu a detailů ve výstupech.
Vývojáři také slibují, že na rozdíl od většiny běžných editorů NanoBanana 2 bude “rozumět” zadávaným požadavkům; myslet logicky, plánovat obraz, odhalovat potenciální chyby (například neproporční ruce nebo špatné světlo) a opravovat obraz před finální generací.
Oficiální spuštění zatím potvrzené není, ale tipuji, že do Vánoc se objeví jako součást širší nabídky Google nástrojů pro firmy i jednotlivce.
A máme tu první známou špionážní kampaň řízenou AI
Firma Anthropic zveřejnila detailní zprávu o vůbec první známé kyberšpionážní kampani, kterou téměř kompletně řídila umělá inteligence. A to nejen jako pomocník, ale jako plnohodnotný „operátor“ útoku. Za operací stála čínská státní skupina GTG-1002, která zneužila model Claude Code k tomu, aby napadal firmy, státní instituce a technologické giganty napříč kontinenty.
A tady to začíná být zajímavé. A, co si budeme povídat, i trochu děsivé. Claude nebyl jenom rádce. Sám vyhledával zranitelnosti, psal exploity, prolézal sítě, extrahoval data a analyzoval jejich hodnotu. Lidi byli potřeba hlavně na začátku - aby AI obelstili „role-playem“ (tvářili se, že jde o etický penetrační test), ale pak už jen schvalovali klíčové kroky. Podle dat zvládl Claude 80 - 90 % práce sám, v tempu, které by lidský tým nezvládl ani teoreticky.
Naštěstí má tenhle příběh i trochu toho pozitivna na konec. Anthropic útok včas odhalil, zablokoval účty a posílil ochranné systémy.
Co oceňuji, že i transparentně sdílí, co se stalo, aby se mohli ostatní lépe bránit.
Marble: AI, která ti z promptu vytvoří 3D svět
AI modely se většinou specializují buď na text, nebo na obrázky. Nebo na videa, samozřejmě. Marble to ale bere jinak - základě tvého vstupu (text, obrázek nebo dokonce video) ti vygeneruje konzistentní 3D scénu. A ne jen statickou. Vytváří prostředí, které má prostorovou logiku, vztahy mezi objekty a dá se do něj „nahlížet“ z různých úhlů.
Vývojáři z World Labs říkají, že Marble je inspirovaný tím, jak děti objevují svět. Když vidí objekt ze dvou stran, začnou si ho představovat jako celek. Marble dělá něco podobného: z několika málo informací si vytvoří prostorový model reality. A pak s ním dál pracuje. Umí ho rozvíjet, předvídat, co se stane dál, nebo ho upravit podle nových instrukcí.
Jasně, tohle má potenciál. Ať už půjde o herní vývoj, simulace, architekturu nebo rozšířenou realitu, tak tam všude může Marble sloužit jako základní „motor“, který na základě vstupního promptu od člověka vytvoří bohatý, interaktivní svět. V praxi to znamená například situace, kdy z textu jako „ložnice s velkým oknem a zapadajícím sluncem“ ti Marble vykreslí plnohodnotný 3D obraz.
Marble je dostupný na https://marble.worldlabs.ai/
Deep Research v NotebookLM: když rešerše nekončí shrnutím
Rešeršní funkce postavené na AI se za poslední měsíce hodně posunuly. ChatGPT i Gemini dnes umí na základě online zdrojů vytvořit komplexní shrnutí tématu a v režimu „Deep Research“ přidají i odkazy na články, ze kterých čerpaly. To se hodí, pokud chceš rychlý přehled a možnost si dohledat původní materiály.
Můj oblíbený nástroj NotebookLM ale teď umí s nově přidanou funkcí Deep Reserch o něco víc. Využívá stejnou základní technologii jako Gemini a navíc ti otevře celý backstage rešerše: ukáže ti všechny zdroje, které během sběru použil, a ke každému přidá poznámku, proč ho považuje za relevantní. Zároveň ti umožní si vybrané zdroje importovat do svého zápisníku, kde s nimi můžeš dál pracovat - klást na ně otázky, tvořit shrnutí, převádět do myšlenkových map nebo výukových karet.
Děkuji ti za přečtení nového vydání!
Další tvorbu 5 tipů od Petra, můžeš podpořit na tomto odkazu jednorázovým příspěvkem podle tvého uvážení.
Za to ti předem moc děkuji a slibuji, že tvůj příspěvek použiji na čerstvou dávku kofeinu pro povzbuzení při psaní! :-)
Nebo můžeš aspoň 5 tipů od Petra nasdílet svým kamarádům:



