5 tipů od Petra, vydání #207
Dnešní menu: Novinky v NotebookLM. Webový prohlížeč od OpenAI/ChatGPT. Prima funkce v Higgsfieldu pro vizuální obsahové tvůrce. Nový video model Hailuo 2.3. Composer - pravá ruka vývojářů.
Nálož novinek v NotebookLM
Jedním z mých oblíbených nástrojů je NotebookLM od Google, který umožňuje parádně zpracovávat množství informačních zdrojů. Google do něj postupně přidává nové a nové funkce, tak se pojďme podívat na některé z těch nejdůležitějších.
Umí načíst i dokumenty z Wordu (konečně!)
Už není potřeba převádět Word dokumenty do PDF. NotebookLM teď umí pracovat s .docx soubory přímo. U tabulek a prezentací (.xlsx a .pptx) si ale ještě musíš pomoci převodem. Tabulky do pdfka, prezentace stačí převést do formátu Google Prezentací.Je dostupná historie chatů (taky konečně!)
To, že při každém opuštění sešitu, jsi přišel/přišla o historii chatu, byla menší slabina NotebookLM. Dala se naštěstí obcházet tím, že si člověk výstup z chatu uložil jako poznámku, ale běda, když na to zapomněl. Teď už to ale bude v pohodě :-)Audio i video = text
Nahraješ zvuk nebo video a nástroj ti automaticky vygeneruje přepis. Ano, i českého videa. Podporuje širokou škálu formátů včetně MP3, MP4, WAV nebo třeba OGG. Ideální třeba pro převod rozhovorů nebo webinářů do psané podoby.Videopřehledy na míru
Nově si můžeš vybrat styl výstupu - od klasického přes styl tabule až po anime nebo akvarel. Vznikají tak vizuálně zajímavá videa, která využiješ třeba na interní školení nebo prezentaci pro klienty. A ano, může za to integrace Google modelu Nano Banana.
Funkce hloubkového výzkumu při práci se zdroji
Přidej vlastní dokumenty, nebo nech NotebookLM prohledat web či svůj Google Disk. Automaticky ti vytvoří rešerši s odkazy na konkrétní části zdrojů. Hodí se na tvorbu školení, rešerše ke článkům i podklady pro rozhodování.
Některé z novinek se zavádějí postupně, tak nemusíš panikařit, že je zatím ve svém účtu na NotebookLM nemáš.
ChatGPT Atlas: Prohlížeč, který myslí s tebou
OpenAI v mezidobí od vydání posledních 5 tipů od Petra představil nový webový prohlížeč s názvem ChatGPT Atlas. Na první pohled vypadá jako běžný Chrome klon, ale pod kapotou mu běží ChatGPT, který rozumí tomu, co zrovna čteš. Můžeš si nechat shrnout článek, porovnat produkty, doptat se na nejasnosti nebo si nechat pomoci s úkolem a to vše bez opouštění stránky.
Zásadní rozdíl? ChatGPT není jen po ruce - je vlevo vedle obsahu, který právě čteš. Rozumí tomu, co je na stránce napsané, a umí s tím pracovat. Nechá se oslovit kliknutím nebo výběrem textu. V režimu „agent mode“ zvládne i složitější úlohy jako rezervaci hotelu, vyplnění formuláře nebo vyhledání nejlepší varianty produktu. Zatím to ale není úplně autonomní AI a to je spíš dobře (ano, mám na mysli bezpečnost a podobné záležitosti).
Atlas je aktuálně dostupný pro macOS, a to pouze pro předplatitele ChatGPT Plus. Verze pro Windows je v plánu, ale zatím bez konkrétního data.
Pro koho to má smysl? Pokud děláš rešerše, píšeš, školíš nebo často zpracováváš informace z různých zdrojů, tak ti ChatGPT Atlas ti výrazně ušetří čas. A jako bonus máš jedno místo, kde se spojuje prohlížení, přemýšlení i tvoření. Jestli bude časem běžný Chrome zbytečný? Možná. Ale minimálně jako druhý prohlížeč na „chytré čtení“ dává Atlas smysl už teď.
Popcorn: Vytvoř video z jediné fotky (a vypadá to skvěle)
Startup Higgsfield to s videem z AI opravdu umí. Jejich novinka Popcorn ti umožní vytvořit krátké dynamické video z jediné fotky. Stačí nahrát portrét (nebo třeba selfie), zvolit styl a náladu a Popcorn z něj vygeneruje nejprve statický obrázek a pak i video, které působí dojmem reálného záběru.
Tohle není deepfake ani nudná slideshow. Výsledné video má pohyb, emoce, atmosféru. Jako by někdo krátce natočil skutečnou scénu. Funguje to skvěle pro osobní značku, tvorbu obsahu i marketing. Ze statického profilu máš během minuty krátký příběh/storíčko.
Higgsfield cílí hlavně na tvůrce na sociálních sítích, ale Popcorn se dá využít i jinak: třeba jako originální úvod do prezentace, netradiční profilovka nebo teaser na web.
Hailuo 2.3: Video z AI, které vypadá, jako by ho točil kameraman
Čínská společnost MiniMax vylepšila svůj model pro generování AI videí a my si teď můžeme užívat Hailuo 2.3.
Nová verze umí věrohodnější pohyb, stabilnější výrazy, lepší práci s pozadím a celkově působí… no zkrátka profesionálněji.
Z textu nebo jediné fotky dokážeš vytvořit krátké video ve vysokém rozlišení. Výsledek se hodí třeba na reklamu, produktové demo nebo jako doprovodný vizuál k článku či příspěvku.
Co je prima, tak model je dostupný v nástroji Higgsfield (ano, už zase :-)).
Že by ideální hračka na nadcházející víkend? :-)
Composer: AI vývojář, který fakt maká rychle
Tým Cursor představil Composer, nový agentní AI model pro softwarové inženýry, který má dvě hlavní přednosti: rychlost a užitečnost. Podle interních benchmarků zvládá generaci kódu až čtyřikrát rychleji než srovnatelné modely. A co je důležité, nejedná se o nějaký akademický výstřel do tmy, ale reálně použitelný nástroj, který už dnes pomáhá při vývoji velkých projektů.
Composer byl trénovaný přímo na reálných vývojářských úlohách, ne na syntetických datech. Během vývoje řešil skutečné problémy ve velkých kódbázích, měl přístup k nástrojům jako terminál, vyhledávání nebo editace souborů a učil se, jak postupovat efektivně. Díky tomu chápe kontext projektu, umí pracovat s existujícími abstrakcemi a navrhuje změny, které dávají smysl nejen z pohledu syntaxe, ale i architektury.
Model je navržený pro interaktivní použití. Reaguje rychle, bez zbytečného balastu, a drží vývojáře v tempu. Významnou roli tu hraje optimalizace na rychlou odezvu. Composer se učí nejen správně odpovědět, ale odpovědět efektivně, ideálně tak, aby vývojář nemusel na nic čekat.
Architektura modelu využívá přístup „mixture of experts“, tedy dynamický výběr těch částí modelu, které jsou nejvhodnější pro konkrétní úkol. Podporuje také práci s dlouhým kontextem, což je zásadní při navigaci ve složitých projektech, které mají stovky souborů a závislostí. A to všechno běží ve vlastním RL prostředí, které simuluje skutečné vývojové podmínky.
Příjemnou featurou je i to, že model sámopravuje některé chyby, navrhuje a spouští testy nebo provádí komplexní vyhledávání v kódu.
Není asi lepšího doporučení, než to, že přímo vývojáři v Cursoru ho už běžně používají při své práci. Ne jako hračku, ale jako plnohodnotného kolegu, který se postará o část rutiny i složitějších rozhodnutí. Ještě není dostupný veřejně, ale už teď je jasné, že vývojáři se mají na co těšit.
Moc ti děkuji za přečtení nového vydání 5 tipů od Petra!
Jejich další tvorbu můžeš podpořit na tomto odkazu jednorázovým příspěvkem podle tvého uvážení.
Za to ti předem moc děkuji! Tvůj příspěvek použiji na podporu některé z pražíren kávy a získání čerstvé dávky kofeinu pro povzbuzení při psaní! :-)
A nebo můžeš aspoň 5 tipů od Petra nasdílet svým kamarádům:


