5 tipů od Petra, vydání #205
Dnešní menu: Sora 2 v Higgsfieldu i Heygenu. AI mód vyhledávání na Google. Neo - nový AI webový prohlížeč. Agent Builder od OpenAI. Nástroje na tvorbu vlastního hlasového AI agenta.
Sora 2 už běží v Higgsfieldu i v HeyGenu
Minulý týden jsem psal o novém modelu Sora 2 na generování AI videí od OpenAI. A také o tom, že pro běžného českého uživatele ještě není dostupný.
Tak už je.
A třeba rovnou přes dva AI nástroje - Higgsfield a HeyGen. Každý s ní pracuje trochu jinak, takže se na to mrkneme.
V Higgsfieldu máš přístup k Sora 2 jako samostatnému text-to-video nebo image-to-video nástroji. Hodíš prompt (nebo referenční obrázek), zvolíš délku klipu, formát (např. TikTok) a model ti vygeneruje celou animovanou scénu. Higgsfield má taky šikovné presety a podporuje různé efekty, práci s produktem ve scéně, doplňování zvuku a další editační úpravy. Využiješ to hlavně, pokud chceš tvořit scénická videa, promo klipy nebo třeba reklamní Reels.
Naopak HeyGen (po kliknutí na odkaz a případné koupi placeného tarifu dostaneš bonus 15 USD v kreditech) si vzal Soru 2 jako pomocníka pro svoje avatarové workflow. K mluvícím hlavám teď můžeš rovnou přidat scénické vizuály, pozadí nebo B‑rolly vygenerované pomocí Sory – bez nutnosti přepínat mezi nástroji. Výhodou je, že celý proces (text → avatar → video se scénou) probíhá uvnitř HeyGenu. Hodí se to na firemní videa, e‑learning nebo třeba AI moderátory do produktových dem.
Ukázka z Heygenu je tady.
Už jsi si vyzkoušel(a) vygenerovat video s modelem Sora 2?
AI mód ve vyhledávání od Googlu dorazil i do Česka
Google pomalu nasazuje nový AI mód ve vyhledávání i u nás. A i když o tom možná moc neslyšíš, stojí za to ho vyzkoušet. Místo klasického výpisu odkazů dostaneš rovnou odpověď. Srozumitelnou, shrnutou, často v odrážkách. A co je důležité: můžeš na ni hned navázat další otázkou, aniž bys musel celý dotaz znovu formulovat.
AI mód používá jazykový model Gemini, který kombinuje informace z různých webů, nákupních katalogů nebo třeba z Google Maps. Vypadá to podobně jako odpovědi z ChatGPT, ale rovnou v Googlu. Můžeš mu zadat vícestupňové otázky (např. „Jaké SUV do 1,5 milionu má nejlepší dojezd a zároveň dostatek místa pro psa?“) a Google odpoví kombinací textu, tabulek i doplněných odkazů. Funguje to samozřejmě i na mobilu.
Mrkni na krátkou oficiální ukázku, jak to vypadá:
Přepnutí do AI módu zatím probíhá postupně. A pokud ho ještě nevidíš, stačí chvíli počkat nebo zkusit anglické rozhraní.
Norton Neo: nový AI prohlížeč, který nechce být jen další Chrome
Na poli webových prohlížečů byl pár let klid, ale s rozvojem AI tu začíná být zas pěkně rušno.
Když Norton oznámil vlastní AI-first prohlížeč Neo, spousta lidí to brala jako další pokus „být jako Copilot nebo Arc“. Jenže Neo je o něco praktičtější než bys čekal(a). Nestaví se jako náhrada pro ChatGPT, ale jako bezpečný a přehledný nástroj pro každodenní práci s webem. A některé jeho funkce dávají fakt smysl.
Neo ti umí shrnout libovolný web, video nebo PDF ještě předtím, než ho otevřeš. Slibuje přehlednější správu karet (typu: „co jsem to sakra otevřel před 2 dny?“), má zabudované AI odpovědi ve vyhledávání, náhledy článků na jedno kliknutí a docela chytrý systém kontextových doporučení. To celé běží na jádře Chromium, takže si do něj můžeš přidat rozšíření z Chrome Web Store.
Zatím musíme pro tenhle prohlížeč přes čekací listinu. Snad nebude dlouhá a brzy se dočkáme ;)
ElevenLabs UI: open‑source knihovna pro stavbu vlastního AI voice agenta
Pokud jsi někdy chtěl(a) vytvořit vlastní AI asistenta nebo hlasového bota, ale nechtěl(a) jsi začínat na zelené louce, ElevenLabs ti právě hodil záchranné lano. Nově totiž uvolnili pod MIT licencí open‑source knihovnu ElevenLabs UI. Což je sada 22 předpřipravených komponent pro stavbu rozhraní kolem AI audia, hlasu a transkripce.
Najdeš v ní vše od přehrávačů, waveformů, tlačítek pro nahrávání až po celé šablony pro chaty, diktování, přepis nebo práci s hudbou. Komponenty jsou plně přizpůsobitelné (Tailwind, shadcn/ui) a připravené na propojení s API jako je ElevenLabs Voice AI, OpenAI, Whisper nebo třeba Vosk. Skvělý základ pro projekty typu „hlasový asistent pro interní helpdesk“, „AI DJ“ nebo vlastní „text-to-speech poznámkovač“.
Tady najdeš repozitář na GitHubu – ElevenLabs UI a tady ukázky & live demo komponent.
Za mě skvělý krok, protože nejen že ElevenLabs umí hlas opravdu výborně, teď k tomu dávají i nástroje, jak ho začít používat vizuálně, rychle a bez zbytečného bastlení.
OpenAI spustilo Agent Builder. A tentokrát je to fakt pro všechny
Nový Agent Builder od OpenAI přináší nové možnosti tvorby AI nástrojů. Pokud tě od vývoje vlastního agenta odrazovalo programování, tak tohle je přesně pro tebe. Pomocí drag-and-drop rozhraní můžeš skládat jednotlivé části agenta jako puzzle. Uzly (nodes) zastupují různé funkce - od základní logiky až po připojení ke službám jako Dropbox nebo Microsoft Teams.
Celý nástroj běží ve webovém rozhraní a slouží jak pro technicky zdatné vývojáře, tak i pro „běžné smrtelníky“. Ti si díky šablonám a přehlednému vizuálnímu editoru snadno postaví třeba vnitrofiremního asistenta, který reaguje na dotazy z dokumentace nebo propojí více AI agentů dohromady.
Velkým plusem jsou i bezpečnostní opatření (guardrails), podpora paměti a možnost testovat výstupy v reálném čase. Pokud budeš chtít, můžeš si vytvořené workflow exportovat do kódu (Python nebo TypeScript) a dál si ho přizpůsobit. A pokud ti stačí „naklikat“ si vlastní AI bez řádku kódu, i to zvládneš.
Vyzkoušet můžeš tady: https://platform.openai.com/agent-builder. Budeš ale potřebovat účet s ověřenou organizací.
Děkuji ti za přečtení tohoto vydání 5 tipů od Petra a přeji ti krásný víkend!
P.S. Další tvorbu 5 tipů od Petra, můžeš podpořit na tomto odkazu jednorázovým příspěvkem podle tvého uvážení.
Já ti za to předem moc děkuji a slibuji, že tvůj příspěvek použiji na čerstvou dávku kofeinu pro povzbuzení při psaní! :-)
5 tipů od Petra můžeš také doporučit svým kamarádům. Stačí kliknout na toto tlačítko:


