Zesvětli, zaostři, ořízni. Apple vyvinul technologii, která dokáže upravovat fotografie hlasem
Vývojáři v americké Santa Barbaře pracují na technologii MGIE, která umožní upravovat originální fotografie pomocí textových výzev, případně i hlasových pokynů. Zařídí to umělá inteligence, která bude povely realizovat. Apple již spustil testovací verzi.
V posledních letech umělá inteligence zaplavila prostor kreativního vytváření ilustračních obrázků a přetváření fotografií. Ne vždy jsou však výsledky uspokojivé.
Jednou z oblastí, kde byla umělá inteligence zatím opomíjená, je používání textových výzev, či řeči ke skutečné úpravě autorských fotografií, namísto pouhého vytváření alternativních vizuálů z celého digitálního spektra. To se nyní mění.
V únorové zprávě vydané výzkumníky univerzity v Santa Barbara a vývojáři Apple tvůrci platformy MGIE uvádějí, že úpravy obrázků pomocí AI a přirozeného jazyka by mohly být efektivnější a kvalitnější, než práce v klasických programech, jako je například Photoshop. O zprávě informoval specializovaný server shotkit.com
Práce s fotografií se zjednoduší
„Úpravy obrázků založené na pokynech zlepšují ovladatelnost a flexibilitu manipulace s obrázky pomocí přirozených příkazů bez složitých popisů. Lidské pokyny jsou zatím někdy příliš stručné na to, aby je současné metody mohly zachytit a dodržovat. Velké multimodální jazykové modely však již vykazují slibné schopnosti v porozumění a vytváření vizuálních reakcí prostřednictvím umělé inteligence,“ uvádí zpráva.
Podle nich nová technologie MGIE pomáhá vyřešit výše uvedený problém tím, že umožňuje právě editaci založenou na výrazových instrukcích. Dokáže z lidské řeči, nebo psaných slov pro umělou inteligenci vytvořit stručné a jasné pokyny, které efektivně vedou celý proces úprav.
Trochu jiný Photoshop
MGIE může provádět běžné úpravy ve stylu Photoshopu, jako je oříznutí, změna velikosti, otočení, převrácení přidání filtrů, či úprav jasu a ostrosti. Model může navíc použít i pokročilejší úpravy, jako je změna pozadí, přidání nebo odebrání objektů a prolnutí obrázků.
Autoři zprávy také vysvětlují, že MGIE dokáže optimalizovat celkovou kvalitu fotografií pomocí korekcí jasu, kontrastu, ostrosti a vyvážení barev a přidáním uměleckých efektů, jako jsou styly skic nebo malování. To vše může uživatel provést prostřednictvím instrukcí ve svém jazyce. Zvládne také upravovat konkrétní části fotografie, jako jsou oči nebo tváře, přičemž ostatní prvky zůstávají nedotčené. Technologie ale má ve své beta verzi zatím jednu vadu. Doba čekání na dokončení úprav může zatím být dlouhá několik minut i déle.
Tak rušno jako v posledních dnech kolem Applu už dlouho nebylo. Brzy Apple zveřejní výsledky za poslední kvartál minulého roku, oznámí, jak na něj dopadly problémy v Číně, chystá uvedení nového radikálního produktu a jen tak mimochodem zcela rázně změnil podmínky pro používání aplikací v zařízeních Apple. Vynuceně. A vynuceně také dojde ke snížení poplatků v App Storu. Akcie proto připomínají křivku EKG. A nejspíš budou ještě několik dní.
Klíčové dny pro Apple a investory. Co přinesou výsledky a nové brýle Vision Pro
Zprávy z firem
VYŠEL JARNÍ NEWSTREAM CLUB
Soukromí je nový luxus. A možná i nejcennější dovednost dneška.
Jarní vydání magazínu Newstream CLUB se zaměřuje na téma, které dnes řeší miliardáři i běžní lidé – jak si uchovat vlastní prostor v době, kdy jsme neustále online. Soukromé kluby, tiché byty, digitální detox i život na očích veřejnosti.
V novém čísle přinášíme rozhovory s Vendulou Pizingerovou, youtuberem Tarym nebo zakladatelem Smarty.cz Petrem Syrůčkem. Nechybí inspirace ze světa byznysu, stylu ani cestování – a také konkrétní tipy, jak si soukromí znovu vzít zpět.
Jedenácté vydání čtvrtletníku Newstream CLUB je v prodeji na stáncích i v online distribuci Send, kde je možné titul také předplatit. Digitální verzi magazínu lze zakoupit přímo na webu newstream.cz.
Na další číslo magazínu se můžete těšit v červnu.