Zápis z porady či jednání pomocí umělé inteligence

Patrick Zandl · 8. květen 2024

Jednou z aplikací umělé inteligence, kterou používám prakticky rutinně, je zápis ze schůzky, porady či jednání. Pojďme se podívat na to, jak to funguje.

V poslední době totiž nastal boom aplikací, které službu shrnutí či zápisu umožňují a řadu z těchto aplikací lze prakticky používat i v češtině. A tím je třeba začít: nebudu zmiňovat aplikace, jako je Otter, dnešní leader trhu, ten ale podporuje jen angličtinu a s jinými jazyky u něj neuspějete.

V českém prostředí jsem vyzkoušel Wave AI, Summie, Lush a MinutAI, u ostatních jako Osmo nebo Otter jsem neviděl podporu češtiny. A pozor, aplikace jsou pro iOS a iPhone, pro Android jsem jejich verzi neviděl s výjimkou MinutAI.

Jde o mobilní aplikace. Nainstalujete si je do svého mobilu a na začátku schůzky prostě spustíte nahrávání, po konci jej ukončíte a data se odešlou do cloudu. Proto je třeba dát si pozor na to, zda jste na WiFi a případně přenos odložit, data nebývají příliš komprimovaná a z jedné hodinové schůzky odešlete větší desítky megabitů dat, pokud máte ostřejší limit dat na mobilu, můžete být rychle na dně. Je potřeba si to hlídat a případně data ke zpracování odesílat až z wifiny.

Jak je to s cenami?

Aplikace Zdarma Za peníze
Wave AI 30 minut měsíčně 10$ za 5h, 20$ bez limitů
Summie do 15 minut zdarma 69 minut měsíčně 10$ za 10h, 20$ za 25h, 0.025€ - 0.013€ za další minuty
Lugh na žádost autorovi 400 Kč s limitem délky schůzky 2700 minut či 700 Kč
MinutAI vše zdarma zatím nestanoven

Jak je to s kvalitou rozpoznávání?

Aplikace zjevně využívají jeden STT kromě Lugh. Jeho schopnost přepsat češtinu mi přišla nejhorší, záhy jsem ho přestal používat. Schopnost rozpoznat český hovor u ostatních aplikací mi přišla velmi podobná s tím, že nejlepší bylo subjektivně se zvukem pracuje filtrováním nejlépe Summie, pak MinutAI a mírně slabší Wave AI. Do jisté míry bylo zajímavé, jak se AI vyrovnala s překřikováním a situací, kdy lidi mluvili najednou. V zásadě vždy to AI nějak přepsala, ale v analýze potlačila, zřejmě pod dojmem toho, že taková pasáž nebyla důležitá a sloužila jen k ujasnění východisek, které byly později znovu řečeny ve větším klidu.

Bylo pro mě překvapující, že když jsem se u aplikace podíval do kompletního přepisu, ten mi nebyl příliš k užitku a prakticky nikdy jsem ho nepoužíval.

Dejme si dva příklady, jak aplikace vypadá po analýze zvuku: WaveAI vs. Summie

Wave AI a jeho zápis z porady o veřejném osvětlení.

Kličová probíraná témata z porady o stavbě nové základní školy v Summie.

A co schopnosti?

Aplikace s podporou češtiny jsou většinou dost jednoduché a umožní jen nahrání schůzky, její analýzu a export dat. Nejkomplexnější je Summie, to dokonce rozpoznává mluvčí a také se můžete expost doptat na to, co ze schůzky vyplývá. Rozpoznání mluvčího vypadá jako stěžejní funkce, ale nepřijde mi to tak podstatné v případě, že ze schůzky potřebujete hlavně zaznamenat závěry. Ty nezáleží na mluvčím. Pokud potřebujete zapisovat argumentaci, stejně budete potřebovat si zápis projít a pro jistotu zkontrolovat a doplnit, kdo je mluvčí kterého argumentu.

Aplikacím jsem mírně přizpůsobil průběh jednání - hlavně ve slovníku. Například v momentě, kdy se dohodneme na dalším postupu, pro jistotu ještě jednou zopakuje, že jsme si tedy dohodli další akční bod nebo úkol a zopakuji jej. Jenže ono to nepomáhá jen AI, ale i lidem na jednání.

Summie nově přidalo možnost záznam ze schůzky udělat v rapperské verzi, musím přiznat, že poprvé mě to docela šokovalo, protože jsem do toho zápisu koukal a nějak jsem nepobíral, o co jde.

Zatím to není tak, že zápis by byl zcela bezúdržbový. A ani není vhodný jako přepis jednání slovo od slova. Ale jako soupis důležitých řečených věcí to začíná fungovat velmi dobře a rozhodně se vyplatí to vyzkoušet.

Chcete tyto články emailem?

Twitter, Facebook