Představte si, že mluvíte s cizincem, ale místo robotického hlasu z mobilu slyšíte plynulý překlad přímo ve sluchátku. Navíc s intonací a barvou hlasu původního řečníka. Google překladač právě spustil technologii, která definitivně boří jazykové bariéry. Strojový překlad u Googlu letos slaví pomyslné dvacetiny a firma se chlubí, že její produkty dnes přeloží přes bilion slov měsíčně. Nový audio model Gemini 3.5 Live Translate má ale ambici posunout celou disciplínu o úroveň výš. Zapomeňte na dosavadní překládání textu a nepohodlný koncept, kdy musíte říct větu, počkat na zpracování a následně přehrát výsledek. Google přechází k plynulému simultánnímu tlumočení, jaké známe od profesionálů.
Nový model zvládá překlad mluvené řeči prakticky v reálném čase, a to ve více než 70 jazycích. Na rozdíl od starších řešení nečeká, až řečník zcela domluví. Překládá průběžně, drží se jen pár sekund za mluvčím a zachovává přitom jeho intonaci, tempo i výšku hlasu. Výsledný překlad zní zkrátka jako původní mluvčí. Klíčovou novinkou je průběžné generování řeči. Model neustále inteligentně vyvažuje, zda počkat na další kontext (a zlepšit tak kvalitu překladu), nebo překládat okamžitě a držet krok s řečníkem. Výsledkem je plynulý projev bez nepřirozených odmlk. Jazyk navíc není potřeba ručně nastavovat. Model si přes 70 řečí detekuje sám a bez problémů si poradí i s vícejazyčnou konverzací nebo hlučným prostředím.
V novém „režimu poslechu“ stačí telefon jednoduše přiložit k uchu, jako byste s někým běžně telefonovali. Překlad pak slyšíte diskrétně přímo ze sluchátka telefonu, což zcela mění dynamiku osobní komunikace v cizím prostředí. Žádné natahování ruky s displejem před obličej cizího člověka. Novinka se postupně dostane také do videohovorů v Google Meet. Tam dorazí překlad řeči nejprve v rámci privátního testování pro vybrané firemní zákazníky Google Workspace, širší nasazení Google slibuje později v průběhu roku. Vývojářům je model k dispozici přes Gemini Live API. Mezi prvními ho testuje například asijská přepravní platforma Grab pro komunikaci mezi řidiči a cestujícími – jen přes její aplikaci proběhne měsíčně přes 10 milionů hlasových hovorů. Vedení platformy si pochvaluje hlavně automatickou detekci jazyků a extrémně nízkou latenci.
Technologie, která dokáže mluvit cizím jazykem vaším vlastním hlasem, je samozřejmě dvojsečná zbraň. Aby se zamezilo šíření deepfakes a dezinformací, veškerý zvuk vygenerovaný modelem nese neslyšitelný digitální vodoznak SynthID. Ten umožňuje zpětné spolehlivé rozpoznání AI obsahu. Google tímto krokem výrazně přitvrzuje v konkurenčním souboji. Apple nedávno vsadil na živý překlad v AirPodech a Samsung masivně tlačí svého AI tlumočníka přímo do telefonů řady Galaxy. Novinka od Googlu však funguje v plné parádě i s češtinou a slovenčinou a kvalita překladu je podle našich prvních testů na špičkové úrovni. Výrobci jednoúčelových hardwarových překladačů to budou mít čím dál těžší.
Jak funkci okamžitě aktivovat?
- Aktualizujte si aplikaci Google Překladač v obchodu s aplikacemi (Google Play / App Store).
- Po otevření aplikace klepněte na ikonku „Konverzace“.
- Vyberte novou položku „Poslouchám“ a klikněte na „Zahájit“.
- Přiložte si telefon k uchu a začněte poslouchat okolí.
Podle našich prvních redakčních pokusů funguje funkce velmi spolehlivě a až překvapivě věrně napodobuje hlasy původních řečníků. Co na tuto sci-fi novinku říkáte vy? Podělte se s námi v diskuzi.
A v tomhle světě Siri neumí česky. Tristní
souhlasím, je to směšné
A Pixel který se jen směje
Zkusil jsem jakýsi jihokorejsky film v původním znění. Připadal jsem si jako v dobách videokazet a rychlodabingu.