Tajemství dobrovolné lokalizace webového projektu
Google jistě není třeba nikomu představovat. Tento webový projekt má i svou českou lokalizaci. Zajímalo mne tedy, jak k ní přišel a přitom jsem zjistil, že se nechal inspirovat. Podívejme se tedy za oponu lokalizace dvou zajímavých projektů.
Řada uživatelů Google je při první návštěvě tohoto serveru překvapena, že se jim zobrazí úvodí stránka v jejich mateřském jazyce. U služby, za jejíž tvorbou stojí tým sídlící v USA, je to opravdu s podivem. Také já jsem byl překvapen a tak jsem zapátral po příčinách. Má snaha mne dovedla na stránky služby Google Translation Project (dále jen GTP). Právě GTP stojí za veškerými lokalizačními aktivitami Google.
Dobrovolnosti se meze nekladou
Princip celé služby je velice jednoduchý. Programátoři z Google vyvinuli webové rozhraní, s jehož pomocí mohou veškerá hlášení jednotlivých služeb překládat dobrovolnící. Stačí se tak zaregistrovat jako dobrovolný lokalizátor a během několika málo minut obdržíte přístupová práva do systému GTP. Na lokalizaci může současně pracovat (a v případě češtiny pracuje) více lidí, což systém umí sladit. K překladu z angličtiny vám tedy budou nabídnuty pouze ty věty, které ještě přeloženy nejsou. V rozhraní budete mít vytvořený i svůj profil, díky čemuž se můžete vracet k již přeloženým větám a v případě potřeby je i opravovat. Pracovní prostředí GTP přibližuje následující obrázek:
Kooperace má i svá negativa. Angličtina je jazyk, ve kterém má řada slov více významů a tak by je každý lokalizátor mohl přeložit po svém. Pro tyto účely řada vět, jež jsou nabídnuty pro překlad, obsahuje speciální řetězce (konstanty). Ty nahrazují buď dynamicky generované řetězce (např. URL) nebo právě pojmy, které před námi přeložil už někdo jiný, a které se vyskytují ve větším počtu vět. Tím je docíleno potřebné konzistence překladu – často se opakující slova jsou přeloženy stejně.
Potenciální zdroj chyb představuje také samotná kvalita překladu. Dle sdělení Google má však společnost dostatečně široký okruh spolehlivých a prověřených lokalizátorů, kteří „bdí“ nad kvalitou výsledného překladu. Osobně si však myslím, že ve skutečnosti spoléhá – zejména u exotičtějších jazyků – na dobrovolné lokalizátory.
Pro komunikaci s ostatními lokalizátory lze využít integrované diskusní fórum, k jehož prohledávání slouží opět jedna ze služeb Google: Groups. Už při jeho letmém prohlédnutí budete jistě překvapeni, s jakými exotickými jazyky se lokalizátoři potýkají.
Google nebyl první
I když byste po přečtení předcházejícíh řádku mohli získat dojem, že autorem myšlenky lokalizace jako aktivity dobrovolníků je společnost Google, ve skutečnosti tomu tak není. Pokud se budeme chtít dopídit pravého autora tohoto konceptu, musíme zapátrat trochu do historie. Pak bychom zjistili, že na počátku tohoto projektu byla spolupráce se společností Weather Underground, která s myšlenkou dobrovolné lokalizace přišla dříve. Do té doby se Google řídilo klasickým modelem, kdy za každý překlad lokalizátorům platilo.
Pokud na stránky Weather Underground zavítáte dnes , tak vás – podobně jako u Google – přivítá čeština, resp. si ji můžete vybrat ze seznamu nabízených jazyků. Autorem české lokalizace je Zdeněk Haft, od nějž se mi podařilo získat informace o tom, jak před pěti lety probíhal překlad této služby. Vzhledem k tomu, že si v této době o luxusním prostředí GTK mohli nechat lokalizátoři jen zdát, probíhal proces lokalizace výhradně prostřednictvím e-mailu. Správce Weather Underground pak přeložené fráze ručně integroval do systému. Jedno však zůstalo stejné – i tehdy vše pan Haft přeložil bez nároku na honorář.
Technické pozadí
Při hledání informací o GTK mi pomáhal pan Li Moore, který je hlavním koordinátorem procesu lokalizace ve společnosti Google. Dle jeho informací probíhal vývoj této služby dva roky, použit byl (v naší zeměpisých šířkách zatím stále nedoceněný) jazyk Python. Vývojářský tým byl vcelku malý – tvořili jej údajně dva nebo tři lidé, dle potřeby a dle aktuálního vytížení v jiných odděleních. Samotná služba byla spuštěna v lednu 2001 a od té doby se do systému zaregistrovalo přes 7 000 dobrovolných lokalizátorů. Našince pak potěší, že právě Češi jsou prý jedni z nejaktivnějších. Ostatně, stačí se zaregistrovat a zjistíte, že vyjma dokumentace jsou přeloženy veškeré možné moduly, včetně lišty (Google Toolbar).
V současné době se lokalizační tým potýká především s problematikou exotických jazyků. Do GTP totiž nebyla původně zahrnuta podpora kódování UTF-8, což nyní chtějí autoři změnit, právě z důvodu překladu do zmíněných jazyků. Další problém pak představuje fakt, že každý lokalizátorů má svůj osobitý styl a tak přeložený celek mnohdy nepůsobí konzistentním dojmem.
Závěrem bych rád poděkoval zástupcům společností provozujících Google a Weather Underground za poskytnutí informací a předeším všem uživatelům jejich služeb, kteří se na lokalizacích podíleli. A vás, čtenáře Intervalu, vyzývám: pokud disponujte potřebnými jazykovými znalostmi, připojte se i vy!
Starší komentáře ke článku
Pokud máte zájem o starší komentáře k tomuto článku, naleznete je zde.
Mohlo by vás také zajímat
-
AI v programování: Jak používat GitHub Copilot (část 2)
19. února 2024 -
Co je to DNSSEC, jak funguje a jak si ho nastavit?
14. srpna 2024 -
AI a internetové podvody
29. října 2024
Nejnovější
-
Windows App: Pracujte odkudkoliv, kdykoliv
3. listopadu 2024 -
Od iPhonu po Android: Ultra HDR přináší nový standard fotografií
1. listopadu 2024 -
AI a internetové podvody
29. října 2024 -
Užitečné nástroje pro bezpečnost na internetu
17. října 2024