V súčasnom svete, kde digitalizácia mení každodenný život, sa čoraz viac funkcií prenáša na umelú inteligenciu. Tento článok sa zaoberá otázkou efektivity nahrádzania ľudskej činnosti počítačovou pri preklade, konkrétne s dôrazom na prácu a výskum Kataríny Welnitzovej v oblasti strojového prekladu (MT) do slovenčiny.
V súčasnosti je prekladateľský priemysel obmedzený rôznymi faktormi, ako je rýchlo sa meniaca spoločnosť, stratégie na úsporu času a finančné náklady, preto sa používanie tlačených slovníkov považuje za zastarané. Prekladatelia prijímajú efektívne nástroje, ako sú nástroje na počítačom podporovaný preklad (CAT) (napr. softvér na správu prekladových pamätí, lingvistické vyhľadávacie nástroje alebo softvér na správu terminológie) alebo systémy strojového prekladu (MT). Výstupy strojového prekladu dokážu sprostredkovať základné informácie alebo význam prekladu; naopak, neposkytujú používateľovi bezchybné texty. Na získanie správnych a logicky usporiadaných textov je potrebné výstupy MT následne post-editovať človekom.
Pri zvažovaní ľudského aj strojového prekladu je potrebné diskutovať hlavný princíp prekladu, ktorým je dekódovanie významu zdrojového textu do cieľového textu. Okrem gramatických, t. j. syntaktických a sémantických pravidiel charakteristických pre oba jazyky, musí mať prekladateľ zvládnuté výnimky, idiomatické výrazy, dialektové a slangové slová. Situácia so strojovým prekladom je oveľa komplikovanejšia. Napriek rozsiahlemu slovníku, gramatickým pravidlám a schopnosti prekladať zrozumiteľne, systém MT stále nie je dostatočne trénovaný na prenos významu textu. Aby sa zabezpečil úspešný prenos, je dôležité vyhodnotiť aplikáciu strojového prekladu pre konkrétny typ textu. Súčasné systémy strojového prekladu dokážu používateľovi poskytnúť preložené výstupy prijateľnej kvality, napr. technické dokumenty, športové súhrny, predpovede počasia, návody na použitie, pretože ich slovná zásoba je obmedzená.
Podľa Munkovej a Munka (2016, s. 21) sa systémy MT snažia pokryť všetky jazykové aspekty a získať výstup MT vyššej kvality. Zdrojový text a jeho preklad musia spĺňať rovnaké kritériá textu. Okrem toho musí preklad spĺňať požiadavky na ekvivalenciu medzi zdrojovým a cieľovým textom. Munková a Munk (2016, s. 63) tvrdia, že požiadavka na ekvivalenciu alebo zhodu sa líši od sekundárnych preložených textov (nepriamych prekladov) v zdrojovom jazyku; ekvivalencia je chápaná ako zodpovedanie zdrojového textu textu v inom jazyku.
Hlavným faktorom hodnotenia kvality je „surový“ výstup MT. Predpokladajú tiež, že na získanie prekladu štandardnej kvality je kvalita strojovo preloženého výstupu daná počtom požadovaných opráv. Metóda priamo hodnotí preložený výstup z hľadiska času potrebného na jeho revíziu (post-editing).
Melby et al. (2014, s. 279) tvrdia, že: [n]avrhovaný rámec pozostáva z novej a univerzálnej definície kvality prekladu, nedávno publikovaného systematického spôsobu konštruovania špecifikácií prekladu, ktoré sú kľúčové pre túto definíciu, a dvoch typov metrík kvality prekladu založených na tejto definícii a systéme špecifikácií: prístup rubrík na posúdenie výsledku úlohy post-editácie a prístup kategórií chýb na posúdenie kvality prekladu, či už ide o ľudský, strojový alebo post-editovaný preklad.
Výskum Kataríny Welnitzovej a jej publikácie
Práca Kataríny Welnitzovej sa zameriava na rôzne aspekty prekladu a strojového prekladu, pričom venuje pozornosť aj lingvistickým charakteristikám anglického a slovenského jazyka.
Podľa Svobodu (2015, s. 247) sa problém strojového prekladu môže diskutovať z hľadiska procesu, produktu, používateľa, účelu a zhodnosti s normami. Podľa Munkovej (2013, s. 22) ďalšie významné faktory ovplyvňujúce počet opráv výstupu MT sú: čas editácie, čitateľnosť, zrozumiteľnosť, významnosť textu MT a porozumenie zdrojovému textu. Na odstránenie nejednoznačných slov a polysémie a na zjednodušenie štruktúr viet prekladateľ edituje text pred prekladovým procesom (pre-editing), po prekladovom procese (post-editing) alebo počas kontroly kvality.
Post-editing predstavuje kľúčovú súčasť procesu MT. V tejto fáze profesionálni prekladatelia alebo lingvisti kontrolujú výstup MT a opravujú sémantické a gramatické chyby v texte. Cieľom pre-editácie a post-editácie je dosiahnuť maximálnu efektívnosť a vysokú kvalitu MT.
Čulo et al. (2014, s. 201) tvrdia, že [s]peciálnym typom revízie prekladu je prípad post-editácie výstupu MT. Strojový preklad je stále dosť náchylný na chyby a predstavuje veľmi špecifické problémy, pretože niekedy môže „zasiahnuť klinec po hlavičke“, ale v iných prípadoch môže úplne zlyhať pri preklade jednoduchého slova. Úloha post-editácie výstupu MT je nasledovná:
- zabezpečiť rovnaký význam v oboch výstupoch MT a ľudskom preklade;
- dosiahnuť rovnakú zrozumiteľnosť v oboch prekladoch - strojovom a ľudskom;
- zabezpečiť jasné interpunkčné znamienka - vety začínajúce veľkým písmenom a končiace bodkou, zachytiť význam s minimálnymi opravami (nie je potrebné upravovať slová a slovné spojenia vo výstupe MT, ak sú prijateľné).
Munková a Munk (2016, s. 86) tvrdia, že úlohou prekladateľa je opraviť výstup MT na úroveň prijateľnosti z hľadiska kvality. Čas post-editácie je daný faktormi, ako je pracovné miesto, koncentrácia a tolerancia miery chybovosti.
Prunč (2007, s. 31) uvádza, že [n]ajzákladnejší výstup MT vytvorený v raných rokoch pomohol rozvinúť preklad ako vedu, pretože dokázal, že prenos medzi dvoma jazykmi je oveľa zložitejší, ako sa predpokladalo. Post-editing sa dostal do popredia ako efektívnejšia a nákladovo efektívnejšia metóda prekladu, zatiaľ čo trend globalizácie odráža rastúci dopyt po prekladateľských službách. Post-editing strojového prekladu (PEMT) sa pravdepodobne stane všeobecne akceptovanou, samostatnou súčasťou prekladateľskej krajiny.
Rozlišujú sa dva hlavné typy post-editácie: „ľahký post-editing“ a „plný post-editing“ (s dôrazom na štylistiku). V rámci ľahkého post-editingu je cieľom prekladateľa poskytnúť jednoduchý a zrozumiteľný výstup MT s minimálnymi opravami. Tento druh prekladu sa väčšinou používa na osobné účely, a tiež vtedy, keď je potrebný rýchly preklad. Plný post-editing vyžaduje viac opráv a poskytuje preklad vyššej kvality. Plne post-editovaný výstup MT je vysoko zrozumiteľný a štylisticky úhľadný preložený text, ktorý sa dá použiť na externé účely, pretože je publikovateľnej kvality (TAUS, 2010a, 2010b).

Existuje mnoho štúdií zaoberajúcich sa efektívnosťou post-editácie (Koponen, Salmi, 2015; Aranberri et al., 2014; Guerberof, 2014; Zhechev, 2014; Carl, Kay, 2011; García, 2010; Popović et al., 2014). Mnohé z nich dokazujú, že post-editing je vo všeobecnosti rýchlejší proces ako ľudský preklad. Otázkou je, ako úsporný je post-editing v reálnej situácii. Niektoré prekladateľské agentúry naznačujú, že šetrí až 40 percent; vedci tvrdia, že je to len 20 percent. Napriek rozdielnym názorom klienti väčšinou preferujú post-editing pred ľudským prekladom kvôli nízkym nákladom (Plitt, Masselot, 2010). Rastúci dopyt po službách post-editácie zvyšuje aj dopyt po vyškolených post-editoroch.
Strojový preklad predstavuje efektívny a lacnejší nástroj pri preklade veľkého objemu textov. MT je prijímaný a používaný viac prekladateľmi a prekladateľskými agentúrami, ktoré sa prostredníctvom MT stávajú efektívnejšími, rýchlejšími a žiadanými. Strojový preklad nemá ambície nahradiť ľudský preklad; predstavuje efektívnejší proces kombinujúci editáciu, modifikáciu a korekciu výstupu MT (Munková, Munk, 2016; O’Brien et al., 2014).
Typologické charakteristiky anglického a slovenského jazyka
Anglický jazyk je považovaný za analytický jazyk, zatiaľ čo slovenčina je syntetický jazyk (tiež flexívny alebo fletívny) (Vaňko, 2015, s. 24). Podľa Vaňka (2015) sa gramatický význam v analytických jazykoch odráža analyticky - t. j. špecifickými slovesami - jedno nesie lexikálny význam a druhé pomocný alebo gramatický význam. Anglická forma „he did not write“ má slovenský ekvivalent „nepísal“ a anglická forma „they will not go“ slovenskú formu „nepôjdu“. Nízky stupeň ohýbania hlavných slovies v angličtine koreluje s relatívne vysokým počtom viac slovných spojení. Analytické jazyky napr. neodrážajú rozdiely medzi nominatívom a akuzatívom podľa tvarov; slovosled v takýchto jazykoch je pevne stanovený. V angličtine existuje len jeden spôsob, ako vyjadriť význam „Peter ľúbi Evu“, zatiaľ čo v slovenčine existujú dve možnosti: „Peter ľúbi Evu.“ a „Evu ľúbi Peter.“ Sufiksy „-0“ (nula, žiadny sufix) a „-u“ vlastných mien „Peter-0“, „Ev-u“ naznačujú, ktorá osoba preberá úlohu podmetu („Peter“) a predmetu („Ev-u“). Osobné zámená používané na pozíciách podmetov sú povinné, pretože naznačujú gramatický význam osoby (kvôli nízkemu stupňu ohýbania slovies): „I go“ (anglicky), „chodím“ nie „ja chodím“ (slovensky) (Dolník, 2013, s. 92).
Podľa Ondruša a Sabola (1984, s. 186) sa slovenský jazyk preferenčne charakterizuje syntetickou morfológiou. Je daná početnými tvarmi a morfémy, alebo derivačnými afixami, ktoré vyjadrujú rôzne gramatické kategórie (napr. rod, číslo, pád) preferenčne jedným formálnym znakom. Napríklad morféma -u vo forme „žen-u“ („žena“) odráža ženský rod, jednotné číslo a akuzatívny pád. Syntetické jazyky sa vyznačujú synonymiou a homonymiou pádsufixov. Vaňko (2015, s. 27) vysvetľuje, že gramatický význam sa vyjadruje flekciou, t. j. sufixmi (napr. „knih-a“, „knih-y“ - „kniha“, „knihy“). Sufix môže rozlišovať gramatické významy daného slova, napr. tvar „ruk-e“ - „ruke“ alebo „o ruke“ - ako datív alebo lokatív. Ďalej sa slovenčina vyznačuje početnými slovesnými vzormi (14) a rovnakými sufixmi na vyjadrenie osoby a čísla v prítomnom indikatívnom tvare pomocou (napr. sufix „-m“: číta-m, robí-m - „čítam, robím“). Viac podrobností nájdete v práci Welnitzovej (2020).
Právne texty a strojový preklad
Administratívny štýl je rozlíšiteľný v textoch úradnej komunikácie, ako je príkladom Trestný zákon Národnej rady Slovenskej republiky. Text a jeho preklady sú diskutované v prvej časti nášho výskumu. Na základe Kollerovej teórie prekladu založenej na adekvátnosti, ekvivalencii a lingvistickom prístupe právne texty patria do skupiny faktických textov. Funkcia skúmaného zdrojového textu je predovšetkým informatívna; jeho cieľom je prenos informácií medzi profesionálmi v rovnakom odbore (Ďuricová, 2013, s. 34).
Schneiderová (2013, s. 97) tvrdí, že preklad právnych textov patrí medzi najstaršie a najdôležitejšie preklady na svete. Takéto texty sa vyznačujú špecifickým znením a terminológiou. Pri preklade je najdôležitejšou úlohou preniesť význam zo zdrojového jazyka do cieľového jazyka s dôrazom na text ako celok.
Gromová a Müglová (2005, s. 90-91) navrhujú, že pri preklade právnych textov musia prekladatelia zohľadniť koncept jednotného právneho systému. Keď právna terminológia cieľového jazyka neposkytuje prekladateľovi adekvátny termín, hľadajú sa iné prekladové riešenia, väčšinou slovné ekvivalenty.
Skúmaný text má primárne informatívnu funkciu, t. j. zdôrazňuje obsah a informácie. Müglová (2009, s. 218) tvrdí, že texty s prevažne informatívnou funkciou sú štruktúrované na semo-syntaktickej úrovni. Cieľom prekladu je preniesť celkový a kompletný obsah s ohľadom na dominantné štandardy kultúry čitateľa (Azizi et al., 2020; Khonamri et al., 2020). Niektorí translatológovia predpokladajú, že texty zákonov a zmlúv sa plne neaplikujú na informatívnu funkciu (Ďuricová, 2013). Newmark (1982, s. 13-15) považuje nariadenia a zákony za konatívne, t. j. vokativné texty. Z hľadiska právneho jazyka existujú dve funkcie jazyka: informatívna a regulačná, t. j. deskriptívna a preskriptívna z hľadiska právnej terminológie. Zákony, kódexy, zmluvy a právne predpisy sú právne texty s prevažne preskriptívnou funkciou (Bocquet, 1994, s. 2).
Spätný preklad a hodnotenie kvality
Spätný preklad - preklad preloženého textu späť do jeho pôvodného jazyka - sa používal predovšetkým ako nástroj na hodnotenie kvality prekladu a štandardný prekladový postup (Dept et al., 2017; Harkness et al., 2010). Široko sa používal na to, aby výskumníci mohli usudzovať o kvalite prekladu (Brislin, 1970, 1984) alebo aby ukázali rozsah ekvivalencie medzi zdrojovým a cieľovým textom (Chidlow et al., 2014). Jeho účelom je hodnotiť kvalitu prekladu porovnaním spätného prekladu so zdrojovým textom (Harkness, Schoua-Glusberg, 1998).
Son (2018) navrhuje použiť spätný preklad nie ako nástroj na hodnotenie kvality prekladu, ale ako dokumentačný nástroj. Spätný preklad potom môže podporiť vysvetľujúci prozaický opis zdôvodnenia prekladových rozhodnutí a ukázať rozdiely medzi zdrojovým textom a prekladom alebo medzi rôznymi preloženými verziami toho istého textu. Prístup nie je určený na kontrolu kvality prekladu, ale namiesto toho na zlepšenie dokumentácie prekladových rozhodnutí a tiež na podporu harmonizácie prekladov medzi jazykmi.

Podľa Munkovej a Munka (2016, s. 75) hodnotenie kvality strojového prekladu zohľadňuje ako kvalitu strojového prekladu, tak aj spokojnosť používateľa. V súčasnosti existujú rôzne modely a prístupy k hodnoteniu MT. Najpopulárnejší je Whiteov model (2003), ktorý sa zameriava na uskutočniteľnosť, vnútorné hodnotenie, deklaratívne hodnotenie, použiteľnosť, operačné hodnotenie a porovnanie.
Melby et al. (2014, s. 287) uvádzajú dva základné prístupy: „prístup počítania chýb“ (alebo analytický prístup, pretože vyjadruje množstvo a frekvenciu v percentách), ktorý pracuje na určení chýb a ich množstva, a „prístup rubrík“, pri ktorom post-editori hodnotia preklad na škále 1-5 (1 znamená, že preklad nespĺňa požiadavky; 5 znamená, že spĺňa požiadavky vo všetkých kategóriách).
Keďže neexistuje špeciálna typológia chýb na hodnotenie a meranie kvality prekladu pre jazyky ako slovenčina (syntetický jazyk s mnohými flektívnymi morfémami) a iné existujúce metódy hodnotenia neposkytujú komplexnú typológiu chýb...
Výskum a publikácie týkajúce sa Kataríny Welnitzovej
Katarína Welnitzová sa vo svojom výskume venuje aj otázkam ako sú:
- Product and Process Analysis of Machine Translation into the Inflectional Language (2021)
- A human evaluation of English-Slovak machine translation (2022)
- Sentence-structure errors of machine translation into Slovak (2021)
- Chybovosť strojového prekladu (2023)
- Texty na nácvik konzekutívneho tlmočenia a využitie strojového prekladu pri príprave tlmočníka (2021)
- Human-Computer Interaction in Translation Activity: Fluency of Machine Translation (2021)
Tieto publikácie poukazujú na jej záujem o analýzu kvality strojového prekladu, identifikáciu typov chýb a ich súvislosť s typologickými rozdielmi medzi jazykmi, ako aj na praktické využitie MT v prekladateľskej praxi a vzdelávaní.

tags: #katarina #welnitzova #ukf