Մեքենայական թարգմանություն

Ենթակատեգորիա	թարգմանություն, մաթեմատիկական լեզվաբանություն, Բնական լեզուների վերամշակում
Հետազոտվում է	Բնական լեզուների վերամշակում
Օգտագործող	machine translation software

Մեքենայական թարգմանություն, նորագույն տեխնոլոգիաների և համապատասխան ծրագրերի միջոցով որևէ լեզվի տեքստի թարգմանությունն է մեկ այլ լեզվի։

Մեքենայական թարգմանության համակարգը

Մեքենայական թարգմանությունը պետք է տարբերել համակարգչային ավտոմատ բառարանների ծրագրերի օգնությամբ թարգմանչի կատարած թարգմանությունից։ Վերջին դեպքում էլեկտրոնային բառարանը միայն օգնում է թարգմանչին բառային մակարդակում՝ արագ գտնելով մեկ այլ լեզվի համապատասխան բառային միավորը, իսկ թարգմանկան աշխատանքն ամբողջությամբ կատարում է մարդը։ Ի տարբերություն դրան՝ մեքենական թարգմանությունը կատարում է աշխատանքի մեծ մասը՝ ամբողջական տեքստի, նրա բոլոր մակարդակների թարգմանությունը՝ մարդուն թողնելով միայն ստուգումն ու սխալների ուղղումը։ Մեքենական թարգմանության 2 մոտեցումներն են

1. Ընդհանուր առմամբ վերարտադրել տեքստի բովանդակությունը,
2. Կատարել լիակատար թարգմանություն։

Առաջինի իրագործումն ավելի հեշտ է, և տեխնիկայի զարգացման ներկա պայմաններում կարելի է ապահովել տարեկան հարյուր հազար էջի թարգմանություն։ Այս միջոցով կարելի է թարգմանել տեխնիկական և գիտական բնույթի տեքստեր, բայց, բնականաբար, դժվար է իրականացնել գեղարվեստական տեքստի թարգմանությունը։ Երկրորդ խնդիրն ավելի դժվար իրագործելի է, և հաճախ պահանջում է մարդու միջամտությունը։ Մեքենական թարգմանության իրականացման համար կազմվում է հատուկ ծրագիր, որն իրականացնում է թարգմանության ալգորիթմը։ Թարգմանության ալգորիթմը տեքստի նկատմամբ միանշանակ և հստակ սահմանված գործողությունների հաջորդականությունն է։ Գործող մեքենական թարգմանության համակարգերի մեծ մասը նախատեսված է կոնկրետ զույգ լեզուների համար, թեպետ ներկայումս փորձեր են արվում ստեղծել 2ից ավելի լեզուների համար համակարգեր։ Համակարգը ներառում է մուտքային և ելքային լեզուների քերականությունների նկարագրությունը՝ երկլեզու բառարաններ, իմաստային, ձևաբանական և շարահյուսական համակարգեր։ Թարգմանության որակը կախված է բառարանի ծավալից, որակից, վերլուծության և համադրման ալգորիթմների ճշգրտությունից։ Ընդհանուր առմամբ մեքենական թարգմանությունը իրականացվում է 3 փուլով.

ա. վերլուծություն՝ մուտքային տեքստի ձևային նկարագրություն,
բ. փոխակերպում՝ մուտքային տեքստի լեզվական կառույցների ձևափոխում ելքային լեզվի կառույցների
գ. համադրություն՝ ելքային տեքստի կառուցում։

Ամեն դեպքում մարդու միջամտությունը այս գործընթացին անխուսափելի է։ Ներկայումս մեքենական թարգմանությունը իրականացվում է մարդու միջամտությամբ կամ նախնական խմբագրության /որևէ եղանակով նախապես մշակումէ թարգմանվող տեքստը/ կամ վերջնական խմբագրության /կատարված մեքենական տեքստի վերջնական խմբագրում/ձևով։

Մեքենական թարգմանության պատմությունը

Մեքենայական թարգմանության ծննդյան թիվը համարում են 1947 թ. մարտը, երբ ծածկագրության մասնագետ Ուորեն Ուիվերը Նորբերտ Վիներին ուղղված իր նամակում առաջին անգամ դրեց մեքենական թարգմանության խնդիրը։ Սակայն առաջին անգամ մեքենական թարգմանության գաղափարը առաջարկել են հայազգի ֆրանսիացի գյուտարար Գեորգի (Ժորժ) Արծրունին և նրանից անկախ սովետական գյուտարար Պ. Սմիրնով-Տրոյանսկին 1933 թ.։ Գեորգի Արծրունին արտոնագիր ստացավ իր ստեղծած «մեքենական ուղեղի» համար։ Թեև այդ սարքը կատարյալ չէր, բայց այն հաջողությամբ կարելի էր օգտագործել բառերի արագ թարգմանության, նախադասությունների մեջ բառերի ու բառակապակցությունների որոնման և նման այլ աշխատանքների համար։

Ուորեն Ուիվերը 1949 թ. մի շարք բանավեճերից հետո կազմեց հուշագիր, որտեղ տեսականորեն հիմնավորեց մեքենական թարգմանության համակարգերի ստեղծման հնարավորությունը։ Նրա գաղափարները հիմք դարձան մեքենական թարգմանության այնպիսի մոտեցման համար, որը հիմնված էր այսպես կոչված ՙինտերլինգվա՚ հայեցակարգի վրա, այսինքն՝ տեքստի իմաստի ներկայացումը անկախ լեզվից։ 1945 թ. IBM ընկերությունը Ջորջթաունի համալսարանի (ԱՄՆ) հետ համատեղ հաջողությամբ իրականացրեց մեքենական թարգմանության փորձ, որի ժամանակ համակարգը, օգտագործելով 250 բառից բաղկացած բառարան և 6 շարահյուսական կանոն, թարգմանեց 49 նախապես ընտրված նախադասություն։ Այդ փորձերից հետո ակտիվացան մեքենական թարգմանության ուղղությամբ տարվող աշխատանքները։ Նախկին Խորհրդային Միությունում մեքենական թարգմանության դարբնոցն էր ԽՍՀՄ ԳԱ մաթեմատիկայի ինստիտուտը (ներկայումս Ռուսաստանի ԳԱ Մ. Վ. Կելդիշի անվան կիրառական մաթեմատիկայի ինստիտուտը)։

1955 թ. Ա. Ա. Լյապունովի նախաձեռնությամբ տարվեցին աշխատանքներ անգլերենից և ֆրանսերենից ռուսերեն թարգմանության ուղղությամբ և առաջին ծրագրերը իրականացվեցին ՙՍտրելա՚ հաշվողական մեքենայի օգնությամբ։ 50-ական թվականների սկզբին արդեն ԱՄՆ-ում և Եվրոպայում մի շարք հետազոտական խմբեր աշխատում էին մեքենական թարգմանության բնագավառում։ Մեքենական թարգմանության աշխատանքները հովանավորվում էին ռազմական կազմակերպությունների կողմից՝ ԱՄՆ-ում ռուսերեն-անգլերեն, ԽՍՀՄ-ում՝ անգլերեն-ռուսերեն թարգմանությունների ուղղությամբ։ Այդ հետազոտությունների մեջ ներդրվել էին զգալի միջոցներ, սակայն արդյունքները շատ շուտ հիասթափեցրին։ Այդ տարիներին թարգմանության ցածր որակի պատճառներից էին սարքավորումների հնարավորությունների, հիշողության, արագագործության և ծրագրային միջոցների սահմանափակությունները։ Մյուս պատճառը՝ լեզվաբանական խնդիրների լուծման համար տեսական հիմունքների բացակայությունն էր, որի արդյունքում մեքենական թարգմանության առաջին համակարգերը թարգմանում էին տեքստերը բառ առ բառ, առանց որևէ շարահյուսական, առավել ևս՝ իմաստային ամբողջության։

Հետագայում՝ արդեն 60-ական թվականներին մեքենական թարգմանության համակարգերի մշակման համար սկսեցին լայնորեն օգտագործել ժամանակակից կառուցվածքային և մաթեմատիկական լեզվաբանության արդյունքերը։ Հիմնական ուշադրությունը դարձվեց մեքենական թարգմանության ընդհանուր կաղապարների մշակման և կատարելագործման վրա, որոնք կարող են կիրառվել ամենատարբեր լեզուների համար։ Այդ տարիներին մեքենական թարգմանության համակարգեր էին մշակվում ԱՄՆ-ում, Եվրոպայում, ԽՍՀՄ-ում, ճապոնիայում։

70-80-ականներին հաշվողական տեխնիկայի զարգացմանը զուգընթաց խթանվեց մեքենական թարգմանության համակարգերի ստեղծումը։ Այստեղ արդեն նպատակ էր դրվում ստեղծել մեքենական թարգմանության այնպիսի գործնական համակարգեր, որոնք ենթադրում էին մարդու մասնակցությունը թարգմանության գործընթացի տարբեր փուլերում։ Փաստորեն, մեքենական թարգմանության համակարգերը դառնում են թարգմանչի՝ ժամանակը և մարդկային ռեսուրսները խնայող օգնականը։ Այս տարիներին տարածում գտավ SYSTRAN ավտոմատ թարգմանության համակարգը, որը մշակվել էր ԱՄՆ ռազմաօդային ուժերի պատվերով։ Մեր ժամանակներում այն մեկ տարվա ընթացքում մոտավորապես 100 000 էջ թարգմանություններ է կատարում։ Եվրոպական համայնքների հանձնաժողովը գնում է SYSTRAN համակարգի անգլերեն-ֆրանսերեն տարբերակը, ինչպես նաև ռուսերեն-անգլերեն համակարգը, որը մշակվել էր ԱՄՆ-ում և օգտագործում էր ԱՄՆ-ի ռազմաօդային ուժերի և Հյուսիս ատլանտյան դաշինքի (NATO՝ North Atlantic Treaty Organization) կողմից։ Այս ամենից զատ Եվրոպական համայնքների խորհուրդը պատվիրում Է ֆրանսերեն-անգլերեն և իտալերեն-անգլերեն տարբերակների մշակումը, որի արդյունքում Էլ հիմք Է դրվում EUROTRA ծրագրի, որը հիմնված Է ֆրանսիական և գերմանական հետազոտական խմբերի մշակումների վրա։ Այդ նույն ժամանակահատվածում ճապոնիայում գործունեություն Է ծավալվում մեքենական թարգմանության համակարգերի ստեղծման ուղղությամբ։ Եվ այսպիսով, 70-80-ական թվականներին սկսված մի շարք ծրագրեր հետագայում զարգացան և դարձան լիարժեք առևտրային համակարգեր։

Նոր մշակումների թվին Է պատկանում TM (translation memory) տեխնոլոգիան, որն աշխատում է տվյալների կուտակման սկզբունքով, թարգմանության ընթացքում պահպանվում է ելակետային հատվածը և նրա թարգմանությունը, որի արդյունքում ստեղծվում է լեզվաբանական տվյալների շտեմարան։ Այնուհետև թարգմանիչը որոշում է ընդունում խմբագրել, մերժել կամ ընդունել թարգմանությունը, որի արդյունքը պահպանվում է համակարգի կողմից։ Ներկայումս TRADOS համակարգը հանդիսանում է TM տեխնոլոգիայի հիման վրա մեքենական թարգմանության հայտնի առևտրային ծրագրերի մշակողը։

90-ականները աչքի են ընկնում անհատական օգտագործման համակարգիչների և ինֆորմացիոն տեխնոլոգիաների բուռն զարգացմամբ, Internet ցանցի լայն օգտագործմամբ։ Այս ամենը հնարավոր դարձրեց մեքենական թարգմանության հետագա զարգացումը։ Ներկայումս մի քանի տասնյակ ընկերություններ ստեղծում են մեքենական թարգմանության առևտրային համակարգեր, որոնց թվում են՝ SYSTRAN, IBM, L&N, PROMT-ը։ 70-ականներից սկսած Եվրոխորհուրդը իր գործունեության մեջ օգտագործում Է մեքենական թարգմանության SYSTRAN համակարգը, որը SYSTRAN Software Inc. ընկերության արտադրանքն Է։ Սա զգալիորեն բարելավվել Է, անհամեմատ աճել են արագագործությունը, բառարանների ծավալը, և ավելացել Է թարգմանվող լեզուների քանակը։ Այս համակարգի իրական ուժն Է արագ կատարել փաստաթղթի առաջին նախնական թարգմանությունը, որը հետագայում կարող Է խմբագրվել մասնագետ թարգմանչի կողմի։ Սա նախատեսված Է Եվրոխորհրդի օրենսդրական և վարչական փաստաթղթերը թարգմանելու համար։ 90-ականներին, երբ Եվրոխորհրդի ներքին Էլեկտրոնային փոստի համակարգը դարձավ ավելի հզոր, համակարգի հեղինակությունը սկսեց զգալիորեն աճել։ Մասնագետները գնահատում են Էլեկտրոնային փոստի պատվիրատուի մեկ հարցման թարգմանության արագությունը մոտավորապես 10 րոպե։ Համակարգը շարունակում է զարգանալ և ներառել Եվրոխորհրդին անդամակցող երկրների նոր լեզուներ՝ լեհերեն, չեխերեն և այլն։

Մեքենայական թարգմանությունները Հայաստանում

1960-ական թվականներին մեքենական թարգմանությունը սկսեց զարգանալ նաև Հայաստանում։ Երևանի պետական համալսարանում բացվեց մեքենական թարգմանության բաժին, որը մի քանի տարի բարձրորակ մասնագետներ պատրաստեց մեքենական թարգմանության ուղղությամբ։ Այդ բոլոր աշխատանքները տարվում էին տեխնիկական ու մաթեմատիկական ինստիտուտներում։ Նույն տարիներին պրոֆեսոր Վ. Գրիգորյանի ղեկավարությամբ աշխատանքներ տարվեցին ՀՀ ԳԱԱ ինֆորմատիկայի, ծրագրավորման և ավտոմատացման ինստիտուտում։ Այն ժամանակվա հաշվողական մեքենաները էապես տարբերվում էին ժամանակակից մեքենաներից, որն էլ, բնականաբար, չէր կարող չանդրադառնալ կատարվող աշխատանքների ծավալների ու արդյունավետության վրա։ Մեքենաները չափազանց մեծ էին ու թանկարժեք։ Դրանց տեղադրման համար պահանջվում էին հսկայական դահլիճներ, իսկ սպասարկման համար՝ բազմաթիվ ինժեներներ, ծրագրավորողներ և օպերատորներ, այս ամենից զատ մեքենաները բոլորովին հարմար չէին տեքստային ինֆորմացիա մշակելու համար, քանի որ գոյություն չուներ տեքստային ինֆորմացիա ներածելու և արտածելու հնարավորություն, տրամաբանական գործողությունների կատարման համար մշակված միջոցներ, այլ կոչված էին միայն ինժեներատեխնիկական ու մաթեմատիկական բնույթի խնդիրներ լուծելու համար։

Մեքենական թարգմանության առաջին սերնդի համակարգերում տեղադրված էին հաջորդական սկզբունքով աշխատող ալգորիթմներ։ Տեքստերը թարգմանվում էին առանձին նախադասություններով՝ հաշվի չառնելով դրանց միջև գոյություն ունեցող իմաստային կապերը։ Իսկ հաջորդ սերնդի համակարգերը ներառում էին ալգորիթմներ, որոնք իրականացնում էին նախադասության շարահյուսական վերլուծություն և համադրություն։ Հայ գիտնականները փորձով ապացուցեցին, որ սկզբունքորեն նոր կառուցվածքի մեքենաներ են անհրաժեշտ մեքենական թարգմանության իրականացման համար։ Առաջարկված տեսակետը գիտականորեն հիմնավորելուց հետո սկսվեցին ՙԳառնի՚ թարգմանական մեքենայի նախագծման ու կառուցման աշխատանքները։ Աշխատանքները հաջողությամբ պսակվեցին, որի համար էլ 1967 թ. ՀՀ ԳԱ հաշվողական կենտրոնի մի խումբ գիտաշխատողներ գյուտարարության համար արտոնագիր ստացան։ ՙԳառնի՚ թարգմանական մեքենան նախատեսված էր ռուսերեն մաթեմատիկական տեքստերի հայերեն թարգմանության համար։ Եթե մեքենական թարգմանությունը բնութագրվում է երեք մակարդակով՝ բառային, կառուցվածքային և իմաստային, ապա հայ գիտնականների կողմից մշակված թարգմանական ալգորիթմը, համապատասխանելով կառուցվածքային մակարդակին, բարձր գնահատվեց արտասահմանյան գիտնականների կողմից։ Մեքենական թարգմանության մեջ անգնահատելի դեր ունեն մեքենական բառարանները, որը հայ գիտնականները քաջ էին գիտակցում, բայց գոյություն ունեցող հայերենի բառարանները բավարար չէին մեքենական թարգմանության նպատակներին ծառայող համապատասխան բառարան ստեղծելու համար։ Անհրաժեշտ էր հայերենի հանգաբառարան, որտեղ բառերը դասավորված լինեին հակադարձ այբբենական կարգով և 1976 թ. հրատարակվեց իր բնույթի մեջ եզակի ՙՀայոց լեզվի հանգաբառարան՚ ։

Հայ գիտնականների հաջողությունները մեքենական թարգմանության բնագավառում հիմք դարձան ստեղծելու հայ և ռուս մասնագետների միացյալ խումբ և նրանց հանձնարելու իմաստային մակարդակի անգլերեն-ռուսերեն թարգմանության ալգորիթմի մշակումը։ Միևնույն ժամանակ ռազմաարդյունաբերական հանձնաժողովի հետ կնքվեց համապատասխան պայմանագիր, Մոսկվայում պաշտպանվեց իրականացման ծրագիրը, բայց և այնպես մի շարք կառուցվածքային փոփոխությունների պատճառով սկսած գործը ավարտին չհասավ։

Գրականություն

Ա. Մանուկյան, Ա. Սարգսյան, Ռ. Ուռուտյան, Ինֆորմացիոն տեխնոլոգիաների կիրառությունը լեզվաբանության մեջ, Երևան, 2004 թ.։

Տես նաև

Արաղը լավն է, բայց միսը նեխած է

Արտաքին հղումներ

Գուգլ թարգմանիչ