Leihoak Zabalduz. Windows95 euskaratua, hizkuntza makinen bidez lantzeko tresna berriak... Informatikaren eta euskararen arteko muga esploratu gabeetan barrena abiatu gara

Wikitekatik
Jump to navigation Jump to search
Leihoak Zabalduz. Windows95 euskaratua, hizkuntza makinen bidez lantzeko tresna berriak... Informatikaren eta euskararen arteko muga esploratu gabeetan barrena abiatu gara (1995-12-24)  Luistxo Fernandez, edited by Euskaldunon Egunkaria
Igandeko KZ
Jatorria
Lore Azkarate, Windows95 euskaratzeko proiektuaren zuzendaria. Euskaldunon Egunkaria (1995-12-24)
Bill Gates bere programa kuttuna aurkezten abuztu amaieran. Euskaldunon Egunkaria (1995-12-24)
Windows95ko euskaratuaren menu nagusiaren pantailatik ateratako irudi bat Euskaldunon Egunkaria (1995-12-24)
Miriam Urkia filologoa eta Iñaki Alegria informatikaria. (Euskaldunon Egunkaria, 1995-12-24)

Leihoak Zabalduz

Windows 95 euskaratua, hizkuntza makinen bidez lantzeko tresna berriak... Informatikaren eta euskararen arteko muga esploratu gabeetan barrena abiatu gara


Abendu hasieratik prest dago Windows 95 programaren euskarazko bertsioa. 1996 iritsi baino lehenago zen aurkeztekoa, izenak berak eskatzen duenez, baina urtarrilera atzeratu da azkenean. Atzerapena ez da euskaratu dutenena, Microsoft etxearena baizik, produkzio prozesuan baitute programa informatiko euskaratua Irlandako beren lantegietan.

EAEko Hizkuntza Politikarako Sailordetzak (HPS, lehengo HPIN) enkargatutako lan bat da Windows euskaratua. Eusko Jaurlaritzako Informatika Enpresaren bitartez (EJIE), UZEIri iritsi zitzaion proiektua, eta erakunde honek egin du lana Microsoft enpresarekin, Windows 95en jabearekin. Microsoften buru, piramidearen gailurrean, Bill Gates dago, 39 urteko eta ume aurpegiko informatikaria, munduko gizonik aberatsena. Ba ote daki Gates guztiz ahaltsuak bere seme kuttunena, Windows, euskaratu egin dutela? Auskalo, beste 55 hizkuntzatara ere moldatu dute, eta akaso zerrenda edukiko du nonbait, bulegoko paperen batean edo, seguru asko, ordenadoreko fitxategiren batean.

Eusko Jaurlaritzak ordaindu du lana, baina emaitza Microsoften jabetzakoa da. Hori bai, ordainetan, EAEko instituzioek erositako Windows 95 bakoitzari, doan erantsiko dio euskarazko bertsioa Microsoftek. Munduko gizon aberatsenaren mesedetan egindako lana ote da, hortaz? “Bill Gates eta edozein enpresariren helburua dirua irabaztea da", azaldu digu HPSko Jokin Azkuek, “baina gu ez bagara beste hizkuntzen mailan jartzen, boligrafo eta paperean geratzen bagara, normalizazioaren ikuspegitik ez goaz inora”.

Windows ez da bide horretan emandako lehenbiziko urratsa. Lehenago, Word 6.0 programaren euskaratzea etorri zen. Microsoft etxearen testu editorea da Word (idazteko programa), merkatuko erabilienetakoa da, eta euskarazko bertsioan Xuxen zuzentzailea gehitu zaio (ikus aurrerago). Orain artekoa, berez, urrats garrantzitsua iruditzen zaio Jokin Azkueri. “Software modernoenarekin egin dugu lehenbiziko saiakera hau”.

UZElren esku egon da euskaratze-lana. Unibertsitate Zerbitzuetarako Euskal Ikastetxea da UZEI; hiztegigintza-lanagatik da ezaguna, batez ere, baina beste proiektu batzuk ere bultzatu ditu, hala nola Euskalterm, ordenadorez euren hiztegietako datu-baseak urrutitik kontsultatzeko sistema. Elkarteak Donostian duen egoitzan, Lore Azkaratek kudeatu du Windows95en gaineko lana. Enpresa-ikasketak egin ondoren sartu zen Azkarate UZEIn, eta, hiztegigintzan jardun ondoren, Word eta Windowseko egitasmoen zuzendaria izan da aurten.

Lokalizazioa, Microsoft etxearen arabera[aldatu]

Microsoftek hasieratik puntu bat azpimarratu zuen lana bideratzeko: ez zen itzulpena egin behar, lokalizazioa baizik. Beren asmoa ez omen da hizkuntza batera moldatzea, hizkuntza horren ingurunera egokitzea baizik, programa osoa herri horretan egina balitz bezala. Horren ondorioa da, adibidez, Xuxen zuzentzailea gehitzea Word programan.

Hala ere, praktikan, Microsoftek itzulpen-lan soila planteatu du, batez ere. Itzuli beharreko sarrera eta testu-atalen zerrenda luze bat pasatu zieten UZElkoei, eta milaka testu solte aurkitu dituzte euskaratzaileek, bat bestearekin nola lotu ez zekitela askotan. Adibidez, programako koadro jakin batean “left” azaltzen da Windowsen. Nola itzuli behar da hori? Ezker, ezkerrean, ezkerreko...? Beste adibide bat: invalid system disk esaldia itzultzeko, 19 karaktereko tokia besterik ez zuen eskaintzen sistema informatikoak. Euskaratze-lana zaildu egin du horrek, baina zailtasunak gaindituta, emaitzarekin pozik daude UZEIn. “Euskara ulergarria egiten saiatu gara, edozeinek ulertzeko moduko euskara erabiltzen”, dio Lore Azkaratek. Lokalizazioa egiteko, euskaratzaileek beste eginbehar garrantzitsu batzuk gogorarazi zizkioten Microsofti, baina enpresak ez ditu kontuan izan. Adibidez, ehunekoen zeinua zenbakiaren aurretik (ezkerrean) azaltzeko premia, edo euskararen hitz mozketaren berezitasunak. Microsoftek ez ditu kontuan hartu eskaera hauek eta, ondorioz, hutsune larria dauka Word testu editoreak: ez dauka euskarazko hitz mozketarik. Hau da, tetazokermoz-tendira hitzetan, lerro honetan bezala. Hurrengo lerroan, aldiz, hitza zuzen moztuta ageri zaigu, EGUNKARIAk artikulu hau maketatzeko darabilen programari euskarazko mozketa egiteko aplikazioa gehitu zaiolako, Simeón Barroso informatikariak eta Josu Landa kazetariak garatutako tresna informatiko bat.

Bill Gatesen enpresaren Europako adarrak Mandan du egoitza baina euskaratzeko proiektua Madrilgo bulegotik bideratu dute, azkenean. UZEI eta Microsoften arteko tratuan, alor batzuk ez zirela itzuliko erabaki zen hasieran, eta horiek ingelesez azalduko zirela hitzartu zuten. Gero, ostera, Microsoft España enpresak atal horiek gaztelaniaz ipintzea erabaki du. Akats hauek guztiak ez dira UZElren falta, behin eta berriz kexatu zaizkielako Microsofteko arduradunei. Baina ez diete kasurik egin. “Madrildik marketin-arrazoiak zeuzkatela esan ziguten, politikarik ez tartean, ez horixe”, dio Lore Azkaratek irribarre ironikoa eginez. Gaztelania azaltzearen arrazoia zera ornen da, Espainiako Microsoften hitzetan: “Euskaldun guztiek dakitelako gaztelania”. Madrilen beti izan dira oso azkarrak euskaldunei zer komeni zaien jakiteko, bistan da.

Arazo hauek denborarekin konponduz joango direla uste dute UZEIn: “Izan ere, ez da hainbeste denbora ordenadore programak hizkuntza desberdinetara itzultzen hasi zirela”, dio lana ebaluatzeko UZEIn prestatutako txosten batek. “Hizkuntza bakoitzak ditu bere berezitasunak, baina lan hauetan hasi arte ezin dira aurrikusi gerta litezkeen problemak. Kontuan izan behar da gainera segitzen du txostenak-, programatzaileen ardura nagusia programa behar bezala ibiltzea dela, eta programatzen ari direnean ez zaiela burutik pasatzen beste hizkuntzetan arazorik sor litekeenik ere”Arazoak arazo, Donostian lan sakona egin da. 2.300 orrialde estandarren pareko lana izan da itzuli beharrekoa, goian aipatutako zailtasunekin, eta sei hilabete eskasean. Epeak bete egin dira, eta hori Gatesek berak ere ez zuen lortu Windowsen merkaturatzearekin, behin eta berriro atzeratu baitzen abuztura arte.“

Lana ezin da bere horretan gelditu”[aldatu]

Abendurako dena prest zegoen, baina aste batzuk atzeratu da aurkezpena. Dena den, lana ez da amaitu: orain artekoa fase bat dela esan liteke. Hurrengo urratsa ere buruan dute Hizkuntza Politikan: Microsoft Office euskaratzea. Bulego bateko laneko tresna erabilienen programa sorta da Office. Gainera, programen bertsio berriak ere egongo direnez, hori ere moldatu beharko da. “Lan hau ezin da bere horretan gelditu, honek jarraipena behar du”, dio HPSko Jokin Azkuek. “Planning hori baliabide ekonomikoen baitan dago, baina ezin gara ekintza puntualetara mugatu”.

Hurrengoetan, egin beharreko lana ez da horren handia izango, oinarri garrantzitsu bat finkatuta dagoelako dagoeneko. Lore Azkarateren iritziz, “aktualizazioak aterako dira, eta itxura aldatuko zaio baina euskaratzeko egin beharko den lana ez da horren besterainokoa izango”. Hizkuntzalaritzaren alorrean ere dela uste dute UZEIn. “Gure lanari dagokionez, benetan interesgarria eta aberasgarria izan da, bai makina-hizkera egokitzearen aldetik, eta baita termihologia berria lantzearen aldetik ere”, dio UZElren txostenak.

Orain arteko bi produktuen komertzializazioa Microsoft etxearen esku geratu da. Horregatik, interesa duen bezeroak informatika dendetan eskatu beharko du euskarazko Windows95 edo Word6.0. “PCa erabiltzen duen edozein euskalduni zuzendua dago, baina bereziki irakaskuntzan izan dezake aplikazioa”, dio Azkaratek. Administrazioak gaztelaniazko bertsioekin batera jasoko duenez, EAEko instituzioetan sartzen joango dela pentsa liteke.

Windows95 ez da, dena den, euskara eta informatika uztartzeko estreinako ahalegina, ezta, seguruenik, garrantzitsuena. Euskal Herriko Unibertsitateko talde saiatu bat (makinek txoratutako gazte talde bat) aspalditik ari da euskara eta ordenadoreak uztartzen. Talde honen inguruko jendea duela 10-12 urte ari da gaia Udako Euskal Unibertsitatearen Iruñeko uda-ikastaroetara eramaten. Hasieran, kezkak eta gogoetak ziren. Gaur egunean, emaitza praktikoak. Windows 1995n

Beste hainbat tokitan ere, borondatea jarrita aurreratu da makinak euskalduntzen. EGUNKARIAn,hasiera-hasieratik, menu euskaratuak darabiltzate kazetariek beren pantailetan lan egiteko. Beste alor batzuetan ere, ahalegin pertsonalei esker aurreratu da. Jaurlaritzan, EJIEko datu-baseen arduraduna den Loiola Martinezek bideratuta, EHAAren (EAEko buletina) argitaratze-lanetarako interfaze bikoitza prestatzen ari dira, euskaraz edo gaztelaniaz lan egiteko. Gaur egungo tresna informatiko batzuek, bestalde, nork bere ordenadorea neurri batean euskaratzen uzten dute.

Euskal informatikariak, ahaleginen abangoardian[aldatu]

Ahalegin hauetako abangoardian, hala ere, EHUko informatika fakultateko taldea dugu. Bi mugarri garrantzitsu jarri dituzte dagoeneko bidean: Xuxen, euskarazko zuzentzaile ortografikoa, eta Euslem, euskarazko lematizatzaile automatikoa. Lan eskerga hau bi mundu desberdinen elkar-lanaren fruitua da: informatikariak batetik, eta hizkuntzalariak bestetik. Batzuek gramatika ikasi dute, eta besteek ordenadoreen berri. Fakultateko teknikariek UZElrekin egin dute lan hasieratik bertatik.

Miriam Urkia filologoa da UZEIko lankideetako bat Xuxen eta Euslemeko zeregin informatikoetan. Bere lana ez da gramatika liburuetan dagoena ordenadoreari irakastea. Hori baino konplikatuagoa da: “Lan linguistiko teoriko asko hemen egin behar izan da”, dio Urkiak. “Euskaltzaindiak lan asko egin du, baina lan deskriptiboa da, ez da lan arau-emailea. ‘Hau horrela da, baina horrela ere izan daiteke’. Idatzigabeko gauza asko daude”.

Euskararen egiturak, gainera, bihurri samarrak dira informatikarako. Inguruko erdaretan, flexio-aldaera gutxi dituzte hitzek, eta funtzioak markatzeko preposizioak dauzkate, detektatzeko errazak. Euskaraz, aldiz, hizkuntza eranskaria da: deklinabide markak eta flexioak eransten zaizkie hitzei. Gaztelaniaz, casa eta casas dituzu. Euskaraz, seme, etxekoak, etxekoenganalno... 135 forma legezko eratorri arte. Eskerrak Finlandian antzera gertatzen den, eta hango informatikarien lanak erabili dira, suomiera ere hizkuntza eranskaria baita —eta euskara baino bihurriagoa, nonbait—. Gainera, Finlandiako ikertzaileen aurkikuntzak, bereziki Koskenniemi profesorearen bi mailatako formalismoa deritzon prozedura, munduko aurreratuenak dira, une honetan, hizkuntzalaritzaren eta informatikaren arteko muga esploratu gabe hauetan.-

Orain arteko lanaren beste ondorio bat EDBL deritzona da: Euskararen Datu Base Lexikala. Hiztegi informatiko baten moduko zerbait da EDBL, baina hitzez gain, atzizkiak-eta hartzen ditu. Esanahia barik, bakoitzaren funtzioak zehazten ditu definizio bakoitzak. 60.000 sarrera daude EDBLn une honetan, baina osatuz joan daiteke oraindik. EDBLren lagungarri EEBS dugu, Egungo Euskararen Bilketa Sistematikoa (politikan baino are siglazaleagoak dira informatikan). EEBS proiektuak hiru milioi testu-hitz bildu nahi ditu, gaur egungo benetako lexikoa eta erabilerak finkatzeko balioko duen datu-base erabilgarri batera biltzeko. Testu hau bera, eta EGUNKARIAko beste asko, Erramun Gerrikagoitiaren gutunak bame, EEBSn bilduta egon daitezke gutxi barru.

EDBL, EEBS, Xuxen eta Euslem[aldatu]

EDBL eta EEBS oinarriak dira. Eta oinarrien gainean, hasi dira etxeak eraikitzen: Xuxen da lehenbiziko produktu komertziala, euskarazko zuzentzaile ortografikoa. Gainera, lematizatzaile automatikoarekin analisi morfologikoan ari dira orain fakultatean: hitzen barne-egitura zein den, eta funtzio morfologikoak zehazten dituen programa bat lantzen ari dira: Euslem. Fin egiten du lan programa honek (ikus artikuluko zatidura), baina oraindik zutabe garrantzitsuak falta zaizkio:

Alor morfosintaktikoa. Sintaxia aztertzek ourrats garrantzitsuak eman behar dituzte oraindik programatzaileek. Hitzen egitura morfologikoa aztertu ondoren, hitzok unitate zabalagoetan, perpausetan, dituzten loturak analizatu behar dira.

Hitz anitzeko terminoak. Marratxoz lotutako termino konposatuak (txanpon-bilduma, adibidez) kateatu egiten zaizkio ordenadoreari oraingoz.

Desanbiguazioa. Azterketa egin eta gero, analisi morfologiko anitz du edo zein hitzek (ikus zatidura). Anbiguetate horiek ezabatzen, esanahi zuzena aukeratzen, erakutsi behar zaio makinari, eta ez da erraza. Metodo estatistikoak ari dira jorratzen, adibidez, probabilitateen arabera ordenadoreak esanahi jakin bat hauta dezan. Euslem lantzen ari diren programa da, baina Xuxen kalean dago jada, 1994tik. Nahiko harrera ona izan du bezeroen artean: 500 merkaturatzeko aurrikuspena egin zuten, eta mila saldu dira dagoeneko —piratek lapurtutakoak kontuan hartu barik— Baionako Hizkia enpresaren bitartez, PC edo Mac ordenadoreetarako bertsioetan. Testu bat pasatzen baduzu Xuxenetik, akats ortografikoak atzematen dizkizu. Lehenbizi, hitzen egitura aztertzen du, eta etxekoenganaino bezalako termino batean, sustraia etxe dela igartzen du, eta hortaz, zuzena dela. Aditzak, aldiz, banan-banan sartu dira. “Badakigu nola eratu dut eta ditut bezalakoak forma bakar batetik abiatuta,baina abiadurari begira ez zen interesgarriena”, argitu digu Iñaki Alegria informatikariak. Xuxenek ez dauka prezisamente Cipolliniren abiadura esprintean, kexu gatzaizkio Alegriari, baina berak dioenez, egungo tresnekin ibiltzeko, nahikoa ondo dabil. “Eta hurrengo urtean, Xuxen96 supersonikoa izango dugu”, iragarri digu. Word6.0 programan gehitu zaion Xuxen aparte saldu dena baino arinago dabil, dagoeneko. Baina Xuxen azkarra da oso. Etxe ori suria da idatzi eta suria-ren ordez zuria emango dizu ordezkatzeko, propo-en arte-an (proposamena, informatikarien euskalkian). Aldiz, ori ontzat ematen du! or-ora, zakurraren sinonimoa, euskal hitz zuzena delako! Hori da ori.


Baina euskaraz ari banaiz...[aldatu]

Baina euskaraz ari banaiz, zer axola zait hitz bakar baten bitartez adierazten dudana edozeinek uler dezakeelarik, erdarazko batez, bizala ehun ez ematen dena ditzera.

Koldo Mitxelena hizkuntzalariaren esaldi bat eman genion irakurtzeko Euslem programari. Esaldia kazetariak aukeratu zuen, eta ordenadoreak 10 segundutan eman zuen analisia.

Letra zopa nahasi horretan, hitz bakoitzari egindako analisi posibleak agertzen dira. Ez ditugu klabeak banan-banan azalduko, baina irakurleak igarriko ditu batzuk: DEK (deklinabide marka), INS(kasu instrumentala), MG (mugagabea)... Adibidez, zait formaren analisian, NR-HU,NI-NI agertzen denean zera esan nahi du: Nor (hura), Nori (niri).

Hizkuntzaren anbiguotasunak detektatzeko abilezia handia du makinak. Baina, adibidez, bainatu aditzaren aditzoina izan daiteke (baina hadi), baina izena (leka, hiru aldaeratan: izen arrunt hutsa, mugagabea kasu absolutuan edo mugatu singularra) edo loturazko juntagailua (horixe da zuzena). Euskaraz, aldiz, euskararazi (euskaratu arazi) aditzaren aditzoina ere izan daiteke. Aurrerago, batez, bate hitzaren aldaera posiblea da; biz inperatibozko forma izan daiteke, eta ala aditzoin bat.

Paradoxa polita da ikustea nola edozein hiztuni zalantzarik sortzen ez dioten hitzak (baina, euskaraz) deskodetzeko zailak et aanbiguoak diren makinarentzat, eta ostera, euskaltegiko ikasle bati zail samarra irudi lekiokeen aditz jokatu bat (dezakeelarik), lehenbizikoan sailkatzen duen Euslem programak.



Inguruko erdarek balio ez, eta suomierazko rnateriala erabili da euskararen trataera informatikoa lantzeko.



Mac-zaleak eta peceroak[aldatu]

Windows95 programa mota berezi bat da, sistema eragile bat. Ordenadorearen oinarrizko programa da sistema eragilea. Makinak erabiltzen dituen gainerako programak sistemari egokituak daude: testu editoreak (idazteko), programa grafikoak (irudiak eta marrazkiak egiteko), datu-baseak, kalkulu-orriak (eragiketakegiteko, adibidez, diru kontuen kontrola)... Windows95 sistema sorta bateko azken bertsioa da; hiruzpalau Windows izan dira aurretik, eta lehenago MS-DOS zegoen, Microsoften sistema eragile zaharra. Sistema hauek PC ordenadoreetan egiten dute lan, IBM etxeak asmatu eta hainbat etxek klonatutako (lizentziarekin errepikatutako) makinetan. Badira beste ordenadore mota batzuk, beste sistema eragile batzuekin lan egiten dutenak, baina PCak dira nagusi merkatuan.

Lehian, Apple etxearen Macintosh ordenadoreak dira ezagunenak. Garestiagoak dira makinak (hardware delakoa), baina programak eta sistemaeragilea, software delakoa, erabilterrazagoak dituzte aspalditik. Hain zuzen ere, Windowsen bertsioek gero eta antz handiagoa dute Mac sistemarekin. Ez dutela kopiatzen dio Bill Gatesek, baina ez dago sinesterik. Itxura grafikoa du Macek: karpetak,menuak,botoiak...Agindu informatikoen hizkuntza ikasi beharrean (copya:\docc:), sagu soil batekin gauzak ireki, hartu eta eraman egiten dira Macen. Windows95en antzera gertatzen da, baina Macintoshera ohitutako (hori da kazetari honen kasua), komeni den baino konplikatuagoa iruditzen zaio Windows. Adibidez, zertarako behar ditu PCko saguak hiru botoi, bakarrarekin primeran dabilenean Macintosha?

Mac-zale eta peceroen arteko eztabaidak ez du amaierarik aspaldian. Euskarazko kulturaren inguruetan, hain zuzen, ez da nabari PCen nagusitasuna hain garbi, eta Apple markako makina asko ikusten da. Idazteko, liburugintzarako eta irudia lantzeko Macintoshek eskaintzen dituen abantailen ondorioa da hori. Irakaskuntzan, aldiz, PCak dira nagusi, eta instituzioek ere hortik jotzen dute gehien bat. EUSKALDUNONEGUNKARIAn gehien bat Theos sistema eragilea (beste sistema bat) erabiltzen da idazteko, eta PCak orriak tajutzeko, baina atal batzuk Macintoshetan egiten dira idatzi eta maketatu (KZ gehigarria, adibidez).