Esperantilo Blogo en Esperanto pri projekto Esperantilo kaj komputila lingvistiko

10.8.2007

Renkonto kun Esperantisto kaj uzanto de Programo Esperantilo

Filed under: ĝenerale,germana lingvo,reagoj — artur @ 17:34

Per interreta letero mi konatiĝis kun Esperantisto Eckhard Stoll, kiu eble estas al ceteraj homoj konata de Radio Sauerland Welle kaj elsendoj pri fondaĵo Bona Espero. Post kelkaj leteroj kaj longa telefonado ni decidis renkonti. Eckhard estas ankaŭ la kreinto de alia traduka programo Ecoso. Do ni havis multegon por priparoli pri programado kaj maŝina tradukado. Ni parolis multege pri teknikaj aferoj kaj interŝanĝis ideojn pri tradukaj programoj. Mi povis montri direkte kelkajn specialajn funkciojn de programo Esperantilo kaj rakonti pri ĝia programado.

Mi decidis detale priskribi kelkajn ideojn de tiu renkonto. Tio estas ankaŭ por mi la unua okazo por paroli direkte kun uzanto de Esperantilo. Per tiuj diskutoj mi eksciis pri plibonigindaj flankoj de programo kaj ekhavis ideojn por plua evoluo. La programo Ecoso ne oferas altan kvaliton de maŝina tradukado, tamen ĝi enhavas funkciojn, kiuj ne estas nun en la programo Esperantilo. Oni povis tajpi Esperantajn vortojn kaj samtempe observi la tradukadon al germana lingvo. Mi longe ne povus imagi, kiu vere bezonus tiun funkcion. En mia kapo mi havis nur unu tipon de uzado de programo. La uzanto havas Esperantan tekston, kiun li volas traduki al cela nacia lingvo. Tamen mi devis konfesi, ke maŝina tradukado estus ankaŭ uzebla por propedeŭtikaj kialoj. Ni imagu, ke komencanta lernato de Esperanta lingvo volas krei esperantan tekston. Lia provizo de esperantaj vortoj ne estas granda. Li ankaŭ havas problemojn kun esperanta gramatiko. Li tamen volas skribi leteron al iu alia Esperantisto. En tiu kazo li kutime uzus ofte vortaron kaj necesus korektadon. La programo Ecoso estas farita direkte por tiuj uzantoj. Oni tajpas esperantajn vortojn kaj povas direkte kontroli en vortaro, ĉu la vorto estas korekta. Do la maŝina tradukado ĉefe gravas kiel kontrola teksto. Tio nun ankaŭ estas por mi pli evidenta, ĉar mi ofte rimarkas erarojn en miaj esperantaj tekstoj nur, post kiam mi tradukis ilin al pola lingvo. Do la kombino de literumado, gramatika kontrolado kaj maŝina tradukado estas tre avantaĝaj por komencantoj de esperanta lingvo. Mi ankaŭ en frua blogo pensis pri uzantoj, sed pri tiu tipo de uzado mi ne pensis.

De eldono 0.94 Esperantilo ankaŭ enhavas tiel nomatan rapidan vortaron, kiu laboras simile al programo Ecoso. Mankas nun nur la ebleco samtempe montri la tradukon de vortoj en separita fenestro. Esperantilo tradukas ne po unu vorto, sed ĝi bezonas por bona traduko la tutan frazon. La akceptebla solvo estus, ke esperantilo tradukas tuj ĉiun vorton laŭ primitiva maniero. Sed kiam la frazo estas finita, la programo retradukas la tutan frazon en pli bona kvalito. Nun ekzistas en Esperantilo t.n. „Tradukileto“ (menu Tradukado->Tradukileto), kiu estas speciale farita por samtempa tradukado de mallongaj tekstoj. Oni povus plivastigi la funkciadon de tiu ilo, por ke ĝi estu pli simila al programo Ecoso.

Mi kaptis la okazon kaj detale demandis Eckard pri ĝia uzado de programo Esperantilon. Tio estis por mi tre instrua. Ni diskutis longe pri vortaro de Esperantilo. Bedaŭrinde Eckhard ne povis bone uzi tiun vortaron sen mia detala priskribo. La uzula interfaco de vortaro evidentiĝis kiel malklara. Mi uzas la vortaron tre ofte kaj ne supozis tiujn malfacilaĵojn. Speciale malklara evidentiĝis la dudirekta serĉado de vortoj. Por tio oni havas du specialajn kampojn. Ankaŭ la montrado de rezultoj kaj la ebleco de direkta redaktado de tradukoj estis malklara. La leciono por mi estas, ke uzantoj atendas, ke la vortaro aspektu kiel papera vortaro. Oni havu nur unu kampon por entajpi la vorton. Ankaŭ la gramatikaj priskriboj ne estas klaraj. Se la avaraĝa uzanto povus redakti mem la vortaron, la priskribo de gramatiko kaj fleksio devus esti pli facila. Normale altnivela preparo de vortaroj estas tasko por profesiaj lingvistoj. Se tiu vortaro estas uzata en maŝina tradukado, tiu tasko estas eĉ pli malfacila. La programo devus plifaciligi tiun taskon ankaŭ por neprofesiuloj. La plej bona solvo estus, se la programo oferus kelkajn ekzemplojn de fleksio por elekto kaj la uzanto nur devus elekti la korektan frazon. Ni ankaŭ diskutis lange pri komuna flegado de vortaro. Ĝis nun mankas bonaj liberaj vortaroj pro esperanta lingvo, kiujn oni povus uzi en maŝina tradukado. Sekvaj funkcioj estus necesaj:

  • facila importado kaj eksportado de ŝanĝoj direkte per interreto
  • historio de ŝanĝoj en vortaro
  • ĉiu ŝanĝo havas aŭtoron
  • akceptado de ŝanĝoj per elektitaj kompetentaj lingvistoj
  • priskribo de certeco de iu traduko
  • Akcepto de ŝanĝoj nur por ne certaj tradukoj

Tiu projekto necesus vastan akcepton de germana kaj esperanta komunumo. Ekzistas nun multaj similaj projektoj, kiuj kolektas vortojn por Esperanto kaj por ĉiu lingvo. Bedaŭrinde ĉe multaj tiaj projektoj la uzado de vortaroj ne estas libera. Do mi ne estas certa, ĉu indus krei ion novan. Tio devus esti ankaŭ separita projekto. Kvankam mi devis akcepti, ke la nuna vortaro ne estas facila, mi tre kutimiĝis kun nuna funkciado. Bone estas, ke mi direkte povas redakti tradukojn sen aldonaj paŝoj. En aliaj programoj oni devas trairi per multaj fenestroj por adaptigi unu tradukon. Ankaŭ en tiu kazo evidentiĝas, ke diferencaj uzantoj volas havi diferencan interfacon. Mi povas diferenci:

  • Uzantoj kiuj nur legas vortaron kaj nenio scias pri gramatiko
  • Uzantoj kiuj nur legas vortaron kaj tre malofte korektas tradukojn. Ili havas nur bazajn konojn pri gramatiko
  • Lingvistoj, kiu ofte uzas vortaron kaj volas direkte redakti tradukojn. (angle: Poweruser)

Nuna vortaro bezonan plibonigon, sed eble bona ideo estus havi du separitajn vortarojn por almenaŭ du tipoj de uzantoj.

Ĝenerale mi devas diri, ke multaj funkcioj de Esperantilo ne estas konataj. Eble pli bona solvo estus dividi la programon en kelkaj programoj, kiuj enhavas funkciojn speciale por unu grupo de uzantoj. Mi pensas, ke la plej granda parto de esperantistoj ne scias multe pri lingvistiko, gramatiko kaj komputiloj. Kaj speciale por tiu grupo la programo povus esti aparte utila. Por tiu homoj estas necesa aldona dokumentaro kaj speciala instrukciado. Eble mi povus iam pretigi intrukcajn videojn. Mi pensas, ke direkta kontakto kun uzantoj estas la sola eblo plibonigi la programon.

Ni diskutis multe pri plibonigo de germana tradukado. Jes, mi havas mutajn ideojn, sed mi decidis nun prizorgi nur polan maŝinan tradukadon. La tasko estas pena kaj mi volas, ke almenaŭ unu lingvo estos bone tradukota. Do eble en venonta jaro mi denove okupus pri germana lingvo.

Sukcesa programo devas havi stabilan kernon, kiu povas solvi la planitajn taskojn, kaj ankaŭ klaran interfacon. Se unu de tiuj elementoj ne estas bona, la programo ne trovos akcepton. Direkta kontakto kun Esperantistoj tre helpas. Mi esperas, ke mi en la venonto povus partopreni en esperantaj aranĝoj kaj renkonti la uzantojn de programo rekte.

31.10.2006

Nunaj problemoj kun maŝina tradukado al germana lingvo

Filed under: germana lingvo,maŝina tradukado — artur @ 19:10

Nun mi havas du eblojn sisteme testi la kvaliton de maŝina tradukado. Unue mi havas la aron de ekzemplaj frazoj (germanaj ekzemploj). Mi havas ankaŭ la ilon, kiu aŭtomate rekonas ŝanĝojn en tradukado post ŝanĝoj en programo.
Tiel mi frue povas ekkoni, ĉu ŝanĝoj en programo ne havas pliajn eble negativajn influojn ol tiuj, kiujn mi celis.

Sed mi rimarkis, ke la vera kvalito de maŝina tradukado estas videbla nur en realaj tekstoj kompare al realaj homaj tradukoj. Tial mi programis la medion por facile kompari tradukadojn (ekzemplo Ekzemplo de tradukado).

Mi nun malrapide trarigardas la rezultojn. Nun mi devas konstati, ke la kvalito de germanaj tradukoj estas la plej
malaltaj de ĉiuj. Kelkaj frazoj estas eĉ tiel fuŝe tradukitaj, ke la senco de frazo ne estas rekonebla.
Mi analizis kelkajn frazojn, kaj devas konstati, ke la germana lingvo havas kelkajn specialaĵojn, kiu malfaciligas la tradukadon. Tiujn kelkajn specialaĵojn mi eĉ ĝis nun tute ne pritraktis en programo. Germana lingvo postulas ankaŭ pli bona kvalito de analizo de esperantaj frazoj, ol pola aŭ angla lingvoj.

(relative clause extraposition) – Relativsatzextraposition

Esperante oni povus nomi tiun fenomenon: kroma pozicio de relativa subfrazo.
Bonan priskribon en germana lingvo oni trovas ĉi tie.

En germana lingvo oni ofte devas transloki kelkajn verbajn specojn al fino de frazo:

Ekzemploj:


Ich möchte das Buch lesen. (Mi volas legi la libron.)

Er wird sich mit dem Mächchen morgen nicht treffen. (Li ne renkontos la knabinon morgaŭ).

Er reist morgen ab (verbo: abreisen). (Li forveturos morgaŭ)

Tiu okazas ĉe:

  • helpaj verboj (wollen, müssen, …)
  • estonta tempo
  • tranĉeblaj verboj (Trenbare Verben)

La programo en nuna eldono 0.84 bone tradukas tiujn specialaĵojn por facilaj frazoj, sed tute fiaskas ĉe kompleksaj frazoj kun subfrazoj.

Ekzemploj de kroma pozicio de relativa subfrazo:


Mi legos la libron, kiun mi hieraŭ aĉetis.

Sen kroma pozicio

Ich werde das Buch, das ich gestern gekauft habe, lesen.

Kun kroma pozicio

Ich werde das Buch lesen, das ich gester gekauft habe.

En la lasta frazo la relativa frazo ne staras direkte apud la substantivo ‚Buch‘. Ambaŭ frazoj estas gramatike tute korektaj. Ne estas tre klare evidente, kiam la kroma pozicio devas esti aplikata. La ĝenerala tendenco estas, ke por longaj subfrazoj eble multoblaj la kroma pozicio estas preferigita.

nfvp – non finite verb pharases

La dua problemo en la nuna eldona estas ne korekte analizitaj i-frazpartoj (engle: non finite verb pharese).

Ekzemplo:

Mi volas paroli pri tiu libro.

Ankaŭ en tiuj i-frazpartoj en germana lingvo la verbo venas al fina pozicio.

Traduko:


Ich will über dieses Buch sprechen.

Nun la sintaksa analizo en la programo ne povas korekte ekkoni tutajn i-frazpartojn, sed teknike tio estas ebla
kaj mi certe tion faros en venonta eldono de programo.

i-frazpartoj en sintaksa analizo


Mi volas vidi vin. (korekte)

Mi volas paroli pri tio. (malkorekte)
Tial la tradukado modulo de germana lingvo ne translokigis la verbon de i-frazparto al fino de tiu frazparto, sed al fino de ĉefa frazo. Tiu funkcias bone por facilaj frazoj, kvankam la baza sintaksa analizo ne estas korekta.

Mi volas paroli pri tio. Ich will darüber sprechen

La problemojn faras kompleksaj frazoj kun multaj i-frazpartoj. Nun la programo tradukas:

Mi venas paroli pri tio, vidi vin kaj la libron legi. Ich komme über dem, dich und das Buch lesen, zu zu sehen sprechen.

La traduko estas fiaska. Ŝajnas ke mi devas investi tempon por plibonigi la sintaksan analizon. I-frazpartoj ne estas bone rekonataj. Poste mi devos adapti la tradukan modulon por germana lingvo.

La alia problemo estas la germana glosaro (vortaro)

Ŝajne la vortaro estas tre vasta, sed aliflanke por maŝina tradukado, oni ne bezonas ĉiujn eblajn sinonimojn por unu esperanta vorto, sed unu traduko, kiu estas taŭga por plej granda nombro de tradukoj.
Ekzemple por vorto ‚fari‘ la glosaro enhavas sekvantajn tradukojn: machen, erschaffen, anfertigen, herstellen, tun, vollbringen, schließen, hinkriegen, tätigen, leiten, zurücklegen.
Kelkajn de ili oni uzas en tre maloftaj situacioj. En la kampo „ordo“ oni povas specifi, kiu traduko havas la plej altan prioritaton, sed por multaj vortoj tiu ĝis nun ne estas farita.

Powered by WordPress