Esperantilo Blogo en Esperanto pri projekto Esperantilo kaj komputila lingvistiko

17.1.2007

Maŝina tradukado de propraj nomoj

Filed under: maŝina tradukado — artur @ 19:45

Propraj nomoj farigas multajn problemojn ĉe maŝina tradukado kaj gramatika korektado. Malfacila estas la identigo de propraj nomoj kaj ilia sintaksa analizo. Ankaŭ tradukado de propraj nomoj ne estas facila kaj oni frontas multajn problemojn. En la plej simpla kazo propraj nomoj tute ne estas tradukitaj, en alia kazo depende de cela lingvo propraj nomoj devas havi fleksiajn finilojn. Kiel kutime la bonan enkondukon donas PMEG.

Similajn problemojn oni frontas ankaŭ ĉe mallongiĝoj, akronimoj, matematikaj simboloj kaj citaĵoj.

Korekta pritakso de propraj nomoj estas tre grava ĉe maŝina traduko. Ĉar en multaj ĵurnalaj tekstoj preskaŭ ne ekzistas frazoj sen propraj nomoj, la okulfrapa kvalito de tradukado dependas multe de tradukado de propraj nomoj.

Specoj de Propraj Nomoj

Propraj nomoj ĝenerale funkcias en frazo same kiel substantivoj. Ĝenerale oni povas diferenci proprajn nomojn laŭ:

  • Esperantigitaj aŭ ne esperantigitaj propraj nomoj
  • unuvortaj aŭ multvortaj propraj nomoj
  • puraj substantivaj aŭ adjektivigitaj propraj nomoj (ekz: Varsovia vento
  • tipoj de nomigitaj objektoj: geografiaj nomoj, firmaoj, homoj, asocioj, titoloj
  • Propraj nomoj, kiuj estas normalaj esperantoj frazpartoj (ekz: Libera Folio, Ondo de Esperanto)

Esperantigitaj propraj nomoj faras la plej malgrandajn problemojn, ĉar ili povas esti pritraktataj kiel normalaj esperantaj vortoj. En Esperantilo oni povas difini en esperanta vortaro por radikoj kaj substantivo, ke ili estas propraj nomoj. La gramatika korektilo sugestas skribi ĉiujn proprajn nomoj per grandaj literoj.

Propraj Nomoj en Sintaksa Analizo

Propraj nomoj funkcias en frazo same kiel substantivoj, sed ili ne povas havi la difinilon ‚la‘. Ne esperantigitaj propraj nomoj kutime ne havas la akuzativan finilon. Kelkaj esperantigitaj propraj nomoj aperas nur en plurala formo (ekz: filipinoj)

  • Paweł Lemian skibis tiun leteron.
  • Mi renkontis Krystyna lastan semajnon.
  • La reĝo ankaŭ fundis urbon Mins Mazowiecki.
  • Reihn estas la plej granda rivero en Germanio.
  • TEJO-uloj partoprenis IS parolis pri EO kaj dancis laŭ DĴ ĉe E-muziko.
  • Maŝina Tradukado (MT) ne sukcesis plene. Oni ne devas multe atendi de MT.

En sintaksa analizo oni rimarku du konstruaĵojn. Unue la identiga priskribo de ceteraj substantivoj:

  • Sinjoro Marek Boder
  • Urbo Rybnik
  • Firmao MicoBrain

Due la familinomoj aperas ofte kun antaŭnomoj en duopoj. Sintaksa analizilo en Esperantilo grupigas tiuj nomojn en branĉo „nomo“.

sintaksa analizo de propraj nomoj

Identigo de Propraj Nomoj

Oni povas uzi kelkajn trajtojn de propraj nomoj por identigo

  • Propraj nomoj estas skribitaj per granda litero.
  • Propraj nomoj staras ofte post ceteraj substantivoj (sinjoro, rivero, libro, urbo…).
  • Ne esperantigitaj propraj nomoj ofte enhavas ne esperantajn literojn („xyąóćęłńśźż“).
  • Proprajn nomojn oni ofte skribas en apostrofoj.
  • Proprajn nomojn oni ofte skribas per kursivaj literoj.
  • Mallongiĝoj kaj Akronimoj uzas nur grandajn literojn (UEA, TEJO, UFO).
  • Propraj nomoj aperas multfoje en unu teksto.

Esperantilo uzas ankaŭ la internan liston de ignoritaj vortoj por identigi proprajn nomojn. Pripensebla estas ankaŭ vortaro de propraj nomoj. La kompleta listo de ĉiuj geografiaj nomoj aŭ ĉiuj homoj ne estas realigebla, sed oni povas celi kolekti proprajn nomojn, kiuj estas ofte uzataj en ia tekstaro.

Teknike tre komplika estas identigo de propraj nomoj, kiuj estas ŝajne normalaj esperantaj frazpartoj. Tio estas ofte nomoj de ĵurnaloj kaj asociacioj. Ankaŭ ofte neesperantigitaj propraj nomoj, familinomoj aŭ antaŭnomoj estas hazarde kutimaj esperantaj vortoj. Ni pripensu konatajn Esperantistojn: Claude Piron, Barbara Pietrzak.

Fine oni povas la taskon de identigo de propraj nomoj lasi al uzanto kaj oferi al li komfortan surfacon.

Aŭtomata kolektado kaj testado de propraj nomoj

Identigo de propraj nomoj povas esti praktika funkcio ĉe analizo de tekstaro. Por identigo de familinomoj estus tre praktika la listo de oftaj antaŭnomoj aŭ familinomoj. Ĉe konataj homoj aŭ geografiaj nomoj oni povus aŭtomate konsulti aliajn gradajn leksikonojn ekzemple: Vikipedio.

Tradukado de Propraj Nomoj

La tradukado de propraj nomoj estas aparte komplika afero. Unue oni devas kondiĉi, ke sintaksa analizo bone rekonis tiujn. La tradukado dependas de cela lingvo kaj la speco de propra nomo. Ni havas sekvajn eblojn.

  • Esperantigitaj propraj nomoj estas tradukitaj laŭ traduka vortaro.
  • Ne esperantigitaj propraj nomoj ne estas tradukitaj.
  • Ne esperantigitaj propraj nomoj estas tradukitaj laŭ reguloj de fonta lingvo.

En slavaj lingvoj, kie verboj estas fleksigitaj laŭ genro, estas tre grava la genro de la persono. Ekzemple oni tradukas.

  • Barbar Pietrzak legis . Barbar Pietrzak czytała.
  • Claude Piron legis. Barbar Pietrzak czytał.

Ankaŭ en pola lingvo familinomoj havas finilojn.

  • Mi ofte aŭskultis Barbar Pietrzak en pola radio. Często słuchałem Barbarę Pietrzak w polskim radiu.

Ĉar ne esperantigitaj geografiaj nomoj uzas la nomon de fonta lingvo, estas granda problemo, kiam la cela lingvo havas enproprigitan formon de tiu nomo.

  • Mi estis en Köln. (pola traduko) Jestem w Kolonii.

Plej komplika estas la tradukado de akronimoj kaj propraj nomoj, kiuj estas normalaj esperantaj subfrazoj. Ofte akronimoj ekzistas por iu specifa lingvo aŭ kulturo. Tipaj akronimoj de Esperanto UEA kaj TEJO oni ne povas traduki rekte al nacia lingvo, ĉar en tiu lingvo, tiuj nomoj ne estas konataj. La solvo povas esti ŝanĝo de akrionimoj al plena nomo aŭ aldona priskribo.

  • Kongreso de UEA okazis en Pekino. (pola traduko) Kongres UEA (Światowego Związku Esperantystów) miał miejsce w Pekinie.

Komplika estas ankaŭ pritrakto de nomoj de ĵurnaloj aŭ asocioj, kiuj ofte estas regulaj frazpartoj. Pricipe tiujn nomojn oni ne tradukas, sed ofte aldonas pluajn informojn.

  • Libera Folio okulfrapas per mistrafaj titoloj de siaj artikoloj. (pola traduko) "Libera Folio" (esperancka gazeta internetowa) zaskakuje nieudanymi tutułami swoich artykułów.

Tradukado de propraj nomoj en Esperantilo

Esperantilo ĝis nuna eldono prilaboras nur kelkajn tipojn de propraj nomoj. Esperantigitaj propraj nomoj ne faras problemojn kaj povas esti difinitaj en traduka vortaro. Sintaksa analizilo rekonas grupojn de antaŭnomo kaj familinomo, se ĝi trafas du nekonatajn vortojn, kiuj estas skribitaj per granda litero. Identiga suplemento de substantivo estas rekonata. Mankas nun la eblo difini kompleksaj propraj nomoj kaj tradukado de akronimoj. Ankaŭ bezonata por pola tradukado genro de antaŭnomoj ne estas uzata, do ĉiuj nomoj estas aŭ viraj aŭ inaj. Fleksio de familinomoj estas en pola lingvo tre kompleksa kaj ĝis nun tute ne konsiderata. Mi volas iam kolekti ĉiujn substantivoj, kiuj povas estas priskribitaj per propraj nomoj (ekz: Sinjoro, Urbo, Rivero, Firmao). Mi supozas, ke por plibonigo de tradukado, estus necesa antaŭa analizo de teksto je propraj nomoj.

Alia temo estas la difino de tradukaj informoj de uzanto por cetera teksto. Tio estas propraj vortaroj kaj listoj kun propraj nomoj.

Keine Kommentare »

No comments yet.

RSS feed for comments on this post. TrackBack URL

Leave a comment

Du musst angemeldet sein, um einen Kommentar abzugeben.

Powered by WordPress