Esperantilo Blogo en Esperanto pri projekto Esperantilo kaj komputila lingvistiko

31.10.2006

Nunaj problemoj kun maŝina tradukado al germana lingvo

Filed under: germana lingvo,maŝina tradukado — artur @ 19:10

Nun mi havas du eblojn sisteme testi la kvaliton de maŝina tradukado. Unue mi havas la aron de ekzemplaj frazoj (germanaj ekzemploj). Mi havas ankaŭ la ilon, kiu aŭtomate rekonas ŝanĝojn en tradukado post ŝanĝoj en programo.
Tiel mi frue povas ekkoni, ĉu ŝanĝoj en programo ne havas pliajn eble negativajn influojn ol tiuj, kiujn mi celis.

Sed mi rimarkis, ke la vera kvalito de maŝina tradukado estas videbla nur en realaj tekstoj kompare al realaj homaj tradukoj. Tial mi programis la medion por facile kompari tradukadojn (ekzemplo Ekzemplo de tradukado).

Mi nun malrapide trarigardas la rezultojn. Nun mi devas konstati, ke la kvalito de germanaj tradukoj estas la plej
malaltaj de ĉiuj. Kelkaj frazoj estas eĉ tiel fuŝe tradukitaj, ke la senco de frazo ne estas rekonebla.
Mi analizis kelkajn frazojn, kaj devas konstati, ke la germana lingvo havas kelkajn specialaĵojn, kiu malfaciligas la tradukadon. Tiujn kelkajn specialaĵojn mi eĉ ĝis nun tute ne pritraktis en programo. Germana lingvo postulas ankaŭ pli bona kvalito de analizo de esperantaj frazoj, ol pola aŭ angla lingvoj.

(relative clause extraposition) – Relativsatzextraposition

Esperante oni povus nomi tiun fenomenon: kroma pozicio de relativa subfrazo.
Bonan priskribon en germana lingvo oni trovas ĉi tie.

En germana lingvo oni ofte devas transloki kelkajn verbajn specojn al fino de frazo:

Ekzemploj:


Ich möchte das Buch lesen. (Mi volas legi la libron.)

Er wird sich mit dem Mächchen morgen nicht treffen. (Li ne renkontos la knabinon morgaŭ).

Er reist morgen ab (verbo: abreisen). (Li forveturos morgaŭ)

Tiu okazas ĉe:

  • helpaj verboj (wollen, müssen, …)
  • estonta tempo
  • tranĉeblaj verboj (Trenbare Verben)

La programo en nuna eldono 0.84 bone tradukas tiujn specialaĵojn por facilaj frazoj, sed tute fiaskas ĉe kompleksaj frazoj kun subfrazoj.

Ekzemploj de kroma pozicio de relativa subfrazo:


Mi legos la libron, kiun mi hieraŭ aĉetis.

Sen kroma pozicio

Ich werde das Buch, das ich gestern gekauft habe, lesen.

Kun kroma pozicio

Ich werde das Buch lesen, das ich gester gekauft habe.

En la lasta frazo la relativa frazo ne staras direkte apud la substantivo ‚Buch‘. Ambaŭ frazoj estas gramatike tute korektaj. Ne estas tre klare evidente, kiam la kroma pozicio devas esti aplikata. La ĝenerala tendenco estas, ke por longaj subfrazoj eble multoblaj la kroma pozicio estas preferigita.

nfvp – non finite verb pharases

La dua problemo en la nuna eldona estas ne korekte analizitaj i-frazpartoj (engle: non finite verb pharese).

Ekzemplo:

Mi volas paroli pri tiu libro.

Ankaŭ en tiuj i-frazpartoj en germana lingvo la verbo venas al fina pozicio.

Traduko:


Ich will über dieses Buch sprechen.

Nun la sintaksa analizo en la programo ne povas korekte ekkoni tutajn i-frazpartojn, sed teknike tio estas ebla
kaj mi certe tion faros en venonta eldono de programo.

i-frazpartoj en sintaksa analizo


Mi volas vidi vin. (korekte)

Mi volas paroli pri tio. (malkorekte)
Tial la tradukado modulo de germana lingvo ne translokigis la verbon de i-frazparto al fino de tiu frazparto, sed al fino de ĉefa frazo. Tiu funkcias bone por facilaj frazoj, kvankam la baza sintaksa analizo ne estas korekta.

Mi volas paroli pri tio. Ich will darüber sprechen

La problemojn faras kompleksaj frazoj kun multaj i-frazpartoj. Nun la programo tradukas:

Mi venas paroli pri tio, vidi vin kaj la libron legi. Ich komme über dem, dich und das Buch lesen, zu zu sehen sprechen.

La traduko estas fiaska. Ŝajnas ke mi devas investi tempon por plibonigi la sintaksan analizon. I-frazpartoj ne estas bone rekonataj. Poste mi devos adapti la tradukan modulon por germana lingvo.

La alia problemo estas la germana glosaro (vortaro)

Ŝajne la vortaro estas tre vasta, sed aliflanke por maŝina tradukado, oni ne bezonas ĉiujn eblajn sinonimojn por unu esperanta vorto, sed unu traduko, kiu estas taŭga por plej granda nombro de tradukoj.
Ekzemple por vorto ‚fari‘ la glosaro enhavas sekvantajn tradukojn: machen, erschaffen, anfertigen, herstellen, tun, vollbringen, schließen, hinkriegen, tätigen, leiten, zurücklegen.
Kelkajn de ili oni uzas en tre maloftaj situacioj. En la kampo „ordo“ oni povas specifi, kiu traduko havas la plej altan prioritaton, sed por multaj vortoj tiu ĝis nun ne estas farita.

Keine Kommentare »

No comments yet.

RSS feed for comments on this post. TrackBack URL

Leave a comment

Du musst angemeldet sein, um einen Kommentar abzugeben.

Powered by WordPress