Esperantilo Blogo en Esperanto pri projekto Esperantilo kaj komputila lingvistiko

20.4.2007

Vortaraj trezoroj en la TTT

Filed under: lingvistiko — artur @ 19:45

Mi lastatempe trovis ĉeĥan esperantan vortaron de Jan Amos Komenský sur tiu ttt-paĝo. La ĉefa paĝo estas nur en ĉeĥan lingvo kaj mi havis multajn problemojn retrovi la paĝon. Feliĉe mi povis ion kompreni la pagon kaj mi sukcesis elŝuti la vortaron.

Do mi pensas, ke tiu vortaro ne estas tre konata kaj vere kaŝita trezoro. La vortaro estas en kelkaj vidpunktoj tre interesa. Ĝi estas libera por nekomerca uzado. Ĝi estas tre abunda (170000 nocioj!). Ĝi estas preparita en formato de programo Exel. Tre agrable por komputila prilaboro estas la strukturo de vortaro. La vortaro definas por unu nocio: radiko, nocio, fako, ĉeha traduko, esperanta priskibo aŭ sinonimoj, ĉeĥa priskribo.

Mia unua penso pri tiu vortaro estis. Ho, ĉu mi ne sonĝas, ĉu tiu vortaro vere ekzistas. Por pola lingvo, do lingvo de lando, en kiu naskiĝis ja Zamenhofo, ne ekzistas komparebla vortaro kaj ĉeha nacio havas tiun grandan bonŝancon havi iun, kiu kreis kaj eldonis tiun vortaron laŭ moderna maniero kaj eĉ permesis al alian uzi ĝin. Se tia vortaro ekzistus por pola lingvo, miaj daŭraj obstakloj pri kolektado de polaj vortoj ne estus necesaj. Kvankam la vortaro pritraktas la ĉeĥan lingvon, ĝi montriĝis tre praktika por miaj celoj. Unue ĝi estas la granda provizio de vortoj. Ĝi povus servi kiel kompara matarialo por aliaj vortaroj. Feliĉe la kreinto de vortaro por ĉiu nocio difinis la radikon de vorto. Ĉeĥa kaj pola lingvo estas tre similaj. Mi povis derivi multajn tradukojn simple per anstatŭigo de kelkaj literoj.

Esperanta lingvo Ĉeha lingvo Pola lingvo
amuza zábavní zabawny
fiziologo fiziolog fiziolog

Post la antaŭigo, mi povis testi, ĉu tiu vorto ekzistas en pola lingvo, poste mi povis aŭtomate krei la liston kun eblaj tradukoj, kiujn mi povas mane tralabori.

Trazaŭro

Due mi pritraktis la esperantan priskribon de nocioj en tiu vortaro. Ofte ili estis sinonimoj de vortoj. Per tiuj informoj kun priskriboj de REVO-Vortaro mi kreis la liston de sinonimoj, kiu estas bazo por mia esperanto-esperanto vortaro. Tia vortaro estas ankaŭ konata kiel trezaŭro (vidu ankaŭ Trezaŭron de UEA). La tiel kreita listo estas tre abunda sed badaurinde enhavas multajn erarojn. Multaj de ili mi korektis, sed aliaj restos sen korekto. Mi esperas, ke kun helpo de tiu listo mi povos iam krei la sencan reton de vortoj, kiu estos necesa por sekva ŝtupo de maŝina tradukado. Nun la trezaŭro en Esperantilo estas la listo kun sinonimoj, unu sinonimo de linio. La linio enhavas vortoj separitaj per simbolo „:“, kiuj apartenas al unu sinonimo.

maldekstra : liva

granda : potenca : ega : kolosa

ĉiutage : en ĉiu tago

becikle : per beciklo : perbecikle

La trezaŭro povas esti uzita per 2 manieroj (En venonta eldono 0.92 de programo Esperantilo). Vi povas uzi la specialan dialogon „Trazaŭro“ per menuo „Lingvistiko->Trezaŭro“ aŭ direkte en teksto per loka menuo „Redaktu->Sinonimoj“ aŭ klavkombino „Ctrl-j“. Tiu listo estas uzata ankaŭ en proceso de maŝina tradukado. La alia valoro de tiu vortaro estas la fakaj priskriboj (Ekzemple: sport, geogr, bot) de ĉiu vorto.Tamen mi havas kelkajn problemojn kun tiu vortaro. Unue la kvanto da nocioj estas tre abunda, ĝi enhavas tre maloftajn vortojn. Multaj de ili mi ne povis trovi nek en aliaj vortaroj nek en la interreto. Do mi ne decidis importi tiujn vortojn al vortaro de Esperantilo.

Keine Kommentare »

No comments yet.

RSS feed for comments on this post. TrackBack URL

Leave a comment

Du musst angemeldet sein, um einen Kommentar abzugeben.

Powered by WordPress