Esperantilo Blogo en Esperanto pri projekto Esperantilo kaj komputila lingvistiko

3.1.2007

Vortaroj en Esperantilo

Filed under: programado — artur @ 19:19

Esperantilo enhavas kelkajn vortarojn, kiuj laboras ofte tute sendepende. La kaŭzoj estas kaj teknikaj kaj historiaj. Ĉar tio povas esti konfuza por uzantoj de programo, mi jen priskribas detale unuopajn vortarojn.

Esperanta vortaro

Tiu vortaro baziĝas sur unuopaj radikoj, kaj uzas similan modelon kiel REVO vortaro. La unua fonto por tiu vortaro estas ankaŭ REVO, sed poste mi vaste plivastigis la vortaron per aliaj derivoj. Mi devas konstati, ke la kvalito de tiu vortaro estas malpli alta ol REVO. La unua celo estis havi grandan nombron de validaj esperantaj vortoj. Ĉar mi uzas statistikajn metodojn kaj analizo de tekstaro, la rezultoj estas ofte adekvataj.

Ĉiu vorto en tiu vortaro havas strukturon: prefikso radiko sufikso Ekzemple prefikso: lern radiko: libr sufikso: o. Tio rezultas la vorton: „lernlibro“. Kiel sufiksoj oni povas uzi nur esperantajn finaĵojn aŭ kombinoj de tiuj. Por ekzemple oni devus difini la vorton: „pollando“ kiel „pol-land-o“ kun „land“ kiel radiko.

Tiu vortaro povas esti redaktata en speciala dialogo atingebla per menuo: Lingvistiko->Radikara Redaktilo

Tiun vortaron uzas Esperantilo por literumado, sintaksa analizo kaj gramatika korektado. Tial estas gravaj ankaŭ la gramatikaj priskriboj. Ekzemple por ĉiuj verboj oni povas difini, ĉu la verbo estas transitiva aŭ povas havi indirektan objekton.

La vortaro estas konservita kiel radikoj.xml dosiero, kiu estas en la programo. Sed mi oferas ankaŭ tiun vortaron kiel XML.

Multlingva vortaro, Traduka Glosaro

En tiu vortaro estas konservitaj tradukoj al naciaj lingvoj. Teknike ekzistas unu listo de esperantaj vortoj (nur bazaj formoj) kaj kelkaj listoj po unu por nacia lingvo. Esperanto (listo kun esperantaj vortoj, ĉiu vorto havas numeron)

1 - skribi, 2 - domo, 3 - homo

Germana lingvo

1 - schreiben, 3 - Mensch, 3 - Leute

Angla Lingvo

1 - write, 2 - house

Se oni difinas novan tradukon, paro de vortoj, kaj la esperanta vorto ne ekzistas en la unua listo, Esperantilo akceptas nur la vortojn, kiuj ekzistas en Esperanta vortaro.

Tiu vortaro povas esti redaktata en speciala dialogo atingebla per menuo: Lingvistiko->Multlingva Vortaro. Oni povas uzi ankaŭ rapidan funkcion (Traduku al nacia sub kursoro) direkte en redaktilo per klavkombinoj (Control-q, Control-space). La vortaro enhavas ankaŭ aldonaj priskriboj pri fleksio kaj gramatiko (legu pli en mia blogo pri glosaro)

Trajtoj de vortaro

  • Nur vortoj en baza formo
  • Participoj estas eblaj
  • Vortgrupoj aŭ Frazpartoj ne estas eblaj (nur unu vorto)

La vortaro estas konvservita kiel Metakit datobanko en dosiero vortaro.mk. Dum la programado mi tamen uzas SQL-Datonbankon mysql, ĉar ĝi estas pli rapida kaj oferes pli bonaj ebloj de traserĉado.

Vi povas direkte elŝuti tiujn vortarojn (unu listo po ĉiu lingvo) de Esperantilo – ĉefa pago

Vortaro de frazpartoj

Tio estas simpla teksto en speciala formato uzata ĉe tradukado. Nun nur tre bazaj funkcioj. La dosiero de pola vortaro estas frazparto_pl.txt. La vortaro uzas specialan formaton kaj ne ekzistas speciala redaktilo por tiu vortaro. Ĉar tiu funkcio estas tre nova kaj eksperimenta, la formato povus ŝanĝiĝi.

Revo Vortaro

Tute sendependa leksikono, kiu estas la kopio de REVO. Mi tamen forigis de tiu vortaroj tradukojn kaj priskribojn pri fontoj por ŝpari spacon.

Vortaroj por literumado per Hunspell

Ili estas specialaj vortaroj por programo Hunspell, kiun mi uzas en Esperantilo por literumado. Normale kun esperantilo mi eldonas nur unu vortaron por Hunspell nur por Esperanto. Tio estas dosieroj eo-Eo.dic kaj eo-Eo.aff. Mi mem ne konstruis tiujn dosierojn kaj ili povas diferenci de interna propra vortaro de Esperantilo. Tiuj dosieroj devenas de OpenOffice projekto. Pli pri tio mi skribis en blogo Literumado. Oni povas instali aldonajn dosierojn por aliaj lingvoj. En Esperantilo, Hunspell estas ĉiam uzata por konstrui liston de proponoj dum la literumado.

6 Comments »

  1. http://www.thschuetz.de/vortaro.php
    w zipie są duże słowniki eo-de i de-eo

    Kommentar von Wimmer — 6.1.2007 @ 11:50

  2. Tak znam te słowniki. Niestety wprowadzenie ich do Esperantilo powoduje kompletny chaos, ponieważ nie odpowiadają one wymaganiom maszynowego tłumaczenia. Patrz blog.esperantilo.org/?p=33. Niemiecki słownik bez (der, die, das) jest prawie nieużywalny. Ponadto ma on trochę za dużo słów, tzn albo archaiczne albo bardzo rzadkie. I to nie znaczy, że pierwsze tłumaczenie jest najczęstsze. Nie posiada on też jakiejś zdefiniowanej struktury, czy jakiejś kodu co do dodatkowych infomacji (gramatyka, fleksja, styl). Poprostu używajacy ten słownik musi być człowiekiem i doskonale władać obydwoma językami. Oczywiście każdy słownik ma swoją grupę i swój cel. Dlatego często muszę zbierać informacje z różnych źródeł. Dobry słownik (glosar) to było by już pół sukcesu w tym projekcie

    Kommentar von artur — 6.1.2007 @ 13:10

  3. Ja przerobiłem te słowniki, za zgodą Thomasa, na format Babylonu i tam dobrze to działa. Dodałem makrami esperanckie formy fleksyjne. dzięki czemu słownik rozpoznaje kilka razy więcej form wyrazowych.
    A nawiasem mówiąc, ciągle brakuje nam nowoczesnych, obszernych słowników zgodnych z otwartymi standardami, których postaci źródłowe można by przerabiać na dowolne inne formaty.
    Sporo roboty przed ruchem.
    BTW – korzystam czasem z Esperantilo, pisze się w tym całkiem przyjemnie.

    Kommentar von Wimmer — 6.1.2007 @ 19:50

  4. Jedyny standard co do tekstów jaki znalazłem to jest TEI http://www.tei-c.org. Ale wydaje mi się za skomplikowany.
    Dobre słowniki w formie elektronicznej to wielki problem.
    Ale już by wystarczyło żeby były konsekwentnie i miały jakąś zdefiniowaną formę.
    I to już przekracza umiejętności przeciętnych ludzi, czyli praca grupowa (jak w Wikipedia) już nie wystarcza.
    Ideałem jest coś takiego jak http://www.canoo.net/ ale to sprawa komercyjna.
    Co do esperanta to REVO, jeszcze trochę czasu potrzebuje ale man nadzieję, że będzie to główne źródło. Niekiedy denerwuje mnie, że esperanccy lingwiści potrafią się bez końca sprzeczać czy słowo np. macxo jest esperanckie albo nie, zamiast zająć się porządkowaniem słownika i wyszukaniem wszystkich czasowników przechodnich.
    Właściwie jest esperanto jak na mój gust jeszcze w powijakach.
    Czy będzie jeszcze coś takiego jak http://wordnet.princeton.edu/ dla esperanta?
    Ważne jest, że jest postęp nie można mieć wszystkiego na raz.

    A pro po. W Esperantilo jest użyteczna funkcja słownikowa w czasie pisania tekstów.
    Wpisuje się słowo np. po niemiecku w formie bazowej (naciska Strg+Spacja) i jest one zamieniane na Esperanckie

    Kommentar von artur — 6.1.2007 @ 22:29

  5. TEI, o ile wiem, chcą wykorzystać informatycy zajmujący się interlingwą. Zobaczymy, co z tego wyjdzie.
    Ja sam zmajstrowałem słownik Ila-Pol z 25 tys. haseł w tekstowym formacie Babylonu. Więcej już nie próbowałem, bo za mało wiem o formatach XML-owych.
    A funkcję w Esperantilo zaraz sprawdzę.

    Kommentar von Wimmer — 7.1.2007 @ 00:30

  6. Artur, rzuć w wolnej chwili okiem do hasła Esperantilo w Helionice. Gdybyś chciał coś poprawić czy uzupełnić, zachowując oczywiście „encyklopedyczność“ hasła, to feel free. Zasady edycji takie jak w Wikipedii.

    http://helionica.pl/index.php/Esperantilo

    Kommentar von Wimmer — 7.1.2007 @ 17:20

RSS feed for comments on this post. TrackBack URL

Leave a comment

Du musst angemeldet sein, um einen Kommentar abzugeben.

Powered by WordPress