Esperantilo Blogo en Esperanto pri projekto Esperantilo kaj komputila lingvistiko

6.4.2011

Esperantilo por OpenOffice sur ĉiu komputilo

Filed under: ĝenerale,programado — artur @ 20:14

La nuna eldono de esperantilo por OpenOffice funkcias nur sur 32-bituma Vindozo kaj Linukso. Nuntempe ĉiam pli da homoj aĉetas la 64-bituman komputilon kaj rimarkas, ke la Esperantilo por OpenOffice (same kiel LibreOffice) ne povas esti instalita.

Nun mi forigis la partojn de Esperantilo, kiuj estas specifaj por operaciuma sistemo. Temas pri gramatika kontrolilo, kiu estas programita per C-lingvo.
Restas tamen literumilo kaj aliaj partoj, kiujn oni povas uzi. Esperantilo por OpenOffice (Elŝutu!) estas la eldono de Esperantilo por OO por ĉiu komputilo. Pro teknikaj kialoj la dosiero estas zip-arkivo. En tiu arkivo troviĝas la kutima oxt-dosiero. Tiu eldono devas ankaŭ funkcii sur Mac-OS.

Mi mem ne posedas la 64-bituman komputilon, tamen mi supozas, ke oni povas instali la 32-bituman eldonon de OO kaj ankaŭ daŭre uzi Esperantilon kun gramatika korektilo.

9.3.2010

Komparo de maŝina tradukado de Esperantilo kun Apertium eo-en

Filed under: ĝenerale — artur @ 22:51

La projekto apertium rapide evoluas. Nun mi eltrovis, ke ekzistas jam la traduka modulo por lingva paro eo-en (esperanto angla). La tradukado inter esperanta kaj angla lingvo en du direktoj estas nun eĉ ebla rekte de reta paĝo de projekto. Mi instalis la aktualan eldonon de projekto apertium kaj povis testi la programon. La instalo sur propra komputilo ne estas tasko por hobiuloj. Do kutime oni uzus la retan interfacon sur apertium.org.

Mi uzas por programado de Esperantilo aron de ekzemplaj frazoj, kaj tuj skribis la programon, kiu montras kune rezultojn de maŝina tradukado de ambaŭ programoj.

Evidentiĝis, ke la projekto apertium frontas la samajn problemojn kiel Esperantilo. La kvalito estas tre simila kaj tute ne perfekta. Mi supozas, ke apertium havas pli bonan vortaron, sed Esperantilo povas pli bone regi la gramatikon. Do apertium tute ne povas reordigi frazpartojn laŭ angla maniero kaj havas problemojn kun aldonaj vortoj kiel „a kaj do“. Okazas, ke la reordigo de frazpartoj ĉe Esperantilo tute fiaskas kaj la rezulto estas tute nekomprenebla. 83 tradukoj de 574 tradukis ambaŭ programoj tute same.

Ekzemploj:

  • Mi havas libron.
  • esperantilo: I have a book.
  • apertium: I have book.
  • Li estas juna homo.
  • esperantilo: He is a young man.
  • apertium: He is young folk.
  • Mi konas neniun ruson.
  • esperantilo: I know no Russian.
  • apertium: I know any Russian.
  • Kio vi estas?
  • esperantilo: What are you?
  • apertium: What you are?
  • Ĉu vi estas instruisto?
  • esperantilo: Are you a teacher?
  • apertium: Whether you are teacher?
  • Mia fratino, kiu lernas bone, scias multe.
  • esperantilo: My sister, who learns well, knows a lot.
  • apertium: My sister, that learns well, know a lot.
  • Ĉu via laboro lacigas vin?
  • esperantilo: Does your work tire you ?
  • apertium: Whether yours work *lacigas you?
  • Ĉu via laboro lacigas vin?
  • esperantilo: Does your work tire you ?
  • apertium: Whether yours work *lacigas you?

Mankas al mi tiuj frazoj tradukitaj de homo. Do mi ofte ne scias, kiu estas la ĝusta traduko. Se mi havus anglajn homajn tradukojn, mi povus ankaŭ testi la alian direkton. Ĉu iam troviĝus bonvola angla nacilingvano, kiu povus kaj volus fari tion? Kun ĝustaj tradukoj oni povus aŭtomate
pritaksi la kvaliton de traduko kaj fari aliajn interesajn aferojn.

Estas tre ĝojiga afero, ke ekzistas nun la dua libera programo kaj oni povas kompari la rezultojn de ambaŭ programoj kaj lerni de tio.

Mi de kelkaj jaroj ne plu laboras pri angla traduko. Mi ne havas sufiĉan tempon, kaj kun mia limigita tempo mi volas plibonigi almenaŭ unu lingvon. Tio estas la pola lingvo. Eble mi povus iam kompari ambaŭ tradukajn vortarojn de projektoj kaj pliĝustigi la vortaron de Esperantilo.

Jen tutaj rezultoj.
Komparo de Esperantilo kun Apertium

Mi havas ankaŭ kelkajn paralelajn tekstojn, kiuj povas esti uzataj por komparo.
Vidu Paralela teksto esperanta kaj angla

20.5.2009

„ne jam“ = „ankoraŭ ne“?

Filed under: ĝenerale — artur @ 22:04

Mi ofte estas surprizita de kelkaj tiaj kunligoj de vortetoj. Por mi la kunligo „ne jam“ estas iam ŝtranga kaj mi
eĉ devas bone pripensi, kion tio signifas.

Ekzempla frazo: “ La problemo estas kompleksa kaj ne jam solvita“.

Ŝajnas, ke en tiu frazo oni povus uzi „ankoraŭ ne“.
Mi trovis en la esperanta korpuso, ke „ne jam“ aperas 161 foje kaj „ankoraŭ ne“ 659 foje kaj „ne ankoraŭ“ 18 foje. Do ne eblas diri, ĉu iu formo estas malĝusta aŭ ne.
Ĉu la programo „Esperantilo“ plendu pri „ne jam“ aŭ „ne ankoraŭ“?

Ĉu temas pri iu nacia kutimo?

  • Germana: „noch nicht“
  • Pola: „jeszcze nie“
  • Angla: „not yet“ (ni havas la kulpulon!)
  • Rusa: „ещё нет“

Interese estus pruvi, ĉu la ofteco de uzado de „ne jam“ ŝanĝiĝis en lastaj 100 jaroj en esperantaj tekstoj. Poste oni povus diri, ĉu la influo de angla lingvo sur Esperanto kreskis.
Mi mem tute ne ŝatas la anglan uzadon de interpunkcio en esperantaj tekstoj kaj la rigidan ordon, kiu estas tute
superflua en esperanta lingvo.
Kion fari? La angla lingvo ŝajne vere regas la lingvan mondon.

17.5.2009

Esperantilo denove laboras kun OpenOffice

Filed under: ĝenerale — artur @ 21:28

Fine mi sukcesis pretigi la novan eldonon de kromprogramo Esperantilo por OpenOffice.
Tiu programo laboras kun aktuala OpenOffice 3.1.
Do la uzantoj de OpenOffice povas nun uzi la gramatikan korektilon de Esperantilo rekte en OpenOffice.
Oni nur devas instali la kronprogramon de Esperantilo por OpenOffice.

Pluaj informoj pri uzado de kontrolilo oni trovas en dokumentaro de OpenOffice.

Kelkajn bildojn.

Fenestro

Korektilo

Preferajxoj de OpenOffice

La adaptigo de Esperantilo por nova eldono de OpenOffice estas pena laboro.
Mi frontis kelkajn teknikajn problemojn, sed helpe de aliaj programistoj mi sukcesis fari tion.
Nun ekzistas kelkaj liberaj gramatikaj korektiloj por OpenOffice.
Feliĉe mi povis trarigardi la kodaron de aliaj programoj kaj gajni valorajn informojn.

Decidajn informojn mi trovis en la kodo de Voikko.
Tio denove estas por mi la pruvo, ke la venonto de komputiko estas en liberaj programoj.

29.9.2008

Esperantilo 0.986 sur OpenOffice

Filed under: ĝenerale,programado — artur @ 21:32

Fine mi sukcesis kuri Esperantilon kiel kromprogramo de OpenOffice. Mi jam skribis pri tio en mia frua blogo.
Nun oni povas elŝuti la programo direkto de retejo de OpenOffice por kromprogramoj (angle: extensions). Nun la programo kuras nur kun nova eldono de OpenOffice 3.0, unue nur sur linukso.
Poste mi provos prepari la eldonon por vindozo. Nun oni povas uzi la gramatikan korektilon de Esperantilo direkte de OpenOffice. La nova interfaco (API) de OpenOffice en eldono 3.0 ebligis tion.
La programado de kunlaboro de OpenOffice kun Esperantilo ne estis simpla afero kaj mi bezonis kelkajn vesperojn pro realigi tion. Kvankam la gramatika kontrolilo por Esperanta lingvo ne ŝajnas esti interesa por plej granda parto de homoj, jam en unuaj tagoj tiu programo estas elŝutita de 30 personoj.

OpenOffice Esperantilo

Laŭ mia scio Esperantilo estas la dua programo, kiu laboras kun OpenOffice. Tio estas certe tre bona verbado por esperanta lingvo. Se OpenOffice havas gramatikan kontrolilon por tiu lingvo, tio por multaj homoj povas signifi, ke tiu lingvo estas vaste uzata. Nun mi atendas, ke aliaj programoj oferus la principan eblon de gramatika kontrolado. Mi esperas pri Firefox, KDE.

Eldono 0.986

Leo kaj Paul denove raportis multajn problemojn pri gramatika korektado.
Mi sukcesis korekti 62 raportitajn erarojn.
Aldone mi ankaŭ plibonigis la pruvadon de transitiveco de verboj.
Nun la programo povas indiki pri sekvaj eraroj.

  • La festo komencis. – La festo komenciĝis.
  • Mi startis la komputilon. – Mi startigis la komputilon.

En tiu eldono la kontrolilo indikas ankaŭ pri eblaj falsaj amikoj laŭ la listo de vikipedio.
La programo ankaŭ sugestas pri la uzo de pli oportunaj samsignifaj vortoj de la listo de retejo„bona lingvo“.

21.12.2007

La lasta eldono de Esperantilo en jaro 2007

Filed under: ĝenerale — artur @ 21:01

Tio estas la lasta eldono de Esperantilo en tiu jaro. Mi plejparte laboris pri plibonigo de maŝina tradukado al sveda lingvo. Ĉio ĉi okazis pro iniciato de KaGu. Mi mem tute ne regas la svedan lingvon kaj mem neniam programus tiun tradukan modulon.

Mi ankaŭ laboris pri plibonigo de tradukado de angla lingvo al Esperanto. Nun Esperanto povas traduki la bazan gramatikon de angla lingvo. Tio bone sukcesas por facilaj frazoj. Mi testis la programon sur instrua angla materialo, kiu enhavas nur facilaj frazojn. La rezultoj estas bonaj. La problemoj komencas ĉe realaj tekstoj, kiujn mi hazarde prenis de interreto. Por traduko de angla lingvo mi uzas la fremdan sintaksan analizilon de projekto „link grammar parser“. La ebloj de tiu analizilo limigos la kvaliton de tradukado. Tamen mi estas iom surprizita kiel bona tiu analizilo estas. Tio estas unu de maloftaj universitataj projektoj, kiuj rezultigis uzeblan modulon kaj ne nur sonĝitaj tekstoj.

Mi korektis ankaŭ kelkajn erarojn, kiujn feliĉe raportis la uzantoj per la ena erara raportilo de Esperanto. Multaj eraroj raportis KaGu.

Estas por mi tre malhelpa afero, ke uzantoj ne raportas pri eraroj. Mi iam ekscias pri deziroj aŭ eraroj en programo de iuj diskutforumoj. Mi iom ĉagrenas, se mi legas: „Mi ne povis uzi la programon, ĉar ĝi havas tie kaj tie eraron.“. Kiam tiuj homoj komprenos, ke se ili ne raportos pri tiu eraro, la eraro neniam estos korektita. Kial la uzantoj ne raportas al mi? Mi pensas, ke ĉe tiu afero funkcias la sama psikologia afero, kiel ĉe helpado al homoj en amaso da homoj. Se iu suferas en amaso da homoj kaj krias por helpo, neniu helpas. Ĉar ĉiu pensas, ke eble helpos iu alia. Finfine neniu helpas. Ankaŭ uzantoj, kiuj trovis iun eraron, pensas, ke aliaj eble reportos pri tio. Bedaŭrinde la nombro de Esperantistoj estas tre malgranda, kaj nur kelkaj de ili uzas tiun programon. La sama afero estas ankaŭ pri vortumo de deziroj. Mi ankaŭ nur sporade uzas kelkajn funkciojn de Esperantilo. Se neniu raportos, nenio okazos.

Nuntempe eble multaj projektoj suferas pro tiu afero. La novaj uzantoj de reto kutimis havi ĉion tuj en bona kvalito. Ekzistas multegaj interesaj aferoj en la reto. Tial oni ne havas multe da tempo por iu afero. La tempo de intereso por iu afero estas tre mallonga. Estas tre malfacila sed grave afero uzi tiun mallongan tempon por raportado kaj instigo por reagoj. Tial la programoj devas mem kolekti datojn kaj aŭtomate sendi ilin al gepatra sistemo. Tial la uzantoj mem kaŭzas pro ilia konduto tiun kolektadon de datumoj. Tio estas la prezo por mankantaj reagoj.

Nun oni povus uzi Esperantilon por tradukado inter angla kaj pola lingvoj en ambaŭ direktoj helpe de Esperanto. La rezultoj ne estos bonaj, ĉar ĉiu tradukado kaŭzas perdon de kvalito. Mi ankaŭ ne pensas, ke tio estas teknike bona ideo. Mi skribis pri tio jam tiu blogo

Nuntempe ne estas eble en Esperantilo traduki maŝine direkte inter pola kaj angla lingvoj. Tio estos temo por sekva eldono. Tiu funkcio estus ankaŭ utila por Ne-Esperantistoj. Oni tiam povos traduki direkte ekzemple de pola lingvo al germana aŭ sveda lingvoj. Mi ne planas la sekvan plivastigon de tiu programo. Mi volas nun malfermi la programadon de ĉiuj funkcioj kaj pretigi dokumentaron. La lasta eldono venos en eble aprilo. Tiam mi haltigos por iom da tempo la evoluon de programo.

Esperantilo nun rekonas la duobligon de vorto kiel ebla skriba eraro.

3.9.2007

Kunsido de Projekto „Gramatika Korektilo“

Filed under: ĝenerale,lingvistiko — artur @ 19:45

La 25 kaj 26 aŭguston mi partoprenis la unuan kunsidon
de kreiĝanta projekto GramatikKontrolilo. Mallonge dirite la projekto celas krei gramatikan kontrolilon helpe de subteno de organizo ESF. La organizo jam subtenas kelkajn tre gravajn kaj sukcesajn projektojn en Esperantujo. Tiuj estas interalie la konata retejo Lernu.net, la tekstaro de Esperanto kaj tradukado de programo OpenOffice. La iniciatinto kaj la organizanto de tiu projekto estis Hokan Lundberg, kiu tre trovis kaj kontaktis ĉiujn partoprenantojn.

Tio estas por mi la unua fojo, kiam mi povus uzi Esperanton kiel parolata lingvo. Tio estis tre interesa sperto por mi. Mi havis kelkajn problemojn kun prononcado, sed entute mi povus normale paroli kaj ĉion kompreni. Mi pensas, ke longa (4 jara) aŭskultado de pola radio kaŭzis tion.

Ĉe la kunsido mi povus konatiĝi kun tre interesaj homoj. Ĉiuj estis tre engaĝiĝitaj Esperantistoj kaj lingvistoj kun vastaj konoj de komputila lingvistiko. Nun mi povis direkte paroli kun Eckhard Bick, kiu estis por mi jam delonge konata de projekto VISL. Tiun projekton mi tre atende trarigardis antaŭ kelkaj jaroj, kiam mi komencis la okupon pri komputila lingvistiko. Mi renkontis Sonja Petrović Petrovic kaj Hokan Lundberg, laborantoj de projekto „Lernu“, Judith Meyer, kiu kreis la retejon „Amikumu“, Marek Blahuš kaj Henning von Rosen.

Ĉe tiu kunsido mi povis prezenti la programon Esperantilo, kiu jam enhavas gramatikan korektadon.

Mi dekomence signalis, ke mi ne povas aktive kaj plene partopreni en la projekto. Unue mi ne havas sufiĉe da tempo, due mi ne volas okupi pri tiu temo en alia maniero kiel ŝatokupo. Tamen estis tre agrable, ke mi ankaŭ kiel neprofesiulo povis partopreni en la kunsido. Feliĉe la gvidadon de projekto povus preni Eckhard Bick, kiu estas tre sperta lingvisto kaj delonga Esperantisto kaj jam faris gramatikan kontrolilon de dana lingvo kadre de programo „ordred“. Do oni ne bezonos fari ĉion de komenco. Eckhard Bick havas diversajn pretajn modulojn por esperanta lingvo kaj la testitaj metodoj por dana lingvo. Do oni bezonas adapti tiujn metodojn kaj modulojn por esperanta lingvo. Nur kelkaj elementoj de sistemo devus esti farita tute nove. Ĉe priskribo de taskoj de projekto evidentiĝis aldonaj subprojektoj. Tiuj estas

  • Literumado
  • Bazo de sintaksaj arboj
  • Bazo de eraroj

En la unua ŝtupo de projekto la gramatika kontrolado estas oferota nur kiel reta interfaco. Poste la gramatika kontrolado devos funkcii en la programo OpenOffice. Ĉar kelkaj elementoj de sistemo estas faritaj kedare de komercaj projektoj, tiu sistemo ne estos plene malferma. Tio ne estas por mi bona informo, ĉar mi kiel programisto normale havas la intereson rekonstrui la sistemon de fontoj kaj adaptigi ĝin por aliaj taskoj aŭ operaciemaj sistemoj. Mi ankaŭ pli volonte legas la programan fontan kodon ol sciencajn laboraĵojn. Tamen ĉiuj direktaj rezultoj de tiu projekto estos malfermaj por vasta publiko. Mi esperas, ke ankaŭ la projekto Esperantilo povus profiti de tiu projekto kaj mi oferis ankaŭ helpon al tiu projekto.

Por mi la plej interesa parto de la kunsido estis la prezento de Eckhard de metodoj de analizo de tekstoj laŭ la teorio de „Contraint Satisfaction“, tiu metodo estas tre simpla. CG ne havas fonton en teorio de generativa formalismo, sed estas rezulto de tre pragmatikaj pensoj. La fontaj datoj por GG-Analizilo estas etikeditaj vortoj.
Normale ĉiuj vortoj posedas diversajn ambiguajn etiketojn. La analizilo forigas aŭ aldonas etiketojn sur nivelo de vortoj laŭ priskribitaj reguloj.
La reguloj de CG estas simplaj proceduroj laŭ modelo: „Forigu/Aldonu la etiketon ĉe vorto kun etikedoj, se la kondiĉo estas prava.“ Kondiĉoj priskribas la najbarajn vortojn. Tiu estas do pure procedura priskribo kontraŭe al diskriptiva priskribo de generativaj metodoj. La ĉefaj avantaĝoj de CG estas ĝia stabileco, rapideco kaj simpleco. Mi pensas, ke tiu metodo estas ankaŭ ekzemplo por bona divido de taskoj inter programistoj kaj lingvistoj. Nun programistoj povus programi CG-Analizilon, kaj lingvistoj havas simplan proceduran lingvon por manipulado de etiketoj. Do CG-Formalismo estas la tiel nomata Domain Specific Language.
Antaŭ 4 jaroj mi multe pensis pri la metodo, mi tiam ankaŭ trovis la liberan analizilon de projekto VISL. La nova versio de tiu analizilo estas CG3. Tamen mi havis grandajn problemojn kompreni la signifon de multnombraj etiketoj. Kvankam mi trovis ekzemplajn regulojn por angla lingvo, mi ne povis uzi tiun analizilon. La forta flanko de CG estas forigo de ambigueco. Ĉar en Esperanto tiu problemo apenaŭ ekzistas, la uzeblecon de tiu metodo mi ne konsideris tiam kiel tre granda.

Kiel mi nun scias, tre interese estas, ke la CG-on oni povas ne nur uzi por disambigueco de vortklasoj, sed ankaŭ por sintaksa analizo kaj kreo de „functional dependency grammar“. Ankaŭ semantika analizo povas uzi CG-analizilojn. Per la sama metodo oni ankaŭ povas trovi gramatikajn erarojn. Do la gramatika korektado estas nur unu elemento en la ĉeno de CG-analizoj, kiuj laboras laŭ diferencaj reguloj. La plej kompleksaj reguloj ekzistas por sintaksa analizo. La komplekseco de tiuj reguloj estas eble la plej malavantaĝa aspekto de tiu metodo. Por averaĝa lingvo oni bezonas pli aŭ malpli 900 regulojn. La flegado de tiuj reguloj ne estas facila kaj oni bezonas longan sperton pri tio. La ordo de reguloj havas grandan influon sur la rezulto. Kutime oni unue difinas bazajn regulojn kaj poste aldonas aliaj kondiĉojn kaj aliajn regulojn. Do la legebleco de reguloj iĝas pli kaj pli malalta. La difino de ĉiuj necesaj reguloj estas laboro por jaroj. Estas malavantaĝe, ke tiun laboron oni ne povas dividi inter kelkaj homoj, ĉar la influo de reguloj inter si estas tre granda. Tamen la komplekseco de reguloj estas la problemo en ĉiuj ĝisdataj metodoj. De teknika vidpunkto la formalismo de reguloj havas kelkajn malavantaĝojn, kiuj rezultigis la neceson de multaj reguloj. Per reguloj oni ne povas difini rekursiajn strukturojn. Tiuj reguloj nur limigite ebligas la uzon de ĝeneraligo (nur per difino de listoj). Ankaŭ la uzado de metodo „backtracking“, kiu por kelkaj problemoj de sintaksa analizo estus tre konvena, ne estas ebla ĉe CG.

En Esperantilo mi ankaŭ uzas la metodon, kiu estas simila al CG. La metodo estas „button-up“ kaj ne enhavas „backtracking“. Tial ankaŭ la analizo en Esperantilo ĉiam ion rezultigas kaj estas sufiĉe rapida. En Esperantilo mi havas nur 100 bazajn regulojn, kvazaŭ ili kovras preskaŭ tutan gramatikon de Esperanto. Kelkaj aldonaj analizoj por subfrazoj, relativaj subfrazoj kaj infinitivaj frazpartoj estas programitaj speciale. La diferenco inter Esperantilo kaj CG estas, ke en Esperantilo dekomence ĉe sintaksa analizo vortoj estas grupigitaj kiel sintaksaj subarboj. Tial la reguloj por sekva ŝtupo povas esti difinitaj pli ĝenerale. Mi uzas la fakton, ke ofte la grupo de vortoj povas esti pritraktato nur kiel la kapo de tiu grupo. Ekzemple por ĉiuj substantivaj frazpartoj: „libro“, „bona libro“ „bona libro skribita de fama aŭtoro“ la plej grava estas la kapo „libro“. Do sekva analizo povus pritrakti nur tiun vorton. Tial okazas ĉe analizo redukto de komplekseco.

Mia nuntempa sento pri la problemo de sintaksa analizo estas, ke oni bezonus diferencajn metodojn por atingi bonajn rezultojn. La rekono de substantivaj frazpartoj postulas aliajn metodojn ol analizo de subfrazoj kaj konjunkcioj. Diskriptivaj reguloj estas ofte pli elegantaj kaj pli mallongaj ol procedurdeklaraj. Kelkajn problemojn oni povas nur bone solvi per „backtracking“.

La sukceso de CG eble plejparte baziĝas sur speciala programa lingvo, kiu estas farita nur por lingvistoj. Per tiu programa lingvo lingvistoj kapablas mem difini regulojn. Ekzistas ankaŭ kelkaj ideoj, kiel plibonigi la uzeblecon de CG. Miaopinie oni povus konsideri sekvajn punktojn:

  • Aŭtomata kreado de CG-reguloj de pli ĝeneralaj reguloj.
  • Aŭtomata kreado de CG-reguloj de statistika analizo de bazo de sintaksaj arboj.
  • Aldonaj iloj, kiuj helpos ĉe difino kaj testado de reguloj.
  • Plivastigo de CG je aldonaj metodoj.

Por pli bona pritakso de CG mi bezonus pli da informoj. La projekto VISL havas la analizilon por esperanta lingvo, sed la analizilo ankaŭ havas problemojn kun komplikaj frazoj simile al analizilo de Esperantilo. Tion mi povis konstati post kelkaj testoj per reta interfaco de projekto. Interesa estus la demando, ĉu estas eble plibonigi la analizon kaj kiom da energio tio postulus. Malbonŝanĉe reguloj por neniu lingvo estas libere atingeblaj, do oni povus nur iom havi la ideon pri la verko de reguloj post studado de kelkaj sciencaj laboraĵoj.

Se mi havos sufiĉe de libera tempo, mi volas pli detale okupiĝi pri CG-Analizilo. Mi eĉ povus uzi la liberan CG-Analizilon en Esperantilo, ĉar mi povas bone reuzi modulojn, kiuj estas skribitaj en programa lingvo C++, de programa lingvo XOTcl. La bona tasko por CG estus la analizo de pola lingvo.

Por Esperantilo estus bone klare disigi la regulojn de programado de analizilo. La programa lingvo, kiun mi uzas ĉe programado de Esperantilo, estas sufiĉe abstrakta kaj potenca por uzi meta-programadon. Do mi programas regulojn de analizo kaj la analizon en la sama programa lingvo. Aliflanke la klara diferenco inter lingvaj reguloj kaj programado de analizilo ne ekzistas tiel forte kiel en CG-metodo.

Resumo

Mi estas tre ĝoja, ke la projekto Esperantilo iel ankaŭ instigas kaj inspiras aliajn pli profesiajn projektojn. Tio estas por mi grava motivigo por plia okupo. Dum la renkontiĝo mi povis konatiĝi kun tre interesaj homoj kaj mi havis novojn ideojn. Nun mi estas tre scivola pri la sekva evoluo de tiu projekto.

18.8.2007

Silezia lingvo

Filed under: ĝenerale — artur @ 09:06

Mi devenas de Silezio, kiu estas regiono de nuna Pollando. Tiu regiono estas kulture kaj historie tre riĉa. Bedaŭrinde du lastaj grandaj militoj kaj ĝiaj sekvoj detruis parton de tiu riĉeco. Unu aspekto de tiu kultura riĉeco estas aparta lingvo aŭ forta dialekto. Ĝi baziĝas sur slava lingvo, sed enhavas multajn germanajn influojn. Ĝi estas preskaŭ ne komprenebla por Poloj kaj por germanoj.
Verdire ne ekzistas unu silezia lingvo, ĉar ĉiu urbeto havas apartan specon de tiu lingvo. Do ni povas diri nur pri aro de sileziaj lingvoj. Tiu lingvo estas daŭre aŭskultebla sur stratoj de Silezio kaj estas ankaŭ parolata hejme. Ankaŭ mi komprenas tiun lingvon, sed nun mi ne povas aktive uzi ĝin.

La silezia lingvo estas vera trezoro por lingvistoj. Ĝi enhavas elementojn de maljuna pola lingvo.
Sur ĝi oni povas perfekte studi la evoluon de lingvoj. Fama pola lingvisto profesoro Jan Miodek, kiu devenas de Silezio, estas ankaŭ esploristo de silezia lingvo, kaj li aparte kontribuis al lingvistika esplorado de tiu lingvo.

Nun la intereso por silezia lingvo kreskas. Ekestas kluboj de parolantoj de tiu lingvo kaj ankaŭ kelkaj lokaj radiostacioj uzas tiun lingvon. Interese por mi estas, ke ankaŭ tiu lingvo nun iĝas jen kaj jen la skribita lingvo. Ekzistas diversaj libroj en tiu lingvo: rakontoj, vortaroj kaj lingvistika fakliteraturo. La proceso de formado de skribita silezia lingvo estas nun en la komenco. Ofte oni uzas polan alfabeton por skribi tiun lingvon. Tamen la pola alfabeto ne taŭgas por silezia dialekto, ĉar la fonemoj estas diferencaj. Pli taŭga estas la ĉeĥa alfabeto, kiu ankaŭ estas pli moderna. Nun ekzistas du sileziaj alfabetoj, kiu baziĝas sur ĉeĥa alfabeto: A B C Ć Č D E F G H I J K L M N Ń O P R Ř S Ś Š T U Ů W Y Z Ź Ž. Simile kiel en Esperanto oni evitis la uzon de multaj literoj por esprimi unu fonemon. La afero estas tre interesa. Ĉu silezia lingvo iĝos iam plena skribita lingvo? Sur paĝoj de retejo Po Nasymu oni trovas informojn pri silezia lingvo kaj sileziajn tekstojn.

La granda venko por silezia lingvo estas la akcepto de tiu lingvo de biblioteko de usona kongreso. La oficiala mallongiĝo por tiu lingvo estas „szl“. La sileziaj organizoj longe batalas pri aprobo de silezia lingvo flanke de polaj aŭtoritatoj. Tio nun ne estas ebla en Pollando. La aferon akompanas multaj politikaj pensoj. La aprobo de silezia lingvo estus la unua ŝtupo al aprobo de silezia nacieco. Tion tute ne ŝatas polaj aŭtoritatoj kaj granda parto de kerna pola popolo. Kutime tiuj streboj estas rigardataj kiel pruvoj de malstabiligo de pola ŝtato de germana flanko kaj ĝenerale kiel perfido al pola nacieco. Loĝantoj de Silezio spertis ofte malavantaĝojn uzante sian lingvon. Infanoj estas mokataj en skolo de instruistoj. Nur en regionoj, kun forta silezia komunumo oni kuraĝis paroli publike en tiu lingvo. Ofte por Poloj tiu lingvo estis la lingvo de homoj needukitaj, kiuj ne kapablis korekte paroli pole. Aparte malkontente oni rigardis germanajn influojn en silezia lingvo. Iom ŝerce oni diris, ke silezia povas esti nur kolbaso sed ne aliaj aĵoj. (Tiu speco de bongusta kolbaso estas tre konata en tuta Pollando).

Tiuj politikaj aferoj ne interesas min speciale. Mi esperas, ke en unuiĝinta Eŭropo ankaŭ malgrandaj regionoj havus ŝancon kultivigi sian kulturon kaj identecon. Alia interesa fakto pri Silezio estas, ke multlingveco estis en silezia regiono tute normala afero. Miaj geavoj povis komuniki kun Poloj kaj kun germanoj. Kvankam ili ne parolis perfekte nek pole nek germane. Ankaŭ nun multaj Silezianoj sentas sin inter du kulturoj. Por ili pola kaj germana kulturo estas same kutima, kaj ili havas ilian propran malgrandan specifan silezian kulturon. Bedaŭrinde tiuj faktoj ne estas konvenaj por kelkaj kapoj. Ankaŭ Silezianoj havas tre diferencaj opinioj pri tiu komplika temo. Oni nenie povas aŭskulti la tutan veron.

En Silezio ekzistas ankaŭ forta grupo de Esperantistoj kaj havas longan historion Esperanto en Silezio.

Mi tuj pensis pri subteno de silezia lingvo en Esperantilo. Mi pensis unue pri esperanta-silezia vortaro. Bedaŭrinde la sileziaj vortaroj, kiujn mi vidis ĝis nun en la reto, estas tre malgrandaj. Tiuj vortaroj ofte enhavas nur specialajn sileziajn vortojn, kiuj ne estas konataj al Poloj. Mi esperas, ke sileziaj lingvistoj publikigos libere pli da materialoj kaj iam Esperantilo regos ankaŭ tiun lingvon.

11.8.2007

Eldono 0.95

Filed under: ĝenerale — artur @ 08:36

Ankaŭ en aŭgusto mi preparis novan eldonon laŭ la moto de libera programado: „publikigu ofte sen longaj paŭzoj“. La eldono ne enhavas grandajn ŝanĝojn, tamen mi sukcesis korekti kelkajn erarojn. Aliaj funkcioj estas maturigitaj. Du uzantoj uzis la eblon direkte raporti la erarojn de la programo per menuo: „Helpo>Raportu pri programo“.
Bedaŭrinde pro la eraro en la raportado de eraroj mi ne ricevis la respondan adreson de raportintoj, do mi ne povis direkte kontakti ilin.
Listo de novaĵoj:

Pola tradukado

  • Traduko de frazoj de tipo: Libro de li al lia libro
  • Tradukado de kelkaj infinitivaj frazparton en germana maniero. Mi vidis lin labori. al Widziałem jego, kiedy on pracował.
  • Komperativa formo de adjektivo estis plivastigita en vortaro
  • Korektoj en generativa fleksio de verboj kaj adjektivoj
  • Reguloj por tradukado de prepozicioj estas nun komplete en vortaro
  • Korekto de reordigo de kompleksaj substantivaj frazpartoj.
  • Korektoj de tradukado de numeraloj ekz. unu triono.
  • Oni povas difini tradukadon, kiu estas dependa de kunteksto, direkte en vortaro.
    • ĉefa verbo ĉe subjekto – kun
    • ĉefa verbo ĉe objekto – kunobj
    • verbo substantivo – kun
    • verbo objekto – kunobj
    • verbo adverbo – kunadv
    • adjektivo substantivo – kun
    • advebo ĉefa verbo – kun
    • prepozicio substantivo – kun

    Ekzemple traduko al germana lingvo „al polando“„nach Polen“ postulas en traduka vortaro por vorto al – al : nach : {kun polando}.
    Aldonaj ekzemploj vi povas vidi en vortaro de programo Esperantilo.

Ne hezitu raporti erarojn kaj viajn dezirojn!

10.8.2007

Renkonto kun Esperantisto kaj uzanto de Programo Esperantilo

Filed under: ĝenerale,germana lingvo,reagoj — artur @ 17:34

Per interreta letero mi konatiĝis kun Esperantisto Eckhard Stoll, kiu eble estas al ceteraj homoj konata de Radio Sauerland Welle kaj elsendoj pri fondaĵo Bona Espero. Post kelkaj leteroj kaj longa telefonado ni decidis renkonti. Eckhard estas ankaŭ la kreinto de alia traduka programo Ecoso. Do ni havis multegon por priparoli pri programado kaj maŝina tradukado. Ni parolis multege pri teknikaj aferoj kaj interŝanĝis ideojn pri tradukaj programoj. Mi povis montri direkte kelkajn specialajn funkciojn de programo Esperantilo kaj rakonti pri ĝia programado.

Mi decidis detale priskribi kelkajn ideojn de tiu renkonto. Tio estas ankaŭ por mi la unua okazo por paroli direkte kun uzanto de Esperantilo. Per tiuj diskutoj mi eksciis pri plibonigindaj flankoj de programo kaj ekhavis ideojn por plua evoluo. La programo Ecoso ne oferas altan kvaliton de maŝina tradukado, tamen ĝi enhavas funkciojn, kiuj ne estas nun en la programo Esperantilo. Oni povis tajpi Esperantajn vortojn kaj samtempe observi la tradukadon al germana lingvo. Mi longe ne povus imagi, kiu vere bezonus tiun funkcion. En mia kapo mi havis nur unu tipon de uzado de programo. La uzanto havas Esperantan tekston, kiun li volas traduki al cela nacia lingvo. Tamen mi devis konfesi, ke maŝina tradukado estus ankaŭ uzebla por propedeŭtikaj kialoj. Ni imagu, ke komencanta lernato de Esperanta lingvo volas krei esperantan tekston. Lia provizo de esperantaj vortoj ne estas granda. Li ankaŭ havas problemojn kun esperanta gramatiko. Li tamen volas skribi leteron al iu alia Esperantisto. En tiu kazo li kutime uzus ofte vortaron kaj necesus korektadon. La programo Ecoso estas farita direkte por tiuj uzantoj. Oni tajpas esperantajn vortojn kaj povas direkte kontroli en vortaro, ĉu la vorto estas korekta. Do la maŝina tradukado ĉefe gravas kiel kontrola teksto. Tio nun ankaŭ estas por mi pli evidenta, ĉar mi ofte rimarkas erarojn en miaj esperantaj tekstoj nur, post kiam mi tradukis ilin al pola lingvo. Do la kombino de literumado, gramatika kontrolado kaj maŝina tradukado estas tre avantaĝaj por komencantoj de esperanta lingvo. Mi ankaŭ en frua blogo pensis pri uzantoj, sed pri tiu tipo de uzado mi ne pensis.

De eldono 0.94 Esperantilo ankaŭ enhavas tiel nomatan rapidan vortaron, kiu laboras simile al programo Ecoso. Mankas nun nur la ebleco samtempe montri la tradukon de vortoj en separita fenestro. Esperantilo tradukas ne po unu vorto, sed ĝi bezonas por bona traduko la tutan frazon. La akceptebla solvo estus, ke esperantilo tradukas tuj ĉiun vorton laŭ primitiva maniero. Sed kiam la frazo estas finita, la programo retradukas la tutan frazon en pli bona kvalito. Nun ekzistas en Esperantilo t.n. „Tradukileto“ (menu Tradukado->Tradukileto), kiu estas speciale farita por samtempa tradukado de mallongaj tekstoj. Oni povus plivastigi la funkciadon de tiu ilo, por ke ĝi estu pli simila al programo Ecoso.

Mi kaptis la okazon kaj detale demandis Eckard pri ĝia uzado de programo Esperantilon. Tio estis por mi tre instrua. Ni diskutis longe pri vortaro de Esperantilo. Bedaŭrinde Eckhard ne povis bone uzi tiun vortaron sen mia detala priskribo. La uzula interfaco de vortaro evidentiĝis kiel malklara. Mi uzas la vortaron tre ofte kaj ne supozis tiujn malfacilaĵojn. Speciale malklara evidentiĝis la dudirekta serĉado de vortoj. Por tio oni havas du specialajn kampojn. Ankaŭ la montrado de rezultoj kaj la ebleco de direkta redaktado de tradukoj estis malklara. La leciono por mi estas, ke uzantoj atendas, ke la vortaro aspektu kiel papera vortaro. Oni havu nur unu kampon por entajpi la vorton. Ankaŭ la gramatikaj priskriboj ne estas klaraj. Se la avaraĝa uzanto povus redakti mem la vortaron, la priskribo de gramatiko kaj fleksio devus esti pli facila. Normale altnivela preparo de vortaroj estas tasko por profesiaj lingvistoj. Se tiu vortaro estas uzata en maŝina tradukado, tiu tasko estas eĉ pli malfacila. La programo devus plifaciligi tiun taskon ankaŭ por neprofesiuloj. La plej bona solvo estus, se la programo oferus kelkajn ekzemplojn de fleksio por elekto kaj la uzanto nur devus elekti la korektan frazon. Ni ankaŭ diskutis lange pri komuna flegado de vortaro. Ĝis nun mankas bonaj liberaj vortaroj pro esperanta lingvo, kiujn oni povus uzi en maŝina tradukado. Sekvaj funkcioj estus necesaj:

  • facila importado kaj eksportado de ŝanĝoj direkte per interreto
  • historio de ŝanĝoj en vortaro
  • ĉiu ŝanĝo havas aŭtoron
  • akceptado de ŝanĝoj per elektitaj kompetentaj lingvistoj
  • priskribo de certeco de iu traduko
  • Akcepto de ŝanĝoj nur por ne certaj tradukoj

Tiu projekto necesus vastan akcepton de germana kaj esperanta komunumo. Ekzistas nun multaj similaj projektoj, kiuj kolektas vortojn por Esperanto kaj por ĉiu lingvo. Bedaŭrinde ĉe multaj tiaj projektoj la uzado de vortaroj ne estas libera. Do mi ne estas certa, ĉu indus krei ion novan. Tio devus esti ankaŭ separita projekto. Kvankam mi devis akcepti, ke la nuna vortaro ne estas facila, mi tre kutimiĝis kun nuna funkciado. Bone estas, ke mi direkte povas redakti tradukojn sen aldonaj paŝoj. En aliaj programoj oni devas trairi per multaj fenestroj por adaptigi unu tradukon. Ankaŭ en tiu kazo evidentiĝas, ke diferencaj uzantoj volas havi diferencan interfacon. Mi povas diferenci:

  • Uzantoj kiuj nur legas vortaron kaj nenio scias pri gramatiko
  • Uzantoj kiuj nur legas vortaron kaj tre malofte korektas tradukojn. Ili havas nur bazajn konojn pri gramatiko
  • Lingvistoj, kiu ofte uzas vortaron kaj volas direkte redakti tradukojn. (angle: Poweruser)

Nuna vortaro bezonan plibonigon, sed eble bona ideo estus havi du separitajn vortarojn por almenaŭ du tipoj de uzantoj.

Ĝenerale mi devas diri, ke multaj funkcioj de Esperantilo ne estas konataj. Eble pli bona solvo estus dividi la programon en kelkaj programoj, kiuj enhavas funkciojn speciale por unu grupo de uzantoj. Mi pensas, ke la plej granda parto de esperantistoj ne scias multe pri lingvistiko, gramatiko kaj komputiloj. Kaj speciale por tiu grupo la programo povus esti aparte utila. Por tiu homoj estas necesa aldona dokumentaro kaj speciala instrukciado. Eble mi povus iam pretigi intrukcajn videojn. Mi pensas, ke direkta kontakto kun uzantoj estas la sola eblo plibonigi la programon.

Ni diskutis multe pri plibonigo de germana tradukado. Jes, mi havas mutajn ideojn, sed mi decidis nun prizorgi nur polan maŝinan tradukadon. La tasko estas pena kaj mi volas, ke almenaŭ unu lingvo estos bone tradukota. Do eble en venonta jaro mi denove okupus pri germana lingvo.

Sukcesa programo devas havi stabilan kernon, kiu povas solvi la planitajn taskojn, kaj ankaŭ klaran interfacon. Se unu de tiuj elementoj ne estas bona, la programo ne trovos akcepton. Direkta kontakto kun Esperantistoj tre helpas. Mi esperas, ke mi en la venonto povus partopreni en esperantaj aranĝoj kaj renkonti la uzantojn de programo rekte.

Older Posts »

Powered by WordPress