Esperantilo Blogo en Esperanto pri projekto Esperantilo kaj komputila lingvistiko

2.1.2012

Esperantilo tradukas al rusa lingvo

Filed under: maŝina tradukado,programado — artur @ 21:49

En la jaro 2011 mi eldonis nur unu eldonon de Esperantilo (0.993). La ĉefa novaĵo de tiu eldono estas la maŝina traduko al rusa lingvo. Frue mi eldonis monate, sed nur mi preskaŭ ne havas tempon por ŝatokupoj.

Mi feliĉe trovis kelkajn bonajn lingvajn fontojn en la reto kaj povis krei la tradukan vortaron por rusa lingvo. Mi skribis pri tio tie. Aldone al vortaro de Revo mi uzis tre bonan kaj sufiĉe kompletan gpl-an vortaron de Juri Fink.

Kompare al tradukado por pola lingvo oni povas multe fari por plibonigi la tradukadon.

  • por multaj verboj mankas gramatikaj priskriboj (aspektoj)
  • por multaj substantivoj mankas priskribo pri genro
  • nombrovortoj (vere malsimplaj en slavaj lingvoj)

Mi esperas, ke multajn tiujn informoj mi povas gajni de rusa wictionary

Mi devas pristudi la ekzemplajn tradukojn. Ĉu iu havus tempon por mane traduki la ekzemplojn? Tio certe helpus, ĉar mia kono de rusa lingvo estas nur baza. Bonvolu kontakti min!

Aldone Esperantilo nun povas aŭtomate rekoni la enkodon kiel (iso-8859-?, unikode, kio8-r, …). Mi volas ankaŭ en estonto modifi la programon en tiu maniero, ke la programo mem provu diveni, kion la uzanto volas kaj fari multajn taskojn aŭtomate.

6.4.2011

Esperantilo por OpenOffice sur ĉiu komputilo

Filed under: ĝenerale,programado — artur @ 20:14

La nuna eldono de esperantilo por OpenOffice funkcias nur sur 32-bituma Vindozo kaj Linukso. Nuntempe ĉiam pli da homoj aĉetas la 64-bituman komputilon kaj rimarkas, ke la Esperantilo por OpenOffice (same kiel LibreOffice) ne povas esti instalita.

Nun mi forigis la partojn de Esperantilo, kiuj estas specifaj por operaciuma sistemo. Temas pri gramatika kontrolilo, kiu estas programita per C-lingvo.
Restas tamen literumilo kaj aliaj partoj, kiujn oni povas uzi. Esperantilo por OpenOffice (Elŝutu!) estas la eldono de Esperantilo por OO por ĉiu komputilo. Pro teknikaj kialoj la dosiero estas zip-arkivo. En tiu arkivo troviĝas la kutima oxt-dosiero. Tiu eldono devas ankaŭ funkcii sur Mac-OS.

Mi mem ne posedas la 64-bituman komputilon, tamen mi supozas, ke oni povas instali la 32-bituman eldonon de OO kaj ankaŭ daŭre uzi Esperantilon kun gramatika korektilo.

20.3.2011

Lingva ludo „Vortaj Amikoj“ nun rete

Filed under: programado,uzantoj — artur @ 20:45

Mi preparis la lingvan ludon „vortaj amikoj“ kiel reta ludo programita tute en
javascript. Do oni bezonas nur retumilon kun funkcianta javascript por
ludi.
Tie oni povas ludi „vortajn amikojn“.

25.11.2010

Nova Esperantilo por OpenOffice

Filed under: programado — artur @ 15:01

Mi preparis ankaŭ la eldonon 0.992 de Esperantilo por OpenOffice.

Tiu eldona havas subajn funkciojn

  • literumilo
  • gramatika kontrolilo
  • vortodivigilo (silabado)
  • tezaŭro
  • konvertilo de cx ch al ĉ

La tezaŭron mi faris de datoj de REVO vortaro. Mi uzis la referencojn de tipo „sin“ kaj „vid“ (sinonimo kaj vidu) por krei la dosieron por OpenOffice. Unue mi volis uzi nur „sin“ referencojn, sed mi rimarkis, ke la listo de vortoj estas tre malgranda (1600) kaj multaj taŭgaj vortoj ekzistas ĉe referencoj de tipo „vid“. Ekzemple de „granda“ al „giganta“. Mi pensas, ke kutime la tezaŭro ne nur enhavas sinonimojn sed ankaŭ vortoj kun simila senco. La malavantaĝa afero estas, ke multaj referencoj de tipo „vid“ povas estas malĝustaj. Do la uzanto ne plene fidu je tiu tezaŭro.

openoffice tezauxro

Aldonaj funckcioj de la kromprogramo Esperantilo por OpenOffice

Kutime la tiuspecaj kromprogramoj enhavas ankaŭ vortdividan vortaron aŭ vortaron por silabado (angle „Hyphenation Dictionary“ vidu lingucomponent.openoffice.org). La problemo estas, ke laŭ mia scio en Esperanto ne ekzistas klaraj reguloj por vortdividadon (vidu silabo kaj silabado).
Tamen iuj jam laboris pri tio diskutgrupo eLiberaProgramaro.

Mi aldonis la dosieron hyph_eo.dic-1.2.tar.bz preparitan de Ari Caldeira de la diskutgrupo al la kromprogramo.

Konvertilo por ĉapeloj

Alia necesa funkcio estas la konvertilo de provizoraj skribmanieroj por ĉapelitaj literoj (ŝĉĥĝĵŭ). Ankaŭ sur tiu kampo ekzistas io, sed bedaŭrinde ne kiel facile uzebla la trovebla kromprogramo (ne en provizo de kromprogramoj de OpenOffice).

Mi ankaŭ aldonis similajn funkciojn al la Esperantilo. Oni povas uzi la konvertilon de menuo (angle: Tools, gemane: Extras).

openoffice konvertilo

La konvertilo de Esperantilo estas iom pli ampleksa, ĉar ĝi testas, ĉu la rezulta vorto estas vere esperanta vorto. Tiu testo ebligas, ke la programo ne ŝanĝu maloportune la ne esperantan vorton (nomoj, citaĵoj kiel ekz. Linux). Tamen ekzistas vortoj kiel „chashundo“ (ĉashundo ne ĉaŝundo), kiuj ankaŭ nun faras problemojn ĉe konvertado.

Mi trovis ankaŭ aliajn vortojn, por kiuj la simpla ch-konvertilo faras erarojn:

grashepataĵo
ĉashundo
flughundo
ĉashundoj
invershava
neinvershava
ĉashundo
dishaki
kashalo
vangharoj
vangharo
longharulo
longhara
vangharulo
senchava
sukceshava
senchavi
potenchavi
grashava
invershava
neinvershava
potenchavulo
disheligi
seshora
seshore
plushoro
komenchoro
flughaveno
flughavena
flughavene
flughavenisto
amashisterio
misharmonia
disharmonio
misharmoniigi
misharmonio
Ŝlesvigholstinio
ŝlesvigholstiniano
seshektara
bushaltejo
aŭtobushaltejo
fikshejma
mishelpi
prononchelpo
ŝpruchelpilo
drogherba
drogherbo
kuracherbo
kuracherba
mishumore
mishumora
mishumoro
mishumorigi
mishumori
gajhumora
dishirtigi
sekshontemo

La same por „au“ kaj „eu“

reuzpapero
ŝippereulo
kakaujo
geulo
teumado
teumi
teujo
reuzi
neuzebla
neuzo
reuzebla
reuzado
reuzo
neuzeblaĵo
neuzinda
livreulo
jubileulo
fiksideulo
reutiligo
linoleumo
posteulo
oleujo
oleumi
sanktoleumi
praulo
Koreujo
nordkoreujo
petroleumo
tiaulo
tieulo
geukraino
reunio
doganaunio
eŭropaunio
unuaulo
imaginaraunuo
rereunuigi
rereunuiĝo
rereunuiĝi
reunuigi
reunuigita
reunuiĝo
reunuiĝi
matricaunuo
traurbe
malgrandaursino
blankaurso
grandaursino
geumo
saudaarabujo
Nauro
naura
araneuloj
aleuto
aleutaj
ureuso

Dezirinda estus ankaŭ la dialogo por agordo de gramatika kontrolilo. Tiu estas iom komplika afero, ĉar mi devus iel kunligi la gramatikan kontrolilon de Esperantilo kun agorda sistemo de OpenOffice kaj fine Esperantilo devus esti informita pri la agordaj ŝanĝoj.

Mi ne estas certa, ĉu indas prepari aliajn funkciojn de kutima Esperantilo al OpenOffice. La plej granda parto estas vortaroj kaj maŝina tradukado.
Tiaj funkcioj kutime ne estas parto de dokumentredaktilo. Ekzistas ankaŭ kelkaj analiziloj, kiuj tamen estas interesaj nur por lingvistoj.

15.11.2010

Eldono 0.992 – pli bona gramatika kontrolilo

Filed under: programado — artur @ 23:00

Ĉe aktuala eldono mi ĉefparte laboris pri plibonigo de gramatika kontrolado. La plej grava manko de kontrolilo estas tre alta nombro de falspozitivaj avertoj pri gramatikaj eraroj.
Tio signifas, ke programo reportas erarojn ĉe ĝustaj frazoj. Mi jam ricevis kelkcent erarraportojn pri tiuj eraroj de uzantoj. La plej granda parto de raportoj estas pri falspozitivaj avertoj de gramatika kontrolilo. Eble tio estas la rezulto de tio, ke uzantoj tre facilie povas raporti tiujn problemojn.

Nun mi ripete analizas kelkajn tekstojn por trovi metode la plej oftajn problemojn de programo.
Mi uzas por tio subajn tekstojn:

  • Ekzemplaj frazoj de ekzercaro de Zamenhofo
  • Ekzemplaj frazoj de PMEG
  • 5500 frazoj de artikoloj de Libera Folio

Fine mi povis malaltigi la nombron de falspozitivaj avertoj je averaĝe 15%.
Jen la tutaj rezultoj

  Libera folio zamenhofa ekzercaro pmeg ekzemploj
vortoj en tekstaro 131068 5110 43726
frazoj en tekstaro 5552 468 4139
eraraj frazoj 0.991 3155 57 741
  56,8264% 12,1795% 17,9029%
eraroj 0.991 6984 82 1036
  5,3285% 1,6047% 2,3693%
eraraj frazoj 0.992 2746 36 633
  49,4597% 7,6923% 15,2935%
eraroj 0.992 5659 54 864
  4,3176% 1,0568% 1,9759%
eraraj frazoj 0.992 (certaj) 1732 23 393
  31,1960% 4,9145% 9,4950%
Eraroj 0.992 (certaj) 2663 24 466
  2,0318% 0,4697% 1,0657%
plibonigo en 0.992 frazoj 12,9635% 36,8421% 14,5749%
plibonigo en 0.992 eraroj 18,9719% 34,1463% 16,6023%

La plej gravaj indikoj estas unue la nombro de eraroj (avertoj) kaj nombro de eraraj frazoj. Ekzemple ĉe artikoloj de libera folio (5552 frazoj) la programo en eldono 0.992 avertis, ke 2746 frazoj havas minimume unu eraron ( do 49,45%). Ĉe tiuj tekstoj oni povas asumi, ke la tekstoj estas ĝustaj. Tio estas almenaŭ certa ĉe frazoj de zamenhofa ekzeraro kaj frazoj de PMEG. Mi testis elonon 0.991 kaj 0.991 sur 3 diferencaj tekstaroj kaj kun diferenca severeco de korektilo (ĉiuj avertoj kaj nur certaj). Ĉe „certa“ korektado mi malŝaltis la avertojn pri komoj kaj senfunkciaj frazpartoj.

Fontoj de falspozitivaj avertoj

  • Sintaksa analizilo ne povas korekte analizi la frazon.
  • La programado de reguloj por korektilo estas malĝusta.
  • La radikaro de programo estas malĝusta. En tiu radikaro estas markitaj ekzemple ĉiuj transitivaj verboj.

Mi plibonigis la programon en ĉiu kampo. La uzanto mem povas redakti la radikaron. Do li mem havus la eblon infui la korektilon en tiu kampo.
Ekzemple li povus difini iun verbon kiel transitivan. Mi estas preskaŭ certa, ke neniu uzanto efektive tion ĝis nun faris.

Kiel influi la severecon de korektilo

Por mi estas tre malfacila demendo, kiel severa devas esti la korektilo. Mi devas substreki, ke la programo tute ne povas kompreni la tekston.
Ĝi nur iel analizas la tekston, komputas iajn indikoj pri eblaj eraroj. La programo do ne trovas erarojn, sed nur avertas pri eblaj eraroj.
Ankaŭ por pensanta homo la verdikto pri ĝusteco de iu teksto ne estas facila. Esperantistoj ofte diskutas pri ĝusteco de iu lingva konstruaĵo.
Ofte ekzistas diferencaj opinioj pri lingvo kaj gramatiko.

Kiam mi programas la gramatikan kontrolilon mi devas ofte decidi. Ĉu la programo avertu pri iu lingva konstruaĵo kun samtempa danĝero de falspozitivaj rezultoj , aŭ ĉu preterlasi tiujn necertajn konstruaĵojn. Oni povas tion bone priskribi tion per Precision kaj recall. Mi pensas, ke oni ĝenerale la demando dependas de tio, por kio oni uzas la gramatikan kontrolilon kaj kia estas la teksto. Ĉe tre mallongaj kaj freŝaj (nekorektitaj) tekstoj oni eble volas vidi ĉiujn eblajn avertojn. Se oni kontrolas tre longajn kaj fremdajn tekstojn, oni eble volas vidi tre certajn rezultojn.

En la programo Esperantilo la uzanto povas mem influi tion. En menuo „Preferaĵoj>Redaktu preferaĵojn>Kontrolado“ oni havas kelkajn opciojn por korektilo.

Se oni volas vidi nur pli certajn avertojn, oni malŝaltu subajn opciojn

  • Testu komojn
  • Testu mankantajn ? aŭ !
  • Raportu ĉiujn gramatikajn dubojn
  • Proponu pli konvenajn sinonimojn
  • Avertu pri ebla falsa amiko

En esperanta fundamento ne ekzistas reguloj por uzado de komoj. Tial neniu povas finfine diri kiel ĝuste uzi komojn. Tial oni malŝaltu tiun opcion, se la reguloj de la programo ne spegulas la propran guston.

Sintaksa Analizo

Sintaksa analizilo estas la koro de la programo Esperantilo. Verdire mia intereso pri programado de sintaksa analizilo estis la motoro por programado de la programo. La gramatika kontrolilo estis nur iu aldona rezulto de tiu analizilo. Mi ĉefe bezonis la analizilon por maŝina tradukado kaj la gramatika kontrolilo unue estis mia interna ilo por trovi mankojn de analizilo. Do mi volis scii, kun kiuj ĝustaj frazoj la programo havas problemojn ĉe analizo.

Mi de longa tempo kolektas diferencajn frazojn por testi mian analizilon (vidu)

Ekzemplaj frazoj estas aliaj kiel realaj tekstoj. Realaj tekstoj estas multe pli kompleksaj. Ili enhavas citaĵojn kaj multe proprajn nomojn, kiuj ne estas parto de esperanta lingvo. Realaj tekstoj ne estas ankaŭ simple aro de frazoj. Ili enhavas pli komplikan strukturon. Ekzistas do dialogoj, tabeloj, nombradoj, titoloj, diversaj propraj nomoj. Jam de trovo de unuopaj frazoj de granda teksto estas en detalo neniu facila tasko.

Nun mi rimarkis, ke la baza ideo por analizilo havas siajn limojn. La programado de aldonaj lingvaj fenomenoj estas ĉiam pli komplika. Mi nun havas prototipon de nova analizilo, kiu ne nur devas estas pli rapida, sed ankaŭ pli facila por programado de sintaksaj reguloj. Tio eble estas tasko por la sekva eldono.

Aliaj plibonigoj de programo de eldono 0.992

  • Refreŝigo de revo leksikono kaj korekto de kelkaj ĉimoj en la REVO montrilo.
  • Plivastigo de traduka vortaro por angla kaj pola lingvoj.
  • Korekto kaj kompletigo de pola vortaro je gramatikaj kaj fleksiaj informoj.
  • Aliaj malgrandaj plibonigoj kaj korektoj de programaj eraroj.

Ceteraj informoj

Nun aperis nova provo de esperanta gramatika korektilo surbaze de programo LanguageTool. Oni povas trovi kelkajn informojn sur blogo de Dominique Pellé. Mi esperas, ke mi iam povas kompari rezultojn de ambaŭ prgramoj kaj lerni de tio.

28.5.2010

Esperantilo en Firefox (Fajrovulpo)

Filed under: lingvistiko,programado — artur @ 19:15

Unu de plej valoraj funkcioj de Esperantilo estas literumado kaj gramatika kontrolilo. Dezirinda afero estas, ke uzantoj povus uzi tiujn funkciojn direkte en siaj programoj. Esperantilo ne povas neniam iĝi dokumentoredaktilo aŭ ttt-montrilo, kiuj nun estas la plej
uzataj programoj. Ofte tiuj grandaj programoj ebligas tiel nomatajn kromprogramojn (extensions, plugins). De longa tempo ekzistas Esperantilo kiel kromprogramo por OpenOffice.
La dua grava programo, per kiu oni skribas tekstojn estas ttt-montrilo kiel Firefox. En tempo de Web2.0 la ttt-montrilo estas ofte la sola programo, kiun neprogresinta komputiluzanto konas.

La programado de kromprogramoj estas komplika afero. Ĉiu programo havas propran interfacon por kromprogramoj (API). Mi longe atendis, ĝis OpenOffice havis la bazan eblon por gramatika korektado. Mi ankaŭ longe pensis pri gramatika kontrolado por Firefox, sed ĝis nun ne ekzistas en Firefox la facila eblo por gramatika kontrolado. Mi regule traserĉis la reton je tiu afero.
Kaj subite nun mi malkovris la projekton After The Deadline, kiu ebligas gramatikan kontroladon por angla lingvo kaj kelkaj aliaj lingvoj.
Feliĉe tiu kromprogramo estas malfermfonta kaj publike uzebla. Do nun ĉiu povas reuzi partojn de tiu kromprogramo.

AfterTheDeadline kontrolilo uzas specialan teknikan dizajnon. La kromprogramo nur kolektas tekstojn kaj sendas tiun tekston per HTTP/post (nun HTTPS) al servilo de projekto, kiu fakte faras la gramatikan korektadon. La kromprogramo ricevas la rezulton de korektado kiel XML. La rezulto enhavas erarojn, sugestojn kaj erartipojn.

Rezulto kiel XML-dosiero.

<results>
  <error>
    <string>kato</string>
    <description>uzu akuzativon</description>
    <precontext>la</precontext>
    <suggestions>
         <option>katon</option>
    </suggestions>
    <type>grammar</type>
  </error>
  <error>
    <string>provramas</string>
    <description>Spelling</description>
    <precontext>Mi</precontext>
    <suggestions>
	<option>programas</option>
    </suggestions>
    <type>spelling</type>
  </error>
</results>

La ideo estas, ke Esperantilo povas agi kiel la servilo por AfterTheDeadline kromprogramo. Mi analizis la fontokondon de kormprogramo, kiu estas skribita en JavaScript. Mi skribis programaton, kiu faras de Esperantilo la servilon por AfterTheDeadline kromprogramo.

Kiel uzi Esperantilon direkte en Firefox?

Esperantilo sur Firefox

Unue instalu la kromprogramo AfterTheDeadline kromprogramo en eldono 1.2 kun aliaj dosieroj. Pro teknikaj kialoj mi devis paki la dosierom xpi (Firefox plugin) en zip. Por instalo malpaku la dosieron afterthedeadline.zip kaj malfermu la dosieron addon-58947-latest.xpi per Firefox.

La nova kromprogramo, kiun oni povas elŝuti direkte de pago de projekto firefox.afterthedeadline.com
, bedaŭrinde ne funkcias kun Esperantilo. La aktuala eldono 1.3 usas https protokolon, kiun nun ne komprenas Esperantilo.

La adreson de servilo, kiu faras la gramatikan korektadon, oni povas ŝanĝi en preferaĵoj de Firefox. Vi tajpu „about:config“ en adreskampo de programo. Post ignoro de kelkaj avertoj, vi povas elekti la preferaĵon „extensions.afterthedeadline.proofreadLanguage“ kaj entajpi la lokan adreson de esperantiloservilo „localhost:8888“.

Firefox about:config

Poste oni trovas malgrandan programeton „AfterTheDeadlineServilo.xotcl“ en supra zip-dosiero, kiu faras de Esperantilo servilon por AfterTheDeadline kromprogramo. Poste startigu la programeton „AfterTheDeadlineServilo.xotcl“ per menuo en Esperantilo „Lingvistiko->Aliaj ekspertaj funkcioj->Lanĉu Tcl-skripton“. Aperas malgranda fenestreto kun informo, ke la servilo kuras.

Esperantilo kiel servilo por AfterTheDeadline
Vi devas ripete startigi tiun programeton, kiam oni startigas Esperantilon. Post tio vi povas uzi la gramatikan korektadon de Esperantilo direkte de Firefox.

Limigoj de kromprogramo AferTheDeadline

Bedaŭrinde ne ĉiujn erarojn de Esperantilo oni povas vidi en Firefox. La problemo estas, ke la kromprogramo ne regas interpunkcion.
Do falsa interpunkcio ne povas esti reportata de servilo. Due ŝajnas, ke la kromprogramo havas problemojn kun specialaj signoj „kiel > <„. Do mi ne povis kontroli tiujn tekstojn direkte en Firefox. Ĉe longaj tekstoj (pli ol 10 frazoj) la kontrolado daŭras tre longe, ĉar la tuta teksto estas sendita al Esperantilo. En tiuj kazoj oni uzu programon OpenOffice aŭ Esperantilo direkte. La kromprogramo estas ankaŭ tre sentema je eraroj de servilo. Verdire la kromprogramo estas nova kaj eble enhavas multajn eraretojn.

Estas interesa afero, ke aŭtoroj de programo AfterTheDeadline uzas servilon por la gramatika korektado. Tio ja signifas, ke la tuta teksto estas sendata al servilo. Mi estas iom skepta pri tio, ĉar mi ne volus, ke iu povas kolekti ĉiujn tekstojn, kiujn mi skribas. Due la laboro de servilo kostas monon. Estas alia afero doni iun programon senkoste ol pagi por ĉiu uzo de la programo. Do se la projekto estos tre sukcesa, tiu kostoj estas pli altaj kaj oni devus havi pli da mono.

Esperantilo faras sian laboron sur komputilo de uzanto (loke). Do nenia teksto forlasas komputilon de uzanto.

Venonto de Esperantilo sur Firefox

Mi scias, ke nun la uzado de Esperantilo sur Firefox estas tro komplika por averaĝa uzanto. Oni devas instali kaj agordi eksteran programon. Poste oni devas fari taskojn en difinita ordo. La idealo estus la speciala kromprogramo, kiu en si mem enhavas Esperantilon kaj faras ĉiujn taskojn aŭtomate. Due mi povus aldoni la modifitan kromprogramon por firefox kun tuta Esperantilo.
Mi volas ankaŭ kontakti la aŭtorojn de AfterTheDeadline, por ke la kunlaboro de ilia kromprogramo estu pli
facila kun aliaj gramatikaj korektiloj.

AfterTheDeadline ne estas nur kromprogramo por Firefox, sed ankaŭ enhavas aliajn servilajn modulojn por gramatika korektado.
Ili povas estis uzataj direkte en blogoj sen iu instalado de uzanto. Ankaŭ por tiuj scenaroj Esperantilo povas esti nun uzata kiel gramatika servilo.

Dum programado mi uzis testajn html-paĝojn por rigardi la mesaĝojn de AfterTheDeadline servilo. Tiuj paĝoj povas krei direkte de html-form la HTMLL/Post mesaĝon, kiun analizas la gramatika servilo. Vi trovos tiun testajn paĝojn en supra zip-dosiero.

Mi penas, ke iom post iom la gramatika korektilo estos la kutima funkcio, kiun atendas uzantoj simile kiel hodiaŭ literumadon.
Do eble ankaŭ aliaj programoj subtenos la gramatikan korektadon de komenco.
Esperantilo povus servi kiel gramatika modulo por aliaj programoj.

8.10.2008

Projekto Lingvohelpilo kaj Literumado

Filed under: lingvistiko,programado — artur @ 19:20

Kolektado de ekzemploj de eraroj

Uzanto de programo Esperantilo sciigis al mi pri interesa mesaĝo de projekto „Lingvohelpilo“. Mi konas tiun projekton kaj renkontis ĝiajn membrojn, pri kio mi jam skribis en frua blogo. Mi esperas, ke nun kelkaj esperantaj instruistoj kolektos tiujn erarojn. Kutime tiaj vokoj ne rezultigis iujn rezultojn, sed nun ekzistas ilo por firefox, kiu plifaciligas la kolektadon de eraroj. Tio eble estas pro ia malfacileco de temo kaj manko de spertaj Esperantistoj, kiu interesiĝas pri komputila lingvistiko. Mi esperas, ke ĉi-foja agado estos fruktodona.

Nun ekzistas komenca listo kun ekzemploj sur vikio de ikso. Kelkaj ekzemploj estas al mi tre konataj kiel „Mi vidas la hundo“, sed mi rimarkis ankaŭ tre interesajn ekzemplojn, pri kiuj mi frue ne pensis. Mi ankaŭ testis Esperantilon kun tiuj frazoj. Entute Esperantilo ne povis trovi ĉirkaŭ 15 erarojn. Interesaj estas ekzemploj pri falsa transitiveco:

  • Kiel vi nomigas?
  • Mi mankas monon?
  • Ĉu vi plaĉas tiun filmon?

En la lasta eldono 0.986 mi jam laboris pri tiu temo, sed tiujn erarojn la programo ne povas trovi.
La temo estas iam malfacila, ĉar ne estas facile maŝine trovi, kio estas pripensita subjekto kaj kio objekto. (kiel en frazo: „Mi mankas monon“.)

Feliĉe pro granda parto de tiuj ekzemploj mi povas facile plivastigi la gramatikan kontrolilon en Esperantilo. Do tiu listo helpos ankaŭ por aliaj projektoj.

Interesa scienca laboraĵo pri literumado

Alia membro de projekto Marek Blahuš planis la laboraĵon pri literumado. La laboraĵo estas delonge preta, sed mi nur jam trovis ĝin. Ekzistas eĉ al eblo testi la novajn listojn per reta programo. Marek preparis novajn listojn por Hunspell, sed laŭ li la listoj ne estas pretaj. Estus bone, se tiuj listoj estus uzataj en projekto Firefox aŭ OpenOffice. La laboraĵo estas tre interesa. Ĝi temis ne nur pri elekto de literumilo, sed ankaŭ havas tre interesan parton pri konstruado de eblaj derivaĵojn depende de senco (tipo) de radiko. La plej taŭge literumilo por Esperanto estas laŭ tiu laboraĵo Hunspell. Mi ankaŭ supozis tion en mia blogo. Mi konas kaj uzas tiun literumilon en Esperantilo. Nun dezirindas nur bona libera vortaro por tiu literumilo.

Mi mem nuntempe opinias, ke la vortaro por literumilo ne havu ĉiujn eblajn vortojn, sed nur la plej ofte uzatajn vortojn. Ankaŭ la literumilo ne devas nepre trovi eblajn kunmentaĵojn (analizi morfemojn). Ofte la teoria ebla vorto estas la skriberaro de iu alia kutima vorto. Do oni devus analizi, ĉu malofta teorie ebla vorto ne estas tre simila al alia kutima vorto. Laŭ mia opinio praktika elveno al la problemo estus konsideri nur radikojn (morfemoj), kiuj estas tre produktemaj kiel: „*listo, *grupo, *ebla, …“.
La plej granda laboro estus trovi tiujn radikojn (aŭ skribi programon, kiu tion faras).

De laboraĵo de Marek mi eksciis pri ekzisto de programo ESPSOF de Toon Witkam. La programo estas la kontrolilo por esperantaj tekstoj, kiu funkcias por programo MS Word (Ĝi estas skribita en la programa lingvo Visual Basic). Mi mem preferus OpenOffice. Tamen MS Word estas tre vaste uzata programo kaj eble tre konata al multaj Esperantistoj. ESPSOF enhavas multajn interesajn lingvistikajn analizojn kaj kromajn ilojn. Bedaŭrinde mi ne havas la programon MS Word sur mia komputilo, do mi ne povis testi la programon. Laŭ la priskribo de aŭtoro la programo povas iom simile kiel Esperantilo mem trovi eblajn kunmetitajn vortojn. Tio ne estas facila tasko. Teorie ekzistas preskaŭ senlima nombro de ebloj. En praktiko oni devas tre limigi la nombron de radikoj kaj eblaj ligoj en unu vorto.

Ŝajnas, ke la fina perfekta ideo por literumilo por esperantaj tekstoj ankoraŭ ne ekzistas (kaj en teorio kaj en praktiko). Ĝi povas esti la mikso de statistika alveno kaj analiza alveno. La saman konstatas Marek en sia laboraĵo. Malfacila afero estas trovi la plej oportunan proporcion inter tiuj metodoj kaj pruvi tion praktike. Ankaŭ la pritakso de literumilo ne estas facila afero. La literumilo devas trovi ĉiujn erarojn, sed ne misaverti pri bone skribitaj vortoj. Por tio ekzistas matematikaj indikoj, sed fine oni devus pritaksi, kio estas pli grava: preterpasitaj eraroj aŭ ĝenado de uzanto pri ĝustaj vortoj. La bona statistiko pri esperanta morfologio estus la bona starto por la tasko.

Feliĉe la laboraĵo estas skribita en la lingvo, kiun mi iugrade komprenas. Tio estas la angla. Mi havus problemojn kun ĉeĥa laboraĵo, kvankam la ĉeĥa kaj pola lingvoj estas tre similaj. En la scienco la angla lingvo estas delonge memkomprenebla. Mi observis grandajn ŝanĝojn en lastaj 5 aŭ 10 jaroj. Antaŭ 10 jaroj, kiam mi studis informatikon la kono de angla lingvo estis jam tre oportuna sed ne necesa por studado. Nun eĉ studentoj skribas iliajn laboraĵojn en tiu lingvo.

Fina vorto

La komputila lingvistiko por Esperanto progresas kaj la projektoj feliĉe influas unu la alian. Mi dezirus pli da tiaj projektoj.

29.9.2008

Esperantilo 0.986 sur OpenOffice

Filed under: ĝenerale,programado — artur @ 21:32

Fine mi sukcesis kuri Esperantilon kiel kromprogramo de OpenOffice. Mi jam skribis pri tio en mia frua blogo.
Nun oni povas elŝuti la programo direkto de retejo de OpenOffice por kromprogramoj (angle: extensions). Nun la programo kuras nur kun nova eldono de OpenOffice 3.0, unue nur sur linukso.
Poste mi provos prepari la eldonon por vindozo. Nun oni povas uzi la gramatikan korektilon de Esperantilo direkte de OpenOffice. La nova interfaco (API) de OpenOffice en eldono 3.0 ebligis tion.
La programado de kunlaboro de OpenOffice kun Esperantilo ne estis simpla afero kaj mi bezonis kelkajn vesperojn pro realigi tion. Kvankam la gramatika kontrolilo por Esperanta lingvo ne ŝajnas esti interesa por plej granda parto de homoj, jam en unuaj tagoj tiu programo estas elŝutita de 30 personoj.

OpenOffice Esperantilo

Laŭ mia scio Esperantilo estas la dua programo, kiu laboras kun OpenOffice. Tio estas certe tre bona verbado por esperanta lingvo. Se OpenOffice havas gramatikan kontrolilon por tiu lingvo, tio por multaj homoj povas signifi, ke tiu lingvo estas vaste uzata. Nun mi atendas, ke aliaj programoj oferus la principan eblon de gramatika kontrolado. Mi esperas pri Firefox, KDE.

Eldono 0.986

Leo kaj Paul denove raportis multajn problemojn pri gramatika korektado.
Mi sukcesis korekti 62 raportitajn erarojn.
Aldone mi ankaŭ plibonigis la pruvadon de transitiveco de verboj.
Nun la programo povas indiki pri sekvaj eraroj.

  • La festo komencis. – La festo komenciĝis.
  • Mi startis la komputilon. – Mi startigis la komputilon.

En tiu eldono la kontrolilo indikas ankaŭ pri eblaj falsaj amikoj laŭ la listo de vikipedio.
La programo ankaŭ sugestas pri la uzo de pli oportunaj samsignifaj vortoj de la listo de retejo„bona lingvo“.

24.8.2008

Eldono 0.985

Filed under: programado — artur @ 19:56

Tiu eldono enhavas precipe korektojn de raportitaj eraroj. Ĉe tiu okazo mi dankas al Paul kaj Leo, kiuj raportis tre multaj raportoj pri falsa indiko de gramatikaj eraroj. Entute estis raportitaj 62 eraroj. Mi sukcesis korekti 45 erarojn en la nuna eldono. Bedaŭrinde la sintaksa analizo en la programo ne estas tute fidinda por komplikaj frazoj. Do la programo havas ankoraŭ problemojn kun korekta analizo. Tio kaŭzas falsaj avertojn pri gramatikaj eraroj.
Kvankam mi plibonigis la sintaksan analizon, mi ne scias, ĉu tiuj plibonigoj estos rimarkeblaj.

Leo sciigis al mi la ekziston de tre interesa paĝo pri konvencioj de Monato. En tiu paĝo mi trovis tre interesaj regolojn de uzado de komoj. Mi samopinias kun tiuj reguloj kaj Esperantilo ankaŭ postulas tiujn regulojn. Kvankam eble kelkaj kazoj ne estas kovritaj de tiuj reguloj.

Mi plivastigis la kapablojn de programo trovi gramatikajn erarojn. Nun la programo povas ankaŭ testi la tekston laŭ kelkaj reguloj de gazeto „Monato“.

Mi korektis ankaŭ kelkajn gravajn erarojn en kampo de maŝina tradukado. Do mi esperas, ke la nuna eldono estos pli fidinda kaj la uzantoj plu raportos erarojn. Nun mi preskaŭ ne havas tempon por mia hobio, do la raportado de uzantoj estas preskaŭ sola motivo modifi la programon.

12.6.2008

Esperantilo eldono 0.983

Filed under: programado — artur @ 21:44

La eldono 0.983 donas 2 grandajn teknikajn ŝanĝojn en la ena vivo de programo kaj multajn korektojn de eraroj.
Unue mi nun uzas la plej novan eldono de programa lingvo Tcl en versio 8.51. Due mi nun uzas por tradukaj projektoj la sqlite.
Pri la Tcl85 mi skribis ankoraŭ en blogo „Nova versio de programlingvo Tcl 8.5“.
Mi ankaŭ aktualigis enajn moduloj sqlite kaj XOTcl.
La konservado de tradukaj projektoj kiel bazoj de sqlite plirapidigis la programon.
La enlego kaj enskribo de datoj estas tre rapida. Ankaŭ la uzato de sqlite estas pli sekura pro datoj, ĉar ĉiuj modifoj estas tuj enskribitaj sur disko.

Por uzanto la plej videbla novaĵo estas literumado en tempo de skribado. Nun literumado funkcias simile al kutimaj programoj. Oni skribas kaj la programo tuj korektas skribitajn vortojn. Oni nur komence devas lanĉi la literumadon per butono „ABC“.
Oni povas ankaŭ en preferaĵoj aŭ en menuo „Korektado“ malŝalti tiun dumskriban literumadon.
Jam en komenco de la projekto kelkaj uzantoj postulis tiun funkcion, sed mi longe pensis, ke tiu funkcio estas tro malfacila aŭ eĉ malebla en Tcl.
Poste mi ekhavis ideon, kiu ebligis al mi realigi tion.

Mi ankaŭ korektis multajn erarojn, kiuj estis aŭtomate reportataj de multaj uzantoj. La funkcio la aŭtomata raportado estas tre valora. Mi ricevas multajn valorajn raportojn kaj por uzantoj la raportado signifas nur unu klakon de komputila muso.

Mi ankaŭ preparis specialan version de programo kun nur tre bazaj funkcioj. Mi nomis tiun programon „Esperantileto“.
Esperantileto enhavas nur kelkajn funkciojn por skribado kaj korektado de esperanta lingvo.
Tiu programo celas komencantojn, kiuj ne bezonas aliajn funkciojn aŭ eĉ estas irititaj de multaj funkcioj.
Mi preparos poste specialan instalan programon „Setup“ por Esperantileto, kiu estos nur 3,8MB granda kompare al 12MB granda instala programo de Esperantilo.
Por homoj kun malrapida reta korekto tiu programo estos eble plej alloga.
Nun ekzistas aldona lanĉa sistema menuo „Esperantileto“, kiu lanĉas la redaktilon kun pli facila baza modo.

Mi nuntempe testas kaj preparas la alian version de Esperantilo por tradukistoj kun nomo „EsperantiloTM“.
Tio eldono estas nur traduka programo por tradukitoj, kiuj laboras nur kun traduka memoro kaj ne estas dependa de iu lingvo.
Ekzistas grupo de tradukistoj, uzantoj de programoj kiel OmegaT kaj aliaj, kiuj ne interesiĝas pri Esperanto sed tradukas profesie kaj volas uzi eblojn de traduka memoro.
EsperantiloTM estus eldono nur por tiuj homoj.

La divido de programo en kelkaj versioj estas provo de adapto de programo al bezonoj de uzantoj. Due mi supozas, ke la intereso pri traduka memoro kaj tielspeca programaro estas pli granda ol intereso pri esperanta lingvo.

Older Posts »

Powered by WordPress