{"id":119,"date":"2008-10-08T19:20:35","date_gmt":"2008-10-08T18:20:35","guid":{"rendered":"http:\/\/blog.esperantilo.org\/?p=119"},"modified":"2013-04-06T23:42:25","modified_gmt":"2013-04-06T22:42:25","slug":"projekto-lingvohelpilo-kaj-literumado","status":"publish","type":"post","link":"http:\/\/blog.esperantilo.org\/?p=119","title":{"rendered":"Projekto Lingvohelpilo kaj Literumado"},"content":{"rendered":"<h2>Kolektado de ekzemploj de eraroj<\/h2>\n<p>Uzanto de programo Esperantilo sciigis al mi pri <a href=\"http:\/\/it.groups.yahoo.com\/group\/e-ins\/message\/3321\">interesa mesa\u011do de projekto &#8222;Lingvohelpilo&#8220;<\/a>. Mi konas tiun projekton kaj renkontis \u011diajn membrojn, pri kio mi jam skribis en <a href=\"http:\/\/blog.esperantilo.org\/?p=90\">frua blogo<\/a>. Mi esperas, ke nun kelkaj esperantaj instruistoj kolektos tiujn erarojn. Kutime tiaj vokoj ne rezultigis iujn rezultojn, sed nun ekzistas ilo por firefox, kiu plifaciligas la kolektadon de eraroj. Tio eble estas pro ia malfacileco de temo kaj manko de spertaj Esperantistoj, kiu interesi\u011das pri komputila lingvistiko. Mi esperas, ke \u0109i-foja agado estos fruktodona.<\/p>\n<p>Nun ekzistas komenca listo kun ekzemploj <a href=\"http:\/\/vikio.ikso.net\/Projektoj\/GramatikKontrolilo\/Eraroj\">sur vikio de ikso<\/a>. Kelkaj ekzemploj estas al mi tre konataj kiel &#8222;Mi vidas la hundo&#8220;, sed mi rimarkis anka\u016d tre interesajn ekzemplojn, pri kiuj mi frue ne pensis. Mi anka\u016d testis Esperantilon kun tiuj frazoj. Entute Esperantilo ne povis trovi \u0109irka\u016d 15 erarojn. Interesaj estas ekzemploj pri falsa transitiveco:<\/p>\n<ul>\n<li>Kiel vi nomigas?<\/li>\n<li>Mi mankas monon?<\/li>\n<li>\u0108u vi pla\u0109as tiun filmon?<\/li>\n<\/ul>\n<p>En la lasta eldono 0.986 mi jam laboris pri tiu temo, sed tiujn erarojn la programo ne povas trovi.<br \/>\nLa temo estas iam malfacila, \u0109ar ne estas facile ma\u015dine trovi, kio estas pripensita subjekto kaj kio objekto. (kiel en frazo: &#8222;Mi mankas monon&#8220;.)<\/p>\n<p>Feli\u0109e pro granda parto de tiuj ekzemploj mi povas facile plivastigi la gramatikan kontrolilon en Esperantilo. Do tiu listo helpos anka\u016d por aliaj projektoj.<\/p>\n<h2>Interesa scienca labora\u0135o pri literumado<\/h2>\n<p>Alia membro de projekto Marek Blahu\u009a planis la labora\u0135on pri literumado. La labora\u0135o estas delonge preta, sed mi nur jam trovis <a href=\"https:\/\/is.muni.cz\/auth\/th\/172464\/fi_b\/?lang=en\">\u011din<\/a>. Ekzistas e\u0109 al eblo testi la novajn listojn per <a href=\"http:\/\/nlp.fi.muni.cz\/~xblah\/bc\/\">reta programo<\/a>. Marek preparis novajn listojn por Hunspell, sed la\u016d li la listoj ne estas pretaj. Estus bone, se tiuj listoj estus uzataj en projekto Firefox a\u016d OpenOffice. La labora\u0135o estas tre interesa. \u011ci temis ne nur pri elekto de literumilo, sed anka\u016d havas tre interesan parton pri konstruado de eblaj deriva\u0135ojn depende de senco (tipo) de radiko. La plej ta\u016dge literumilo por Esperanto estas la\u016d tiu labora\u0135o Hunspell. Mi anka\u016d supozis tion en mia <a href=\"http:\/\/blog.esperantilo.org\/?p=16\">blogo<\/a>. Mi konas kaj uzas tiun literumilon en Esperantilo. Nun dezirindas nur bona libera vortaro por tiu literumilo.<\/p>\n<p>Mi mem nuntempe opinias, ke la vortaro por literumilo ne havu \u0109iujn eblajn vortojn, sed nur la plej ofte uzatajn vortojn. Anka\u016d la literumilo ne devas nepre trovi eblajn kunmenta\u0135ojn (analizi morfemojn). Ofte la teoria ebla vorto estas la skriberaro de iu alia kutima vorto. Do oni devus analizi, \u0109u malofta teorie ebla vorto ne estas tre simila al alia kutima vorto. La\u016d mia opinio praktika elveno al la problemo estus konsideri nur radikojn (morfemoj), kiuj estas tre produktemaj kiel: &#8222;*listo, *grupo, *ebla, &#8230;&#8220;.<br \/>\nLa plej granda laboro estus trovi tiujn radikojn (a\u016d skribi programon, kiu tion faras).<\/p>\n<p>De labora\u0135o de Marek mi eksciis pri ekzisto de programo <a href=\"http:\/\/www.espsof.com\/\">ESPSOF<\/a> de Toon Witkam. La programo estas la kontrolilo por esperantaj tekstoj, kiu funkcias por programo MS Word (\u011ci estas skribita en la programa lingvo Visual Basic). Mi mem preferus OpenOffice. Tamen MS Word estas tre vaste uzata programo kaj eble tre konata al multaj Esperantistoj. ESPSOF enhavas multajn interesajn lingvistikajn analizojn kaj kromajn ilojn. Beda\u016drinde mi ne havas la programon MS Word sur mia komputilo, do mi ne povis testi la programon. La\u016d la priskribo de a\u016dtoro la programo povas iom simile kiel Esperantilo mem trovi eblajn kunmetitajn vortojn. Tio ne estas facila tasko. Teorie ekzistas preska\u016d senlima nombro de ebloj. En praktiko oni devas tre limigi la nombron de radikoj kaj eblaj ligoj en unu vorto.<\/p>\n<p>\u015cajnas, ke la fina perfekta ideo por literumilo por esperantaj tekstoj ankora\u016d ne ekzistas (kaj en teorio kaj en praktiko). \u011ci povas esti la mikso de statistika alveno kaj analiza alveno. La saman konstatas Marek en sia labora\u0135o. Malfacila afero estas trovi la plej oportunan proporcion inter tiuj metodoj kaj pruvi tion praktike. Anka\u016d la pritakso de literumilo ne estas facila afero. La literumilo devas trovi \u0109iujn erarojn, sed ne misaverti pri bone skribitaj vortoj. Por tio ekzistas <a href=\"http:\/\/en.wikipedia.org\/wiki\/Precision_and_recall\">matematikaj indikoj<\/a>, sed fine oni devus pritaksi, kio estas pli grava: preterpasitaj eraroj a\u016d \u011denado de uzanto pri \u011dustaj vortoj. La bona statistiko pri esperanta morfologio estus la bona starto por la tasko.<\/p>\n<p>Feli\u0109e la labora\u0135o estas skribita en la lingvo, kiun mi iugrade komprenas. Tio estas la angla. Mi havus problemojn kun \u0109e\u0125a labora\u0135o, kvankam la \u0109e\u0125a kaj pola lingvoj estas tre similaj. En la scienco la angla lingvo estas delonge memkomprenebla. Mi observis grandajn \u015dan\u011dojn en lastaj 5 a\u016d 10 jaroj. Anta\u016d 10 jaroj, kiam mi studis informatikon la kono de angla lingvo estis jam tre oportuna sed ne necesa por studado. Nun e\u0109 studentoj skribas iliajn labora\u0135ojn en tiu lingvo.<\/p>\n<h2>Fina vorto<\/h2>\n<p>La komputila lingvistiko por Esperanto progresas kaj la projektoj feli\u0109e influas unu la alian. Mi dezirus pli da tiaj projektoj.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Kolektado de ekzemploj de eraroj Uzanto de programo Esperantilo sciigis al mi pri interesa mesa\u011do de projekto &#8222;Lingvohelpilo&#8220;. Mi konas tiun projekton kaj renkontis \u011diajn membrojn, pri kio mi jam skribis en frua blogo. Mi esperas, ke nun kelkaj esperantaj instruistoj kolektos tiujn erarojn. Kutime tiaj vokoj ne rezultigis iujn rezultojn, sed nun ekzistas ilo [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[4,2],"tags":[],"class_list":["post-119","post","type-post","status-publish","format-standard","hentry","category-lingvistiko","category-programado"],"_links":{"self":[{"href":"http:\/\/blog.esperantilo.org\/index.php?rest_route=\/wp\/v2\/posts\/119","targetHints":{"allow":["GET"]}}],"collection":[{"href":"http:\/\/blog.esperantilo.org\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"http:\/\/blog.esperantilo.org\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"http:\/\/blog.esperantilo.org\/index.php?rest_route=\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"http:\/\/blog.esperantilo.org\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=119"}],"version-history":[{"count":2,"href":"http:\/\/blog.esperantilo.org\/index.php?rest_route=\/wp\/v2\/posts\/119\/revisions"}],"predecessor-version":[{"id":185,"href":"http:\/\/blog.esperantilo.org\/index.php?rest_route=\/wp\/v2\/posts\/119\/revisions\/185"}],"wp:attachment":[{"href":"http:\/\/blog.esperantilo.org\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=119"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"http:\/\/blog.esperantilo.org\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=119"},{"taxonomy":"post_tag","embeddable":true,"href":"http:\/\/blog.esperantilo.org\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=119"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}