{"id":128,"date":"2009-06-14T22:11:47","date_gmt":"2009-06-14T21:11:47","guid":{"rendered":"http:\/\/blog.esperantilo.org\/?p=128"},"modified":"2013-04-06T23:31:59","modified_gmt":"2013-04-06T22:31:59","slug":"kolektado-de-ekzemploj-de-gramatikaj-eraroj","status":"publish","type":"post","link":"http:\/\/blog.esperantilo.org\/?p=128","title":{"rendered":"Kolektado de ekzemploj de gramatikaj eraroj"},"content":{"rendered":"<p>En la lasta tempo mi legis la diplomlaboron <a href=\"http:\/\/lingvohelpilo.ikso.net\/publikajhoj\/Erarkolektado_kaj_analizado_en.pdf\">&#8222;Erarkolektado kaj Analizado&#8220;<\/a> de Sonja Petrovi\u0107 Lundberg. La diplomlaboro aperis kadre de projekto <a href=\"http:\/\/lingvohelpilo.ikso.net\/\">lingvohelpilo<\/a>. Tio estas jam la dua diplomlaboro. Pri la alia mi skribis en <a href=\"http:\/\/blog.esperantilo.org\/?p=119\">mia alia blogo (Projekto Lingvohelpilo kaj Literumado)<\/a>.<\/p>\n<p>La bona kolekto de gramatikaj eraroj estas grava bazo por programado de gramatika kontrolilo. De tiu kolekto oni vidas, kiuj tipoj de eraroj ekzistas. Oni programas la\u016d tiuj tipoj kaj oni fine povas testi la programon kontra\u016d tiuj ekzemploj. En la projekto &#8222;lingvohelpilo&#8220; oni volis uzi la esperantan komunumon por kolektado de tiuj eraroj. Oni programis e\u0109 specialan <a href=\"http:\/\/lingvohelpilo.ikso.net\/kunlaborebloj_fajrovulpo.html\">kromprogramon por Firefox<\/a>, kiu ebligas tre facilan raportadon de eraroj direkte de TTT-legilo. Oni uzis bonajn kontaktojn kaj konon de esperanta medio. Tamen la rezultoj de tia kolektado helpe de komunumo ne estis imponaj kaj raportoj bezonis ampleksan prilaboron. En la projekto Sonja kolektis la plej grandan parton de ekzemploj propramane. \u015ci uzis tekstojn de siaj studentoj, kiujn \u015di anta\u016de korektis.<\/p>\n<p>Por mi interesa kaj valora estas la klasifiko de eraroj. Mi beda\u016drinde malatingis tion dum programado de Esperantilo. Tio ne estas nur interesa informo por statistiko, sed anka\u016d oni povus helpe de tiuj tipoj doni al uzantoj de korektilo pluajn informojn kaj ligiloj al eksteraj fontoj kiel lernu.net a\u016d PMEG.<br \/>\nInteresa fakto de tiu diplomlaboro estas kaj granda parto de eraroj estas la falsa uzado de vortoj.<\/p>\n<p>La diplomlaboro anka\u016d pritraktis la dependecon de gramatikaj eraroj de nacieco de uzanto. Beda\u016drinde la bazo de eraroj ne estis sufi\u0109a por tiu demando.<\/p>\n<p>Mi pensas, ke nuntempe nur spertaj esperantaj korektistoj povas doni la uzeblan materialon. Temas pri teksto anta\u016d korektado kaj post korektado. Pro multaj kialoj la atingo de tiuj tekstoj ne estas facila. Kiu a\u016dtoro volas publikigi la unuan eraran version de sia teksto? Nun kelkaj korektistoj uzas la programon Esperantilo por ilia laboro. Ili raportas multajn erarojn (\u0109efe nur falspozitivaj mesa\u011doj). Tiu raportado nun estas tre facila de programo Esperantilo. Sufi\u0109as unu klako. Mi ne scias, kiel organizi la raportadon de erarojn, kiujn la programo nun ne povas trovi. Mi devos iam pensi pri tio.<\/p>\n<h3>A\u016dtomata kolektado de eraroj.<\/h3>\n<p>Ekzistas anka\u016d alia ebla fonto de ekzemploj de gramatikaj eraroj. Tiu fonto estas vikipedio. En vikipedio oni povas trarigardi tre komforte la lastajn \u015dan\u011dojn de \u0109iu artikolo. La tezo estas: Kutime tiuj \u015dan\u011doj koncernas forigon de skriberaroj. Se la \u015dan\u011do okazis nur \u0109e unu vorto en frazo kaj ne temas pri literuma eraro, tio tre ver\u015dajne estas la gramatika eraro. Mi trarigardis la \u015dan\u011dolistojn de kelkaj artikoloj. Beda\u016drinde la \u015dan\u011doj de tiu tipo ne estas tre oftaj. Pri tiuspeca kolektado mi legis sur la pago de projekto <a href=\"http:\/\/morfologik.blogspot.com\/2009\/04\/bootstrapping-rules-for-languagetool.html\">Morfologik<\/a>, kiu pritraktis la kolektadon de eraroj por pola lingvo kaj projekto <a href=\"http:\/\/www.lanaugagetool.org\">Language Tool<\/a>. La a\u016dtoro skribis la programon, kiu mem de plena datumaro de vikipedio trovas gramatikajn erarojn. Tiu provo eble estas anka\u016d farinda por esperanta vikipedio.<\/p>\n<h3>Vortaraj eraroj<\/h3>\n<p>Por mi la nova\u0135o en tiu diplomlaboro estas, ke \u0109e multaj eraroj temas pri falsa uzo de vortoj. \u0108e tiuj eraroj ne temas pri strikte gramatikaj eraroj.  \u015cajne oni pensas, ke la komputilo ne povas trovi tiujn erarojn. La tasko povus esti pli facila ol oni tion unue pensas. Mi trovis <a href=\"http:\/\/www.esperanto.zanet.pl\/konfuzatajvortoj2.html\">liston de vortojn<\/a> (la listo enhavas erarojn!), kiuj estas ofte miksitaj \u0109e komencantoj. Se oni bone analizas la liston, estas okulfrape, ke \u0109e kelkaj vortoj, oni povus bone trovi la eraron de kunteksto de vorto.<br \/>\nEn Esperantilo ekzistas nun &#8222;vortaro de frazpartoj&#8220; (Menuo Lingvistiko-Uzado de vortoj en frazparoj&#8220;). Mi pli bone nomigus tiun vortaron &#8222;kunteksta vortaro&#8220;. \u0108e kelkaj verboj oni povus trovi la eraron, \u0109ar la verboj havas alian transitivecon.<\/p>\n<p>verbo &#8222;\u015derci&#8220; estas ne transitiva.<br \/>\nverbo &#8222;ser\u0109i&#8220; estas transitiva.<\/p>\n<p>Ebla solvo por trovo de misuzo de prepozicioj &#8222;por&#8220; kaj &#8222;pro&#8220; nur de analizo de \u0109efa verbo.<\/p>\n<p>pro:<br \/>\nesti (164), suferi (45), morti (41), devi (37), povi (36), danki (34), fari (28), ricevi (26), havi (26), \u011doji (26), senti (21), fari\u011di (19), okazi (17), perdi (15), diri (14), peti (14), veni (14), honti (14), resti (10)<\/p>\n<p>por:<br \/>\nesti (874), havi (152), fari (58), fari\u011di (57), doni (55), ta\u016dgi (53), bezoni (50), ekzisti (44), uzi (44), trovi (42), povi (38), sufi\u0109i (37), ricevi (36), devi (35), pagi (34), resti (34), veni (28), labori (26), prezenti (20), gravi (19), prepari (19), signifi (18), montri (17), a\u0109eti (17), voli (17), elspezi (16), preni (16), kolekti (15), necesi (15), alporti (14), trovi\u011di (14), senti (13), validi (12), iri (12), ser\u0109i (11), valori (10)<\/p>\n<p>De tiuj listoj oni vidas kaj verboj &#8222;suferi, morti, honti&#8220; aperas en la tekstaro nur kun &#8222;pro&#8220;.<\/p>\n<p>Verboj kunteksto de objekto<\/p>\n<p>atendi:<br \/>\nmomento (23), respondo (11), reveno (10), ordono (6), alveno (5), nokto (4), rezulto (3), vizito (3), da\u016drigo (2), edzino (2), edzo (2), fari\u011do (2), infano (2), kvieti\u011do (2), ondo (2), plialti\u011do (2), proksimi\u011do (2), propono (2)<\/p>\n<p>atenti:<br \/>\nvorto (4), aserto (1), babilado (1), bezono (1)<\/p>\n<p>De tiu statistiko oni povas konstrui regulojn, sed eble tiuj reguloj ne estas tute certaj. La problemo estas, ke ofte la kunteksto povas esti pli vasta kiel unu frazo kaj devas enhavi la \u011deneralan scion pri mondo. Tiu scio nuntempe estas ne atingebla de komputiloj.<\/p>\n<p>Por tiaj eraroj oni povas tre facile konstrui frazojn por testado de programo. Oni prenas frazojn de granda tekstaro, en kiuj aperas tiuj vortoj kaj inter\u015dan\u011das tiuj vortoj je la falsaj vortoj. Poste oni testas, \u0109u la programo trovas tiun inter\u015dan\u011don.<\/p>\n<p>Nun mi ne povis trovi en la reto la plenan liston de ekzemploj de gramatikaj eraroj. La <a href=\"http:\/\/vikio.ikso.net\/Projektoj\/GramatikKontrolilo\/Eraroj\">listo en vikio<\/a> ne estas plena la\u016d la teksto en la diplomlaboro.<br \/>\nLa ekzemploj de diplomlaboro inspiris min plivastigi mian liston de <a href=\"http:\/\/www.esperantilo.org\/erarekzemploj.html\">gramatikaj eraroj<\/a>.<br \/>\nFeli\u0109e unu ekzemplon de tiu laboro (frazo: &#8222;Lernis tie \u0109irka\u016d 120 studentojn.&#8220;) la programo Esperantilo regas nun tute \u011duste.<\/p>\n<h3>Falspozitaj eraroj<\/h3>\n<p>La plej granda manko de gramatikaj korektiloj estas la falspozitivaj mesa\u011doj. Kiel programisto oni tre \u011dojas, ke la programo trovas iujn erarojn kaj unue ne zorgas pri falspozitivaj eraroj. Por la uzanto \u0109iu falspozitiva eraro por &#8222;evidente&#8220; \u011dusta frazo estas la grava pruvo, ke la programo estas tre malperfekta. Ekzistas do la bezono testi la programon kontra\u016d \u011dustaj tekstoj. Sed la kolekto de \u011dustaj teksoj ne estas facila afero. La problemo estas unue la kvalito de tekstoj kaj due la fakto, ke kelkaj konstrua\u0135oj aperas tre malofte. Oni bezonas do tre grandan amason da tekstoj. Feli\u0109e iu jam faris tiun grandegan laboron. En la <a href=\"http:\/\/bertilow.com\/pmeg\/\">PMEG<\/a> oni trovas ekzemplojn por \u0109iuj eblaj artoj de frazoj. Kaj \u0109iu ekzemplo estas zorge tralegita de a\u016dtoro de libro. Mi ekstraktis tiuj ekzemplaj frazoj de PMEG kaj uzas ilin por testado. Mi devus diri, ke veraj tekstoj estas e\u0109 pli komplikaj. Ili enhavas multaj fremlingvajn nomojn, fremdlingvajn cita\u0135ojn kaj estas tre komplikaj.<\/p>\n<p>Mi pensis anka\u016d pri bona komparo de gramatikaj kontroliloj. Oni devus testi je du tekstoj. La unua enhavas erarojn. Kaj oni provas, kiujn erarojn kapablas trovi la programo. La dua teksto estas tute \u011dusta, kaj enhavas tre diferencaj frazoj. De tia testo oni povus kalkuli la bonon de korektilo la\u016d <a href=\"http:\/\/en.wikipedia.org\/wiki\/Recall_(information_retrieval)\">tiu formulo<\/a>. Praktike la plej granda problemo estas konstati, \u0109u temas pri gramatika eraro a\u016d ne. Tion priskribis anka\u016d la diplomlaboro. Ofte ne ekzistas konsento pri \u011dusteco de iu frazo en Esperanto. Oni povus diri, ke kiam renkontas 5 esperantistoj, ekzistas 6 opinioj pri la \u011dusta esperanta lingva\u0135o. La lingvohelpilo markas kiel eraro la lingva\u0135on &#8222;kelke de &#8230;&#8220; sed akceptas &#8222;multe de &#8230;&#8220;. La lingva\u0135o &#8222;multe de&#8220; estas vaste uzata, la analoga &#8222;kelke de &#8230;&#8220; estas tamen ne akceptinda por multaj.<\/p>\n<p>La projekto lingvohelpilo nun donas fruktojn. Mi \u015datus, ke tiuj fruktoj estas anka\u016d iom da lingvistika materialo kaj io, kion mi povus ruli sur mia komputilo. La dua konstato estas, ke reta komunumo vere ne ta\u016dgas por prilaboro de komplikaj lingvistikaj taskoj.<\/p>\n<p>Mi nun beda\u016drinde ne havas tempon por la programo Esperantilo. Mi esperas, ke post iom da tempo mi denove okupos pri la programo kaj povus realigi kelkajn ideojn.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>En la lasta tempo mi legis la diplomlaboron &#8222;Erarkolektado kaj Analizado&#8220; de Sonja Petrovi\u0107 Lundberg. La diplomlaboro aperis kadre de projekto lingvohelpilo. Tio estas jam la dua diplomlaboro. Pri la alia mi skribis en mia alia blogo (Projekto Lingvohelpilo kaj Literumado). La bona kolekto de gramatikaj eraroj estas grava bazo por programado de gramatika kontrolilo. [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[4],"tags":[],"class_list":["post-128","post","type-post","status-publish","format-standard","hentry","category-lingvistiko"],"_links":{"self":[{"href":"http:\/\/blog.esperantilo.org\/index.php?rest_route=\/wp\/v2\/posts\/128","targetHints":{"allow":["GET"]}}],"collection":[{"href":"http:\/\/blog.esperantilo.org\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"http:\/\/blog.esperantilo.org\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"http:\/\/blog.esperantilo.org\/index.php?rest_route=\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"http:\/\/blog.esperantilo.org\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=128"}],"version-history":[{"count":1,"href":"http:\/\/blog.esperantilo.org\/index.php?rest_route=\/wp\/v2\/posts\/128\/revisions"}],"predecessor-version":[{"id":177,"href":"http:\/\/blog.esperantilo.org\/index.php?rest_route=\/wp\/v2\/posts\/128\/revisions\/177"}],"wp:attachment":[{"href":"http:\/\/blog.esperantilo.org\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=128"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"http:\/\/blog.esperantilo.org\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=128"},{"taxonomy":"post_tag","embeddable":true,"href":"http:\/\/blog.esperantilo.org\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=128"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}