{"id":90,"date":"2007-09-03T19:45:33","date_gmt":"2007-09-03T18:45:33","guid":{"rendered":"http:\/\/blog.esperantilo.org\/?p=90"},"modified":"2007-09-03T20:15:00","modified_gmt":"2007-09-03T19:15:00","slug":"kunsido-der-projekto-gramatika-korektilo","status":"publish","type":"post","link":"http:\/\/blog.esperantilo.org\/?p=90","title":{"rendered":"Kunsido de Projekto &#8222;Gramatika Korektilo&#8220;"},"content":{"rendered":"<p>\nLa 25 kaj 26 a\u016dguston mi partoprenis la unuan <a href=\"http:\/\/vikio.ikso.net\/Projektoj\/GramatikKontrolilo\/Kunsido1\">kunsidon<\/a><br \/>\nde krei\u011danta projekto <a href=\"http:\/\/vikio.ikso.net\/Projektoj\/GramatikKontrolilo\">GramatikKontrolilo<\/a>. Mallonge dirite la projekto celas krei gramatikan kontrolilon helpe de subteno de organizo <a href=\"http:\/\/esperantic.org\/\">ESF<\/a>. La organizo jam subtenas kelkajn tre gravajn kaj sukcesajn projektojn en Esperantujo. Tiuj estas interalie la konata retejo <a href=\"http:\/\/www.lernu.net\">Lernu.net<\/a>, la <a href=\"http:\/\/bertilow.com\/tekstaro\/\">tekstaro de Esperanto<\/a> kaj tradukado de programo <a href=\"http:\/\/www.openoffice.org\">OpenOffice<\/a>. La iniciatinto kaj la organizanto de tiu projekto estis Hokan Lundberg, kiu tre trovis kaj kontaktis \u0109iujn partoprenantojn.\n<\/p>\n<p>\nTio estas por mi la unua fojo, kiam mi povus uzi Esperanton kiel parolata lingvo. Tio estis tre interesa sperto por mi. Mi havis kelkajn problemojn kun prononcado, sed entute mi povus normale paroli kaj \u0109ion kompreni. Mi pensas, ke longa (4 jara) a\u016dskultado de pola radio ka\u016dzis tion.\n<\/p>\n<p>\n\u0108e la kunsido mi povus konati\u011di kun tre interesaj homoj. \u0108iuj estis tre enga\u011di\u011ditaj Esperantistoj kaj lingvistoj kun vastaj konoj de komputila lingvistiko. Nun mi povis direkte paroli kun Eckhard Bick, kiu estis por mi jam delonge konata de projekto <a href=\"http:\/\/visl.sdu.dk\/\">VISL<\/a>. Tiun projekton mi tre atende trarigardis anta\u016d kelkaj jaroj, kiam mi komencis la okupon pri komputila lingvistiko. Mi renkontis Sonja Petrovi\u0107 Petrovic kaj Hokan Lundberg, laborantoj de projekto &#8222;Lernu&#8220;, Judith Meyer, kiu kreis la retejon &#8222;Amikumu&#8220;, Marek Blahu\u009a kaj Henning von Rosen.\n<\/p>\n<p>\n\u0108e tiu kunsido mi povis prezenti la programon Esperantilo, kiu jam enhavas gramatikan korektadon.<\/p>\n<ul>\n<li><a href='http:\/\/blog.esperantilo.org\/wp-content\/uploads\/2007\/09\/projekto-esperantilo.pdf' title='Prezento de Projekto Esperantilo - dum kunsido en Stokholmo'>El\u015duto &#8211; La orginala prezento<\/a> PDF<\/li>\n<li><a href='http:\/\/blog.esperantilo.org\/wp-content\/uploads\/2007\/09\/projekto-esperantilo.zip' title='Prezento de Projekto Esperantilo - dum kunsido en Stokholmo'>El\u015duto &#8211; La orginala prezento<\/a> OpenOffice zip<\/li>\n<\/ul>\n<p>Mi dekomence signalis, ke mi ne povas aktive kaj plene partopreni en la projekto. Unue mi ne havas sufi\u0109e da tempo, due mi ne volas okupi pri tiu temo en alia maniero kiel \u015datokupo. Tamen estis tre agrable, ke mi anka\u016d kiel neprofesiulo povis partopreni en la kunsido. Feli\u0109e la gvidadon de projekto povus preni Eckhard Bick, kiu estas tre sperta lingvisto kaj delonga Esperantisto kaj jam faris gramatikan kontrolilon de dana lingvo kadre de programo &#8222;ordred&#8220;. Do oni ne bezonos fari \u0109ion de komenco. Eckhard Bick havas diversajn pretajn modulojn por esperanta lingvo kaj la testitaj metodoj por dana lingvo. Do oni bezonas adapti tiujn metodojn kaj modulojn por esperanta lingvo. Nur kelkaj elementoj de sistemo devus esti farita tute nove. \u0108e priskribo de taskoj de projekto evidenti\u011dis aldonaj subprojektoj. Tiuj estas<\/p>\n<ul>\n<li>Literumado<\/li>\n<li>Bazo de sintaksaj arboj<\/li>\n<li>Bazo de eraroj<\/lI>\n<\/ul>\n<p>En la unua \u015dtupo de projekto la gramatika kontrolado estas oferota nur kiel reta interfaco. Poste la gramatika kontrolado devos funkcii en la programo OpenOffice. \u0108ar kelkaj elementoj de sistemo estas faritaj kedare de komercaj projektoj, tiu sistemo ne estos plene malferma. Tio ne estas por mi bona informo, \u0109ar mi kiel programisto normale havas la intereson rekonstrui la sistemon de fontoj kaj adaptigi \u011din por aliaj taskoj a\u016d operaciemaj sistemoj. Mi anka\u016d pli volonte legas la programan fontan kodon ol sciencajn labora\u0135ojn. Tamen \u0109iuj direktaj rezultoj de tiu projekto estos malfermaj por vasta publiko. Mi esperas, ke anka\u016d la projekto Esperantilo povus profiti de tiu projekto kaj mi oferis anka\u016d helpon al tiu projekto.\n<\/p>\n<p>\nPor mi la plej interesa parto de la kunsido estis la prezento de Eckhard de metodoj de analizo de tekstoj la\u016d la teorio de <a href=\"http:\/\/en.wikipedia.org\/wiki\/Constraint_Grammar>&#8222;Contraint Grammar&#8220;<\/a> Mi jam frue interesi\u011dis pri tiu metodo, sed frue mi ne povis bone kompreni \u011din. Spite de la nomo &#8222;Contraint Grammar&#8220;, kiu al mi kiel programisto rilatas al <a href=\"http:\/\/en.wikipedia.org\/wiki\/Constraint_satisfaction>&#8222;Contraint Satisfaction&#8220;<\/a>, tiu metodo estas tre simpla. CG ne havas fonton en teorio de generativa formalismo, sed estas rezulto de tre pragmatikaj pensoj. La fontaj datoj por GG-Analizilo estas etikeditaj vortoj.<br \/>\nNormale \u0109iuj vortoj posedas diversajn ambiguajn etiketojn. La analizilo forigas a\u016d aldonas etiketojn sur nivelo de vortoj la\u016d priskribitaj reguloj.<br \/>\nLa reguloj de CG estas simplaj proceduroj la\u016d modelo: &#8222;Forigu\/Aldonu la etiketon \u0109e vorto kun etikedoj, se la kondi\u0109o estas prava.&#8220; Kondi\u0109oj priskribas la najbarajn vortojn. Tiu estas do pure procedura priskribo kontra\u016de al diskriptiva priskribo de generativaj metodoj. La \u0109efaj avanta\u011doj de CG estas \u011dia stabileco, rapideco kaj simpleco. Mi pensas, ke tiu metodo estas anka\u016d ekzemplo por bona divido de taskoj inter programistoj kaj lingvistoj. Nun programistoj povus programi CG-Analizilon, kaj lingvistoj havas simplan proceduran lingvon por manipulado de etiketoj. Do CG-Formalismo estas la tiel nomata <a href=\"http:\/\/en.wikipedia.org\/wiki\/Domain_Specific_Language\">Domain Specific Language<\/a>.<br \/>\nAnta\u016d 4 jaroj mi multe pensis pri la metodo, mi tiam anka\u016d trovis la <a href=\"http:\/\/sourceforge.net\/projects\/vislcg\/\">liberan analizilon<\/a> de projekto VISL. La nova versio de tiu analizilo estas <a href=\"http:\/\/beta.visl.sdu.dk\/cg3.html\">CG3<\/a>. Tamen mi havis grandajn problemojn kompreni la signifon de multnombraj etiketoj. Kvankam mi trovis ekzemplajn regulojn por angla lingvo, mi ne povis uzi tiun analizilon. La forta flanko de CG estas forigo de ambigueco. \u0108ar en Esperanto tiu problemo apena\u016d ekzistas, la uzeblecon de tiu metodo mi ne konsideris tiam kiel tre granda.\n<\/p>\n<p>\nKiel mi nun scias, tre interese estas, ke la CG-on oni povas ne nur uzi por disambigueco de vortklasoj, sed anka\u016d por sintaksa analizo kaj kreo de <a href=\"http:\/\/en.wikipedia.org\/wiki\/Dependency_grammar\">&#8222;functional dependency grammar&#8220;<\/a>. Anka\u016d semantika analizo povas uzi CG-analizilojn. Per la sama metodo oni anka\u016d povas trovi gramatikajn erarojn. Do la gramatika korektado estas nur unu elemento en la \u0109eno de CG-analizoj, kiuj laboras la\u016d diferencaj reguloj. La plej kompleksaj reguloj ekzistas por sintaksa analizo. La komplekseco de tiuj reguloj estas eble la plej malavanta\u011da aspekto de tiu metodo. Por avera\u011da lingvo oni bezonas pli a\u016d malpli 900 regulojn. La flegado de tiuj reguloj ne estas facila kaj oni bezonas longan sperton pri tio. La ordo de reguloj havas grandan influon sur la rezulto. Kutime oni unue difinas bazajn regulojn kaj poste aldonas aliaj kondi\u0109ojn kaj aliajn regulojn. Do la legebleco de reguloj i\u011das pli kaj pli malalta. La difino de \u0109iuj necesaj reguloj estas laboro por jaroj. Estas malavanta\u011de, ke tiun laboron oni ne povas dividi inter kelkaj homoj, \u0109ar la influo de reguloj inter si estas tre granda. Tamen la komplekseco de reguloj estas la problemo en \u0109iuj \u011disdataj metodoj. De teknika vidpunkto la formalismo de reguloj havas kelkajn malavanta\u011dojn, kiuj rezultigis la neceson de multaj reguloj. Per reguloj oni ne povas difini rekursiajn strukturojn. Tiuj reguloj nur limigite ebligas la uzon de \u011deneraligo (nur per difino de listoj). Anka\u016d la uzado de metodo &#8222;backtracking&#8220;, kiu por kelkaj problemoj de sintaksa analizo estus tre konvena, ne estas ebla \u0109e CG.\n<\/p>\n<p>\nEn Esperantilo mi anka\u016d uzas la metodon, kiu estas simila al CG. La metodo estas &#8222;button-up&#8220; kaj ne enhavas &#8222;backtracking&#8220;. Tial anka\u016d la analizo en Esperantilo \u0109iam ion rezultigas kaj estas sufi\u0109e rapida. En Esperantilo mi havas nur 100 bazajn regulojn, kvaza\u016d ili kovras preska\u016d tutan gramatikon de Esperanto. Kelkaj aldonaj analizoj por subfrazoj, relativaj subfrazoj kaj infinitivaj frazpartoj estas programitaj speciale. La diferenco inter Esperantilo kaj CG estas, ke en Esperantilo dekomence \u0109e sintaksa analizo vortoj estas grupigitaj kiel sintaksaj subarboj. Tial la reguloj por sekva \u015dtupo povas esti difinitaj pli \u011denerale. Mi uzas la fakton, ke ofte la grupo de vortoj povas esti pritraktato nur kiel la kapo de tiu grupo. Ekzemple por \u0109iuj substantivaj frazpartoj: &#8222;libro&#8220;, &#8222;bona libro&#8220; &#8222;bona libro skribita de fama a\u016dtoro&#8220; la plej grava estas la kapo &#8222;libro&#8220;. Do sekva analizo povus pritrakti nur tiun vorton. Tial okazas \u0109e analizo redukto de komplekseco.\n<\/p>\n<p>\nMia nuntempa sento pri la problemo de sintaksa analizo estas, ke oni bezonus diferencajn metodojn por atingi bonajn rezultojn. La rekono de substantivaj frazpartoj postulas aliajn metodojn ol analizo de subfrazoj kaj konjunkcioj. Diskriptivaj reguloj estas ofte pli elegantaj kaj pli mallongaj ol procedurdeklaraj. Kelkajn problemojn oni povas nur bone solvi per &#8222;backtracking&#8220;.\n<\/p>\n<p>\nLa sukceso de CG eble plejparte bazi\u011das sur speciala programa lingvo, kiu estas farita nur por lingvistoj. Per tiu programa lingvo lingvistoj kapablas mem difini regulojn. Ekzistas anka\u016d kelkaj ideoj, kiel plibonigi la uzeblecon de CG. Miaopinie oni povus konsideri sekvajn punktojn: <\/p>\n<ul>\n<li>A\u016dtomata kreado de CG-reguloj de pli \u011deneralaj reguloj.<\/li>\n<li>A\u016dtomata kreado de CG-reguloj de statistika analizo de bazo de sintaksaj arboj.<\/li>\n<li>Aldonaj iloj, kiuj helpos \u0109e difino kaj testado de reguloj.<\/li>\n<li>Plivastigo de CG je aldonaj metodoj.<\/li>\n<\/ul>\n<p>Por pli bona pritakso de CG mi bezonus pli da informoj. La projekto VISL havas la analizilon por esperanta lingvo, sed la analizilo anka\u016d havas problemojn kun komplikaj frazoj simile al analizilo de Esperantilo. Tion mi povis konstati post kelkaj testoj per <a href=\"http:\/\/visl.sdu.dk\/visl\/eo\/parsing\/automatic\/\">reta interfaco de projekto<\/a>. Interesa estus la demando, \u0109u estas eble plibonigi la analizon kaj kiom da energio tio postulus. Malbon\u015dan\u0109e reguloj por neniu lingvo estas libere atingeblaj, do oni povus nur iom havi la ideon pri la verko de reguloj post studado de kelkaj sciencaj labora\u0135oj.\n<\/p>\n<p>\nSe mi havos sufi\u0109e de libera tempo, mi volas pli detale okupi\u011di pri CG-Analizilo. Mi e\u0109 povus uzi la liberan CG-Analizilon en Esperantilo, \u0109ar mi povas bone reuzi modulojn, kiuj estas skribitaj en programa lingvo C++, de programa lingvo XOTcl. La bona tasko por CG estus la analizo de pola lingvo.\n<\/p>\n<p>\nPor Esperantilo estus bone klare disigi la regulojn de programado de analizilo. La programa lingvo, kiun mi uzas \u0109e programado de Esperantilo, estas sufi\u0109e abstrakta kaj potenca por uzi meta-programadon. Do mi programas regulojn de analizo kaj la analizon en la sama programa lingvo. Aliflanke la klara diferenco inter lingvaj reguloj kaj programado de analizilo ne ekzistas tiel forte kiel en CG-metodo. <\/p>\n<h3>Resumo<\/h3>\n<p>Mi estas tre \u011doja, ke la projekto Esperantilo iel anka\u016d instigas kaj inspiras aliajn pli profesiajn projektojn. Tio estas por mi grava motivigo por plia okupo. Dum la renkonti\u011do mi povis konati\u011di kun tre interesaj homoj kaj mi havis novojn ideojn. Nun mi estas tre scivola pri la sekva evoluo de tiu projekto. <\/p>\n","protected":false},"excerpt":{"rendered":"<p>La 25 kaj 26 a\u016dguston mi partoprenis la unuan kunsidon de krei\u011danta projekto GramatikKontrolilo. Mallonge dirite la projekto celas krei gramatikan kontrolilon helpe de subteno de organizo ESF. La organizo jam subtenas kelkajn tre gravajn kaj sukcesajn projektojn en Esperantujo. Tiuj estas interalie la konata retejo Lernu.net, la tekstaro de Esperanto kaj tradukado de programo [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[1,4],"tags":[],"class_list":["post-90","post","type-post","status-publish","format-standard","hentry","category-allgemein","category-lingvistiko"],"_links":{"self":[{"href":"http:\/\/blog.esperantilo.org\/index.php?rest_route=\/wp\/v2\/posts\/90","targetHints":{"allow":["GET"]}}],"collection":[{"href":"http:\/\/blog.esperantilo.org\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"http:\/\/blog.esperantilo.org\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"http:\/\/blog.esperantilo.org\/index.php?rest_route=\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"http:\/\/blog.esperantilo.org\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=90"}],"version-history":[{"count":0,"href":"http:\/\/blog.esperantilo.org\/index.php?rest_route=\/wp\/v2\/posts\/90\/revisions"}],"wp:attachment":[{"href":"http:\/\/blog.esperantilo.org\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=90"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"http:\/\/blog.esperantilo.org\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=90"},{"taxonomy":"post_tag","embeddable":true,"href":"http:\/\/blog.esperantilo.org\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=90"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}