{"id":34,"date":"2007-01-09T21:01:08","date_gmt":"2007-01-09T20:01:08","guid":{"rendered":"http:\/\/blog.esperantilo.org\/?p=34"},"modified":"2009-12-07T22:55:09","modified_gmt":"2009-12-07T21:55:09","slug":"lingvistiko-esperanto-komputilaj-projektoj","status":"publish","type":"post","link":"http:\/\/blog.esperantilo.org\/?p=34","title":{"rendered":"lingvistiko, esperanto, komputilaj projektoj"},"content":{"rendered":"<p>Ideo de ma\u015dina tradukado ekzistas ekde apero de komputiloj. Ma\u015dina tradukado kaj arta penso estis la revo de unuaj programistoj, eble \u0109ar tiuj temoj estus bone komprenataj por vasta publiko. Tradukado estas malfacila tasko, kiun povas plenumi nur kelkaj homoj post longa lernado. Tial komputilo, kiu tradukas, estus la pruvo por ta\u016dgeco de komputiloj.<\/p>\n<p>\u0108iu nun scias, ke ne ekzistas komputiloj, kiuj povas pensi a\u016d traduki en nivelo de homoj. Longe post multaj fiaskaj projektoj, en kiuj oni perdis grandan kvanton de mono, e\u0109 specialistoj pensis, ke programado de tiuj sistemoj ne estas ebla. Historio de komputika lingvistiko bone priskribas la konata dokumento <a href=\"http:\/\/ourworld.compuserve.com\/homepages\/WJHutchins\/PPF-TOC.htm\">Machine Translation: past, present, future<\/a>. Ofte e\u0109 Esperantistoj varbas por Esperanto kun argumento, ke ma\u015dina tradukado ne estas ebla kaj neniam estos ebla. En tiu kazo oni ofte prezentas tre bizarajn frazojn, kiuj nur tre malfacile estas tradukeblaj e\u0109 por profesiaj tradukistoj. Mi estas certa, ke per similaj argumentoj oni povus anka\u016d pruvi, ke tradukado \u011denerale ne estas ebla. Sed la temo de komputila lingvistiko ne mortis kaj e\u0109 lastatempe bone progresas. Kvankam ne ekzistas perfektaj tradukaj programoj, la unuopaj eroj de komputila lingvistiko aperas pli kaj pli ofte. Preska\u016d \u0109iu uzas nun literumadon en redaktiloj kaj komputilajn vortarojn. Anka\u016d &#8222;google&#8220; estas ja infano de komputila lingvistiko.<\/p>\n<h3>Kial fiaskis tiom da projektoj pri ma\u015dina tradukado?<\/h3>\n<p>Oni povus \u011denerale diri, ke komputilaj projektoj tre ofte fiaskas. La duono de projektoj neniam fini\u011das kaj 75% de projektoj ne atingas la celojn. Ili estas pli multekostaj a\u016d ne havas la necesajn planitajn funkciojn. La temo de ma\u015dina tradukado havas aldonojn specialajn trajtojn, kiuj e\u0109 faras tiujn projektojn e\u0109 pli malfacilajn kaj pli riskajn. Tio estas:<\/p>\n<ul>\n<li>Oni havas tre altajn atendojn. Oni volas programojn, kiuj regas multajn lingvojn, tradukas en reala tempo en multaj direktoj kaj povas kompreni diritajn vortojn kaj mem paroli.<\/li>\n<li>Oni bezonas multajn specialistojn de diversaj kampoj<\/li>\n<li>La baza lingvistika teorio, kiu estas praktike ta\u016dga, ne ekzistis. La historiaj teorioj ne estis ta\u016dgaj por multaj kazoj.<\/li>\n<li>Lingvistikaj programaj postulas grandajn necesojn al komputiloj. \u011cis 1980 komputiloj ne estas ta\u016dgaj por lingvistiko, \u0109ar ili ne havis necesan rapidecon kaj memoron. La haveblaj komputiloj en frua tempo estis tro multekostaj. Oni pripensu, ke e\u0109 baza vortaro havas 50000 vortojn. Prilabori, traser\u0109i a\u016d redakti tiun kvanton de informoj estas por tiamaj komputiloj tre malfacila tasko.<\/li>\n<li>La projektoj preska\u016d \u0109iam komencis de nulo. Lingvistoj nenion sciis pri komputiloj, programistoj nenion sciis pri lingvistiko. Oni devus skribi programojn kaj solvi bazajn teknikajn defiojn. Lingvistoj devis krei ta\u016dgajn teoriojn.<\/li>\n<li>\u0108iu profesia projekto havas nur limigitan kvanton da rimedoj. La unua limo estas tempo. Oni devas havi rezultojn post unu a\u016d du jaroj. Post tiu tempo la membroj de projekto komencas iom komprenis pri la temo de projekto.<\/li>\n<li>Tiuj projektoj estis tro grandaj. Organizado de grandaj projektoj estas e\u0109 pli komplika ol la temo de projektoj. La respondeculoj ofte pensas, ke \u0109iu problemo estas solvebla per aldonaj partoprenantoj de projekto. Konata programista anekdoto diras, ke la\u016d tiu pensmaniero oni povus konstati: Por havi unu novan homon oni necesus unu virinon kaj 9 monatojn da tempo. Oni povus duonigi la tempon havante du virinojn.<\/li>\n<li>Ne ekzistis komputilaj materialoj, kiujn oni povis uzi de komenco.<\/li>\n<\/ul>\n<p>Mi pensas, ke la unua problemo estas, ke la projektoj volis sole atingi \u0109ion. Oni ne provis dividi la taskon en multaj kampoj. Kvankam projektoj fiaskas, ili ofte lasas multajn rezultojn a\u016d e\u0109 solvojn de unuopaj problemoj. Sed por monaj ka\u016dzoj estas ofte maleble transdoni tiujn rezultojn al sekvaj projektoj. Do multaj rezultoj malaperas en arkivoj por \u0109iam. La projektoj malaperas, kvaza\u016d ili neniam estis. En plej bona kazo restas de tiuj projektoj malgranda raporto a\u016d scienca labora\u0135o, sed vortaroj a\u016d programa kodo, \u0109io \u0109i malaperas por \u0109iam.<\/p>\n<p>La unuaj projektoj estis pagitaj de militaj fortoj, \u0109ar ili bezonis ma\u015dinan tradukadon por spionado de aliaj landoj. Tial la rezultoj de tiuj projektoj estis \u015dtataj sekretoj. En universitatoj, kiuj anka\u016d havis lingvistikajn projektojn, oni uzis por projektoj studentojn, kiuj ne estas bonaj spertaj programistoj kaj ofte forlasis la projekton post unu a\u016d du jaroj. Tio estas tro mallonga periodo por efike produkti uzeblajn rezultojn. Komercaj projektoj fiaskis miaopinie precipe por kazo de mallonga tempo. Komercistoj pensas precipe nur en unujaraj periodoj de librotenado. \u011cis nun preska\u016d ne ekzistas merkato por partoj de solvoj de komputiko. Tiu kampo de komerca programado laboras la\u016d maniero \u0109io a\u016d nenio. \u0108u iu memoras pri sistemoj kiel <a href=\"http:\/\/en.wikipedia.org\/wiki\/Amiga\">Amiga OS<\/a>, <a href=\"http:\/\/en.wikipedia.org\/wiki\/OS\/2\">OS\/2<\/a> a\u016d diversaj aliaj programoj, kiuj por \u0109iam malaperis, kvankam \u011di rulis bone kaj estis uzeblaj. \u011cis anta\u016d mallonga tempo \u015dajnis, ke en tiu komerca kampo povas esti nur unu gajninto. Tio estas a\u016d IBM a\u016d MS. Sed nun ekzistas alia komputila mondo de liberaj programoj. Do estas eble ruli la tutan sistemon nur per libera programaro.<\/p>\n<h3>Lingvistikaj projektoj. \u0108u problemo de interkomunikado?<\/h3>\n<p>Programistoj kaj lingvistoj devenas el tute aliaj kampoj de scienco. Ili havis alian manieron solvi la problemojn. Mi pensas, ke malbona kunlaboro inter lingvistoj kaj programistoj estas anka\u016d granda ka\u016dzo de malsukcesoj. Programistoj devenas de scienca kampo de matematiko. Ili ser\u0109is la\u016d matematika maniero la mallongan precizan formulon, kiu estas vera por \u0109iu kazo. La akademia teorio de lingvistiko estas plena da logikaj formuloj, kiuj preska\u016d malestas en praktika uzo. La naturajn lingvojn oni ne povas priskribi per simplaj formuloj.<\/p>\n<p>En komputilaj projektoj oni kutime havas du grupojn de homoj. La unua grupo estas tiel nomataj teknikaj fakuloj. Tio estas programistoj. Alia grupo estas fakaj specialistoj, kiuj scias iom pri temo de projekto. La sukceso de projekto dependas ofte de ebleco de lernado de du grupoj unu de alia. Programistoj devas lerni de fakuloj kaj fakuloj devas lerni de programistoj.<\/p>\n<p>Lingvistoj devenas de humanecaj sciencoj, simile al filozofio a\u016d literaturo. Por ili lingvo estis historie io sakra, io magia, io,  kion oni ne nepre devas logike kompreni. Lingvistoj pritraktas lingvojn kun preska\u016d religia maniero. Ili akceptas misterojn kaj nelogikajn esprimojn. Ili ne pruvas. Ili \u015dategas debati pri kurioza\u0135oj. La argumento de a\u016dtoritato estas pli grava ol logika pruvo. Lingvistikaj teorioj estis do frue tute malta\u016dgaj por programistoj, kiuj devas ja liveri pragmatikajn kaj praktikajn rezultojn. Mi pensas, ke nova generacio de lingvistoj iom post iom lernas uzi sciencajn metodojn en lingvistiko. Ili uzas statistikon, pruvas la rezultojn sur grandaj tekstaroj. Ili lernis ordigi la teorion la\u016d ofteco de uzebleco. Kurioza\u0135oj ne plu rolas gravan rolon en teorioj. Ili e\u0109 lernis uzi la komputilon kaj permesas al la aliaj tu\u015di ilian sakran lingvon.<\/p>\n<p>Sed anka\u016d la sinteno de programistoj kun rigida matematika fundo estas malutila por lingvistikaj projektoj. Bonan priskribon de takso de programado donas al ni <a href=\"http:\/\/www.ais-sanmarino.org\/kursoj\/s1\/kultprog\/teksto.html\"> Kulturaj aspektoj de komputil-programado<\/a>. Programistoj atendis de natura lingvo similajn trajtojn, kiel ili tion konas de programaj lingvoj. Pritrakti naturajn lingvojn estas unue la arto administri esceptojn. Tial oni ne povas atenti iun formulon, kiu priskribas \u0109iujn fenomenojn de lingvo.<\/p>\n<p>La kutimaj problemoj, kiujn frontas programistoj, estas anka\u016d aliaj ol tiuj de lingvistiko. Kutime rezultoj de programoj devas esti tre certaj. Oni pripensu komputilaj sistemoj, kiuj de multaj jaroj laboras en bankoj a\u016d en komerco. Komputiloj regulas multajn sistemojn. Ili konservas grandajn datumojn. Ili devas esti sekuraj kaj certaj. En lingvistiko, la problemoj estas ofte ne certaj. La problemoj havas statistikan naturon. En komputiko, \u0109iu esprimo estas a\u016d vera a\u016d malvera. Naturaj lingvoj ne havas tiujn trajtojn. Tial lingvistikaj programoj devas prilabori datojn, kiuj enhavas erarojn, kiuj ne estas tute analizeblaj. Rezultojn de ma\u015dina tradukado oni nur malfacile povas pritaksi, \u0109ar e\u0109 tradukoj de homoj estas diskuteblaj. Ne ekzistas objektiva mezuro de kvalito de tradukado.<\/p>\n<p>Natura lingvo sekvas la statistikajn principojn de naturaj fenomenoj. Ekzemple oni povas kun 10 simplaj reguloj bone priskribi 80% de tekstojn, por restajn 10% oni bezonus 20 regulojn, kaj por lastaj 10% de tekstoj oni bezonus tute alian teorion kaj por multaj homoj tiuj frazoj estus diskutindaj rilate al ilia korekteco. Tiu fenomeno estas konata sur la nomo <a href=\"http:\/\/en.wikipedia.org\/wiki\/Pareto_principle\">principo de Pareto<\/a><\/p>\n<h3>Komputila lingvistiko en nuna Stato<\/h3>\n<p>Lingvistoj kaj programistoj multe lernis de fruaj malsukcesoj. La nunaj sciencaj labora\u0135oj havas altan praktikan ta\u016dgecon. Ekzistas sukcesaj projektoj, kiuj pritraktas nur unu limigitan kampon de lingvistiko. Aliaj projektoj povas uzi la rezulton de aliaj projektoj. Por tio pli grava estas anka\u016d la libera programado, kiu sen monaj komplika\u0135oj permesas uzi fruajn rezultojn de aliaj projektoj. La <a href=\"http:\/\/blog.esperantilo.org\/www.gnu.org\">GPL permesilo<\/a> garantias, ke la laboro de homoj i\u011das parto de homa hereda\u0135o kaj ne malaperas en iu tirkesto. Tiu laboro ne povas esti anka\u016d misuzata de komercaj firmaoj. Sed \u0109iam ekzistas dan\u011dero, ke grandaj komercaj fortoj, kiuj por i\u011di pli granda uzas iliajn plej dan\u011deraj armilojn, tio estas advokatoj, por malpermesi al aliaj ian aktivadon kaj pensadon. La plej malnobla kaj malverplena ilo en monoj de advokatoj estas <a href=\"http:\/\/www.nosoftwarepatents.com\">softvaraj patentoj<\/a>.<\/p>\n<p>Malkontentiga estas anka\u016d komercigo de universitataj projektoj. Kvankam multaj universitataj projektoj estas financitaj de publika mono, kiu devenas ja de niaj impostoj, la rezultoj de tiuj esploroj ne estas libere atingeblaj. Do por angla lingvo ekzistas la libera semantika mapo de vortoj <a href=\"http:\/\/wordnet.princeton.edu\/\">WordNet<\/a>, sed la simila projekto por e\u016dropaj lingvoj <a href=\"http:\/\/www.illc.uva.nl\/EuroWordNet\/\">EuroNet<\/a> estas atingebla nur je granda prezo. Multaj universitatoj kunlaboras en tiu kampo kaj inter\u015dan\u011das la rezultojn de iliaj esploroj senpage, sed tio ja signifus, ke nur universitatoj rajtas esplori science la\u016d sciencaj principoj, la\u016d kiuj ja la scienca kono estas publika bono. Fine tiu komercigita scienco helpus al neniu kaj rezultoj, kiuj ne estas atingeblaj en vero ne ekzistas.<\/p>\n<p>Kompreno de a\u016dtoraj rajtoj \u0109e lingvistikaj fontoj povus esti malfacila problemo por komputila lingvistiko. \u011cenerale lingvo ne apartenas al iu speciala ulo. Zamenhofo anka\u016d igis Esperanton publika bono kaj li rezignis pri a\u016dtoraj rajtoj de Esperanto. Sed tio ne estas certa afero \u0109e vortaroj. Vortaro estas unue la propra\u0135o de eldonejo. \u0108u vorto, kiu aperas en vortaro i\u011das a\u016dtomate propra\u0135o de eldonejo. \u0108u iu frazo, a\u016d iu speciala uzo de vorto estas propra\u0135o de a\u016dtoro de tiu frazo. Por eviti tiujn problemojn mi nur uzas liberajn fontojn kiel REVO \u0109e mia programado. Povus esti, ke aliaj fontoj estas pli bonaj, sed uzo de tiuj fontoj estas malrekomendinda. Ni pripensu do la situacion. Mi korektis la internan vortaron en programo la\u016d priskribo de profesia vortaro en tradicia libra formo, kiun mi a\u0109etis je normala prezo. \u0108e unu vorto tio ja ne estas problemo, sed se mi tion faris \u0109e 100 a\u016d 1000 vortoj, mi povas havi problemojn, \u0109ar iu povas akuzi min, ke mi \u015dtelis la parton de vortaro. Tiu povos esti tre granda problemo \u0109e Esperanto, \u0109ar tiu lingvo estas nova kaj konstruita, kontra\u016de al naciaj lingvoj oni povus trovi la kreinto de iu vorto, frazo kaj speciala gramatika uzo. Mi esperas, ke mi ne havos tiun problemon, \u0109ar nek la programo nek Esperanto i\u011dos tiel popularaj, ke iuj komercistoj havos interesojn financi advokatojn por malkonstrui tiun projekton. Eble pro normalaj uloj tio \u011denerale \u015dajnas tre malebla afero, sed tio beda\u016drinde ofte okazas \u0109e programado.<\/p>\n<p>Ekestis tamen pozitivaj aferoj. Multaj komercaj firmaoj publikigas la rezultojn de ilia laboro la\u016d GPL permesilo. Ekzemple tre konata programlingvo JAVA i\u011dis lastatempe la parto de libera programaro. Memkompreneble, la firmaoj faras tion en situacio, kiam ili ne povas venki la komercan konkuranton kaj per tiu pa\u015do, ili volas minimume malfortigi la konkuranton. Sed firmaoj anka\u016d rimarkis, ke malfermo de projektoj pozitive influas la projektojn kaj tamen lasas al ili la eblojn perlabori monon per aldonaj servoj. Anka\u016d granda lingvistika projekto <a href=\"http:\/\/logos-os.dfki.de\/\">Open Logos<\/a> i\u011dis malferma. Tio estas tre kontentiga afero, \u0109ar fontoj, kiuj unue i\u011das parto de libera programado ne povas esti enproprigitaj de iu, do ili fari\u011das la parto de homeca heredo.<\/p>\n<p>Nun ekzistas multaj fontoj en interreto, de kiu oni povas el\u0109erpi la scion pri lingvistiko. Okulfrape estas, ke precipe nur pro angla lingvo ekzistas kompleta oferto de solvoj. Malfeli\u0109e angla lingvo estas la lingvo, kiu apartenas de komputila vidpunkto al la plej malfacila lingvo por komputila pritraktado. Tial la progreso estas tre malrapida. Tre kontentiga por mi estas la fakto, ke anka\u016d por pola kaj germana lingvo aperas bonaj fontoj. (<a href=\"http:\/\/grzegorj.w.interia.pl\/gram\/gram00.html\">pola gramatiko<\/a>, <a href=\"http:\/\/www.openthesaurus.de\/\">Germana vortaro de sinonimoj<\/a>) Ili estas ofte publikigaj de hobiuloj, sed kun bona kvalito.<\/p>\n<p>Por grandaj lingvoj oni nun povus konstrui fortan sistemon de partoj, kiuj nun ekzistas. Programistoj scias, ke intergluo de moduloj, kiuj uzas diferencajn komputilajn teknikojn estas ofte tre malfacila tasko. Tial oni ne atendu rapidan progreson.<br \/>\nEn komerca kampo ekzistas firmaoj, kiuj sukcesas vendi lingvistajn programojn al profesiaj tradukistoj je granda prezo. Kvankam profesiaj tradukistoj estas ofte plej grandaj kritikistoj de ideo de ma\u015dina tradukado, ili mem ofte uzas tiujn programojn. Mi miras, ke \u011dis nun oni pagas por tradukoj je tradukita vorto, kvankam ofte por kutimaj dokumentoj, la tradukistoj havas ja \u015dablonojn kun preta tradukado sur iliaj komputiloj kaj \u0109e &#8222;tradukado&#8220; ili devas enskribi nur kelkajn nomojn kaj datojn. La profesia tradukado de oficialaj dokumentoj estas fabriko de mono, kaj tiuj homoj faros \u0109ion por longe havi tiun fonton de  facila mono.<\/p>\n<p>Oni ne esperu, ke profesiaj programoj aperas iam por Esperanto. Ne ekzistas oficialaj dokumentoj en Esperanto, kiujn oni devus traduki, do la neceso de tiuj programoj preska\u016d ne ekzistas. Nun nur kelkaj grandaj lingvoj estas entute pritraktataj de tiuj programoj.<\/p>\n<h3>Esperanto en komputila lingvistiko<\/h3>\n<p>Oni ofte parolas en Esperantujo pri ta\u016dgeco de Esperanto por lingvistika komputiko. Tamen la rezultoj estas mizeraj. La principa ka\u016dzo de tio estas, ke projektoj, kiuj estas pagitaj de naciaj fontoj, ne volas subteni ne nacian lingvon. Esperanto povis ja \u015dteliri en tiujn projektojn kiel interlingvo, sed verdire Esperanto ne estas el teknika vidpunkto bona interlingvo (<a href=\"http:\/\/blog.esperantilo.org\/?p=13\">legu<\/a>). Mi ne pensas, ke tio ofte reokazos en la venonta tempo. Sed ekzistas projektoj en alia direkto, kiuj estas subtenataj de esperantista medio. Por mi la gravaj projektoj estas <a href=\"http:\/\/purl.org\/NET\/voko\/revo\/\">REVO<\/a>, <a href=\"http:\/\/bertilow.com\/tekstaro\/\">Tekstaro<\/a> kaj <a href=\"http:\/\/bertilow.com\/pmeg\/\">PMEG<\/a>. Esperanta <a href=\"http:\/\/eo.wikipedia.org\">vikipedio<\/a> estas anka\u016d grava. Oni devas konstati, ke Esperanto konkurencas kun aliaj lingvoj en tiu kampo. Se oni komencas lingvistikan projekton, oni pritraktas, kiuj fontoj kaj solvoj estas nun uzeblaj kaj pretaj. En la unua flanko Esperanto promesas esti pli facila, en la dua flanko aliaj lingvoj (principe angla lingvo) havas pli da pretaj solvoj kaj fontoj. Mi pensas, ke anka\u016d en tiu kampo Esperanto jam malvenkis kun angla lingvo. Unue nun \u0109iu programisto konas jam anglan lingvon, \u0109ar sen angla lingvo si ne sukcesis i\u011di programisto. Due, kiu volas lerni novan kaj malofte uzatan lingvon de malgranda grupo por eksperimenti kun \u011di? Oni faras tion nur pro hobia intereso a\u016d por lernado. La facileco de Esperanto ne povas konkeri la vastan aperon de angla lingvo en komputila lingvistiko. Mi pensas, ke nun la unua \u015danco per ia estado de Esperanto en komputila lingvistiko estas hobiaj projektoj kaj libera programado. En tiu situacio estas grave, ke \u0109iuj fontoj estas publikigitaj la\u016d libera permesilo.<\/p>\n<h3>Libera programado kaj komputila lingvistiko<\/h3>\n<p>Libera programado havis kelkajn sukcesojn en sia historio. La plej granda sukceso estas la libera mastruma sistemo linukso. Nun estas eble uzi komputilon, kiu rulas nur liberajn programojn. Tiuj programoj estas e\u0109 tiel grande sukcesaj, ke komercaj firmaoj, interesi\u011das pri tiuj projektoj, kaj ne programistoj uzas tiujn programojn. \u011cis nun liberaj programoj estas skribitaj plejofte de programistoj por programistoj. Ili programis mastrumajn sistemojn, redaktilojn, programajn ilojn por sia \u0109iutaga laboro. La natura lingvo estas por programistoj ne tre interesa. Tamen restas iama revo de fruaj programistoj programi komputilon, kiu pensas kaj kiu tradukas.<\/p>\n<p>La defio de ma\u015dina tradukado estas do interesa kaj konata por programistoj. \u011cis nun aperis jam kelkaj projektoj, kiuj a\u016d rapide mortis a\u016d ne estas aktive pluevoluigita (<a href=\"http:\/\/traduki.sourceforge.net\/\">Traduki<\/a>, <a href=\"http:\/\/linguaphile.sourceforge.net\/\">Linguaphile<\/a>,<a href=\"http:\/\/transtalo.sourceforge.net\/index.html\"> Translato<\/a>). Tio estas normala afero. Plej ofte programistoj ne estas pretaj sole kaj por longa tempo prilabori unu temon. \u0108ar ekestas tre multa kvanto de liberaj projektoj, oni nur tre malfacile povas trovi uzantojn kaj helpantojn. \u015canco, ke iu projekto travivos la tempon de intereso de la unua a\u016dtoro estas tre malgranda. Komputilaj projektoj bezonas kutime kelkajn jarojn de maturi\u011do. Tiu longa tempo estas necesa \u0135us por lingvistikaj projektoj, \u0109ar en tiu tempo oni devas lerni vastan teorion. La maturi\u011doestas anka\u016d necesa post reagoj de uzantoj. Estas tre malfacila afero programi programon, kiu estas facile uzebla. Por programistoj, iliaj propraj programoj estas \u0109iam facilaj, tial ili nur malfacile rimarkas malfacila\u0135ojn pri uzebleco de programoj.<\/p>\n<h3>Projekto &#8222;Esperantilo&#8220;<\/h3>\n<p>Kiam mi komencis programi la unuajn liniojn de kodo por Esperantilo, mi neniam pensis, ke post du jaroj mi programos ma\u015dinan tradukadon kaj pensos pri sintaksa analizo. Mi volis nur havi simplan redaktilon por vindozo kaj linukso, per kiu sen peniga instalado oni povas skribi tiujn strangajn esperantajn literojn. Poste mi pensis pri literumado kaj gramatika korektado, \u0109ar mi \u0109iam forgesis la akuzativon. Mi skribis la programon unue por mi mem. Poste mi legis multe pri ma\u015dina tradukado kaj \u011denerale pri komputila lingvistiko. Mi rimarkis, ke a\u016dtoroj ne estis bonaj programistoj, kaj ke ili tute ne konas novajn teknikojn de programado. En tiama tempo mi okupi\u011dis pri nova programa lingvo <a href=\"http:\/\/www.xotcl.org\">XOTcl<\/a> kaj programada medio <a href=\"http:\/\/www.xdobry.de\/xotclIDE\">XOTclIDE<\/a>, kiun mi anta\u016de mem programis. Mi ser\u0109is temon por pruvi la ta\u016dgecon de tiu lingvo kaj programa medio. En miaj fruaj spertoj mi rimarkis, ke tiu programa lingvo permesas al mi pli efikan programadon. Mi anka\u016d trovis en interreto kelkajn materialojn pri Esperanto. Esperanton mi lernis frue tute hazarde de mia kolego kaj mi e\u0109 partoprenis la lokan kurson en urbo <em>Essen<\/em>. Mi ne i\u011dis membro de iu esperanta asocio. Mi trovis tre viglan REVO, MPEG kaj Tekstaron. Do mi ne devis komenci de nulo. Mi havis fontojn, kiujn mi povis uzi. Mi anka\u016d informis min pri similaj projektoj kaj ofte traser\u0109is la reton. Mi ne havas grandajn celojn kaj planojn, sed mi provis aldoni novajn funkciojn, kaj se ili funkcias, mi programas plu. \u0108ar mi sciis, ke la risko, ke mi ne sukcesos, estas tre granda, mi de komenco elektis kelkajn strategiojn por malaltigi tiun riskon.<\/p>\n<p>Mia programa metodo estas grande influata de tiel nomata <a href=\"http:\/\/en.wikipedia.org\/wiki\/Extreme_Programming\"><em>Extrame Programming<\/em><\/a>, kiun mi konis de programlingvo <a href=\"http:\/\/http:\/\/www.smalltalk.org\">Smalltalk<\/a>. La programa medio ebligas tiel nomatan interaktivan programadon. La\u016d tiu metodo oni povas \u015dan\u011di programon, kiu samtempe rulas. Tio estas tre helpema \u0109e lingvistikaj programoj kaj tio instigas al eksperimentoj. Unue mi limigis la plej forajn celojn al tiuj, kiuj mi mem povas iam atingi. Do mi volis elpensi novan lingvon a\u016d konstrui tute novan teknikon. Due mi difinis por mi kelkajn strategiojn:<\/p>\n<ul>\n<li>La programo celas nur traduki de Esperanto kaj prilabori nur Esperantan lingvon.<\/li>\n<li>La celaj lingvoj estas lingvoj, kiujn mi mem konas.<\/li>\n<li>Mi ne kalkulas je helpo de aliaj je moto: &#8222;mi komencis ion kaj la aliaj tion finigis&#8220;.<\/li>\n<li>Mi uzas jam konatajn teknikojn kaj teoriojn. \u0108ar mi ne estas lingvisto mi ne volas eklabori novan sciencajn teoriojn.<\/li>\n<li>Se tio estas ebla, mi uzas pretajn liberajn solvojn. Mi koncentri\u011dis pri specialaj esperantaj temoj, \u0109ar estas ne ver\u015dajne, ke aliaj tiun faris.<\/li>\n<li>La programo \u0109iam devus esti uzebla por iu takso kaj liveri rezultojn. Poste la celo estas plibonigi la rezultojn. Mi celas evoluan progreson. Mi ne volis, ke la programo estas uzebla nur post kelkaj jaroj.<\/li>\n<li>Mi publiki\u011das samtempe \u0109iujn rezultojn: vortarojn, fontan kodon, testajn frazojn.<\/li>\n<li>Mi unue faras taskojn, kiujn nur mi mem povas fari. Do mi programas, sed mi uzas pretajn vortarojn. Mi mem ne kompleti\u011das la vortarojn, \u0109ar tio povas fari poste aliaj. Mi plibonigas la vortarojn nur \u0109e evidentaj eraroj.<\/li>\n<li>Mi ser\u0109as la dialogon kun uzantoj la\u016d la maniero de libera programado.<\/li>\n<li>Mi ne kunligas kun la programo iujn komercajn planojn kaj mi evitas ligojn kun komercaj medioj.<\/li>\n<\/ul>\n<p>Esperantilo estas eksperimento, la programado povus \u0109iam fini\u011di, ekzemple \u0109ar mi ne vidus \u015dancojn por plua evoluo a\u016d mi ne plu \u011dojus la programadon. Tial mi volas sekurigi la rezultojn de tiu projekto. Mi publikigas \u0109iujn fontojn kaj vortarojn. Sekvaj projektoj povus tiujn fontojn uzi. Mi anka\u016d skribas tiun blogon por dokumenti la laboron. Anka\u016d, se la projekto estas hobia kaj malperfekta, \u011di povas esti fonto por kritiko kaj por komparo kun sekvaj projektoj.<\/p>\n<p>Homoj sugestis al mi, ke tiu projekto estas tro ambicia, por hobia projekto de unu homo. Jes, mi certe tute same pritraktis tiun projekton frue, se iu donis al mi la planon programi \u011din. Sed nun mi jam pruvis por mi mem, ke estas eble pli ol mi tion pensis frue. Certe tio ne estas pruvo, ke la projekto progresas en simila tempo poste. En tiu projekto oni do ne pritaksu planojn sed faktojn. Kaj faktoj ne povas esti ambiciaj, ili estas veraj a\u016d malveraj. Mi skribas tion, \u0109ar mi spertas, ke ofte e\u0109 uzantoj, kiuj iomete uzis la programon, ne raportas erarojn, \u0109ar ili pensas, ke la projekto ne havas \u015dancon de pluevoluo.<\/p>\n<p>Mi anka\u016d ne estas naiva programisto pri libera programado, \u0109ar mi havas longan sperton en tiu medio. Fakto estas, ke plej granda parto de projektoj vivas de unu persono, do mi devas fari \u0109ion sole. Programistoj, kiuj \u0135us skribis kelkajn liniojn kaj poste varbas por aliaj programistojn devas seniluziigi, se ili esperas je granda helpo. La motivoj de programistoj de libera programado estas diferencaj, pura helpemo estas tre malofta. Oni certe ne povas kalkuli je helpemo de profesiuloj, \u0109ar ili vivtenas sin per ilia profesieco. Anka\u016d oni ne kalkulu je preciza kritiko, tio anka\u016d estus ja ia helpo.<\/p>\n<p>En tiu tempo mi anka\u016d lernis multon kaj devis adapti miajn fruajn atendojn. Unue mi devis konstati, ke Esperanto estas natura lingvo kaj ne tre diferenca de aliaj naturaj lingvoj. Ekzistas kampoj en Esperanto, kiuj estas same komplikaj kiel en aliaj lingvoj. Do la facileco de Esperanto estas nur limigita en ceteraj kampoj.<br \/>\nDue mi rimarkis, ke la teorio de Esperanto ne estas fiksa. Ekzistas multaj diferencaj teorioj pri tiu lingvo kaj estas malfacile trovi klarajn respondojn pri detaloj. Anka\u016d la fontoj, kiuj estas atingeblaj en TTT, ne estas kompletaj.<br \/>\nMi devis do ofte prilabori bazajn fontojn kiel vortaroj. \u0108ar Esperanto estas tre nova lingvo kaj forte evoluas, ne ekzistas fiksa maniero de \u011dia uzo. Esperantistoj ofte imitas sian gepatran lingvon. Tial la sintaksa analizo estas granda defio. La tre efika vortfarado en Esperanto malfaciligas samgrade la ma\u015dinan tradukadon. Multaj statistikaj teknikoj de ma\u015dina tradukado ne aplikebla por Esperanto, \u0109ar en tiu lingvo mankas sufi\u0109e grandaj paralelaj tekstoj (Tekstoj en du a\u016d pluraj lingvoj). Sed tio estas ja normala prezo de naiva kaj hobia komenco.<\/p>\n<p>La reagoj de uzantoj ka\u016dzas ofte pli da labore ol helpo. Sed ili estas necesaj kaj mi \u0109iam respondas je leteroj de uzantoj kaj interesantoj. Mi \u011dojas \u0109iam pri la reagoj kaj mi povas diri, ke \u0109iu, kiu skribas al mi, partoprenas en la projekto. Tiu blogo estas anka\u016d por mi la ilo por malplialtigi la laboron kun reagoj de uzantoj. Mi povos ja nun ofte respondi: Bonvolu legi la blogon kun numero tiu kaj tiu. Mia espero estas anka\u016d, ke aliaj programistoj malka\u015das por si mem, ke komputila lingvistiko ne estas tial senespere komplika kampo, kiel oni tion edukas.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Ideo de ma\u015dina tradukado ekzistas ekde apero de komputiloj. Ma\u015dina tradukado kaj arta penso estis la revo de unuaj programistoj, eble \u0109ar tiuj temoj estus bone komprenataj por vasta publiko. Tradukado estas malfacila tasko, kiun povas plenumi nur kelkaj homoj post longa lernado. Tial komputilo, kiu tradukas, estus la pruvo por ta\u016dgeco de komputiloj. \u0108iu [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[1,4,3],"tags":[],"class_list":["post-34","post","type-post","status-publish","format-standard","hentry","category-allgemein","category-lingvistiko","category-masxina-tradukado"],"_links":{"self":[{"href":"http:\/\/blog.esperantilo.org\/index.php?rest_route=\/wp\/v2\/posts\/34","targetHints":{"allow":["GET"]}}],"collection":[{"href":"http:\/\/blog.esperantilo.org\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"http:\/\/blog.esperantilo.org\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"http:\/\/blog.esperantilo.org\/index.php?rest_route=\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"http:\/\/blog.esperantilo.org\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=34"}],"version-history":[{"count":0,"href":"http:\/\/blog.esperantilo.org\/index.php?rest_route=\/wp\/v2\/posts\/34\/revisions"}],"wp:attachment":[{"href":"http:\/\/blog.esperantilo.org\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=34"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"http:\/\/blog.esperantilo.org\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=34"},{"taxonomy":"post_tag","embeddable":true,"href":"http:\/\/blog.esperantilo.org\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=34"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}