{"id":103,"date":"2007-11-03T13:30:26","date_gmt":"2007-11-03T12:30:26","guid":{"rendered":"http:\/\/blog.esperantilo.org\/?p=103"},"modified":"2007-11-03T13:32:53","modified_gmt":"2007-11-03T12:32:53","slug":"masina-tradukado-angla-lingvo-al-esperanta-lingvo","status":"publish","type":"post","link":"http:\/\/blog.esperantilo.org\/?p=103","title":{"rendered":"Ma\u015dina tradukado: angla lingvo al esperanta lingvo"},"content":{"rendered":"<p>La plej bezonata ma\u015dina tradukado estas la tradukado inter iu nacia lingvo kaj angla lingvo. Beda\u016drinde la angla lingvo estas tre komplika lingvo por sintaksa analizo. Aliflanke tiu lingvo estas la plej bone esplorita lingvo en komputila lingvistiko. Anta\u016d kelkaj monatoj mi eksperimentis pri ma\u015dina tradukado de pola lingvo. Tiu tradukado nuntempe estas tute ta\u016dga. Mi pensis anka\u016d pri ma\u015dina tradukado de angla lingvo. Por tiu tasko la plej grava estas bona sintaksa analizo.<br \/>\nMi denove traser\u0109is la interreton kaj ekkovris kelkajn liberajn projektojn, kiuj okupas pri sintaksa analizo de angla lingvo. La plej okulfrapa estis la projekto <a href=\"http:\/\/www.link.cs.cmu.edu\/link\/\">&#8222;Link Grammar Parser&#8220;<\/a>. Tiu universitata projekto liveris ne nur teoriajn rezultojn sed pretan analizilon por angla lingvo. La analizilo enhavas anka\u016d la tutan vortaron kaj priskribo de angla sintakso. Anka\u016d kelkaj aliaj projektoj uzis tiun programon. Tio estas bona indiko por kvalito de projekto. Mi trovis kelkajn projektojn, kiuj rilatas kun &#8222;link parser&#8220;.<\/p>\n<ul>\n<li><a href=\"http:\/\/search.cpan.org\/~dbrian\/Lingua-LinkParser-1.09\/LinkParser.pm\">Interfaco por programa lingvo Perl<\/a><\/li>\n<li><a href=\"http:\/\/vee-r2.blogspot.com\/2005\/11\/rubylink-grammar-binding.html\">Interfaco por programa lingvo Ruby<\/a><\/li>\n<li><a href=\"http:\/\/www.abisource.com\/projects\/link-grammar\/\">Projekto &#8222;Abi Word&#8220;<\/a> uzas &#8222;link grammar&#8220; por gramatika kontrolado<\/li>\n<\/ul>\n<p>Tiu analizilo estas anka\u016d programita per programa lingvo C. Tiun lingvon oni povas tre facile kunligi kun Tcl. Oni ja prave diras, ke Tcl estas la gluteno por programoj skribitaj en C. Mi devis nur programi mallongan interfacon inter Tcl kaj C. <a href=\"http:\/\/www.esperantilo.org\/tcllinkparser1.00.tar.gz\">Tio<\/a> estis farita en unu tago. Nuntempe fakte la programa lingvo C estas la plej universala programa lingvo, kiu rulas sur \u0109iu komputilo sen \u011denaj premisoj. Tion oni ne povas diri pri la nuntempe populara programa lingvo &#8222;Javo&#8220;, kiu \u0109iam faras problemojn, uzas tro da memoro kaj estas katastrofe malrapida.<\/p>\n<p>Mi testis iomete la analizilon. Unue la analizilo rezultas ne sintaksajn arbojn sed la aron de ligiloj. Oni tamen povas facile konstrui de tiuj informacioj la sintaksan arbon. La analizilo povas anka\u016d trovi la gramatikan kategorion por \u0109iu vorto. Tiu estas tre grava \u0109e angla lingvo, \u0109ar tio estas en tiu lingvo tre ambigua afero. Kelkaj ekzemploj:<br \/>\n<code><\/p>\n<pre>\r\nI read a book\r\n       +---Os---+\r\n +-Sp*i+   +-Ds-+\r\n |     |   |    |\r\nI.p read.v a book.n\r\n\r\nI have written the computer program\r\n\r\n               +-----------Os-----------+\r\n               |      +--------Ds-------+\r\n +-Sp*i+---PP--+      |       +----AN---+\r\n |     |       |      |       |         |\r\nI.p have.v written.v the computer.n program.n\r\n<\/pre>\n<p><\/code><br \/>\nDe tiuj informoj oni relative facile povas traduki al esperanta lingvo. Oni devas simple analizi la ligilojn de vortoj. Tiel oni poves ekkoni, \u0109u iu vorto estas objekto (en esperanto akuzativo). Tiuj subjektoj havas maldekstran ligilon kun simbolo &#8222;OS&#8220;. La unua malfacila\u0135o estas, ke tiu analizilo ne trovas la bazajn formojn (vortaroj formoj) de vortoj. Do la programo devas mem diveni, ke la baza formo de &#8222;written&#8220; estas &#8222;write&#8220;. Kelkfoje oni devas reordigi la vortojn (ekzemple \u0109e negado a\u016d angla genetivo <cite>father&#8217;s<\/cite>)<br \/>\nMi programis unu semajnon la ma\u015dinan tradukadon kaj la rezultoj ne estas malbonaj.<\/p>\n<p>Do nun Esperantilo en eldono 0.97 tradukas tiujn du ekzemplajn frazojn.<br \/>\n<cite><br \/>\nI read a book. &#8211; Mi legas libron.<br \/>\nI have written the computer program. &#8211; Mi skribis la komputilan programon.<br \/>\n<\/cite><br \/>\nPor simplaj frazoj tio funkcias preska\u016d perfekte. La limoj trovi\u011das nun en la ebloj de analizilo &#8222;link parser&#8220;. Tiu analizilo estas por longaj frazoj malrapida. Feli\u0109e ekzistas la eblo interrompi la analizon de frazo, se la bezonata tempo estas tro granda. Nun mi tiel agordis la analizion, ke \u011di ne povas uzi por anlizo de unu frazo pli ol 30 sekundoj. Por uzanto la traduko de angla lingvo estas okulfrape pli malrapida ol la traduko en alia direkto. Mi pensas, ke pro tio la analizilo ne estas ta\u016dgo por uzo en interreta traduka servo. Tio estas tro kosta afero. La analizilo havas anka\u016d problemojn kun parentezoj, cita\u0135ojn kaj fremdlingvaj vortojn. Do \u011di komplete rifuzas la analizon, se en la teksto trovi\u011das fremdlingvaj singoj a\u016d \u011denerale UTF-8 signoj. Do mi devis programi la alternativan tradukadon por frazoj, kiuj ne povas esti analizitaj de &#8222;link parser&#8220;. Tiu alternativa tradukado estas simpla vorta tradukado. <\/p>\n<p>Ekzistas anka\u016d multaj aferoj, kiujn oni povas plibonigi. La plej grava afero estas la tradukado de ambiguaj anglaj vortetoj kiel &#8222;there, this, that, by, to, too, &#8230;&#8220;. Ofte oni devas nur analizi la legilojn por trovi la necesan tradukon.<br \/>\nJen ekzemplo:<\/p>\n<pre>\r\n+--Ds-+--Ss-+--Pv--+--MVp-+-J+\r\n |     |     |      |      |  |\r\nthe book.n is.v written.v by me\r\n\r\n         +---Js---+\r\n +-Ss+-Pp+  +--Ds-+\r\n |   |   |  |     |\r\nhe is.v by the table.n\r\n<\/pre>\n<p>La laboro ne estas facila. Ekzistas multega nombro de eblaj nomoj por legiloj. <a href=\"http:\/\/www.link.cs.cmu.edu\/link\/dict\/index.html\">La dokumentaro<\/a> de &#8222;link parser&#8220; ne estas aktuala kaj kompleta. Do oni precipe devas simple testi multajn frazojn. La programo ne estas \u015dajne plu evoluigita. La lasta eldono devenas de jaro 2005.<\/p>\n<p>Jam kun tiu eldono mi rimarkis, ke la kvalito de tradukoj estas pli bona ol la kvalito de aliaj<br \/>\natingeblaj <a href=\"http:\/\/www.traduku.net\">tradukiloj<\/a> inter angla kaj esperanta lingvo. Esperantilo nun povas bone traduki negadon, kompleksajn tempojn kaj rekonas akuzativon.<\/p>\n<p>Por plibonigi la kvaliton la plej grava estus la plivastigo de vortaro. Do multa laboro estas ankora\u016d farinda. Kiel kutime mi iom post iom esperas plibonigi la tradukadon. Beda\u016drinde mia kono de angla lingvo ne estas tre bona. Mi delonge lernas tiun lingvon, sed \u011dis nun havas problemojn. Ofte mi komprenas \u0109iun unuopan vorton en la frazo, sed la tuta frazo estas por mi sensenca. Mi supozas, ke por samaj kialoj la konstruo de sintaksa analizilo por angla lingvo estas tiel malfacila.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>La plej bezonata ma\u015dina tradukado estas la tradukado inter iu nacia lingvo kaj angla lingvo. Beda\u016drinde la angla lingvo estas tre komplika lingvo por sintaksa analizo. Aliflanke tiu lingvo estas la plej bone esplorita lingvo en komputila lingvistiko. Anta\u016d kelkaj monatoj mi eksperimentis pri ma\u015dina tradukado de pola lingvo. Tiu tradukado nuntempe estas tute ta\u016dga. [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[8,3],"tags":[],"class_list":["post-103","post","type-post","status-publish","format-standard","hentry","category-angla-lingvo","category-masxina-tradukado"],"_links":{"self":[{"href":"http:\/\/blog.esperantilo.org\/index.php?rest_route=\/wp\/v2\/posts\/103","targetHints":{"allow":["GET"]}}],"collection":[{"href":"http:\/\/blog.esperantilo.org\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"http:\/\/blog.esperantilo.org\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"http:\/\/blog.esperantilo.org\/index.php?rest_route=\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"http:\/\/blog.esperantilo.org\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=103"}],"version-history":[{"count":0,"href":"http:\/\/blog.esperantilo.org\/index.php?rest_route=\/wp\/v2\/posts\/103\/revisions"}],"wp:attachment":[{"href":"http:\/\/blog.esperantilo.org\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=103"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"http:\/\/blog.esperantilo.org\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=103"},{"taxonomy":"post_tag","embeddable":true,"href":"http:\/\/blog.esperantilo.org\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=103"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}