{"id":11,"date":"2006-11-06T20:12:39","date_gmt":"2006-11-06T19:12:39","guid":{"rendered":"http:\/\/blog.esperantilo.org\/?p=11"},"modified":"2007-09-08T13:03:03","modified_gmt":"2007-09-08T12:03:03","slug":"vortaro-kaj-glosaro-en-masina-tradukado","status":"publish","type":"post","link":"http:\/\/blog.esperantilo.org\/?p=11","title":{"rendered":"Vortaro kaj glosaro en ma\u015dina tradukado"},"content":{"rendered":"<p>Bona glosaro estas tre grava por bonkvalita ma\u015dina tradukado. La aspekto de vortlistoj, kiuj estas uzataj en ma\u015dina tradukado, havas aliajn necesojn ol vortaroj uzataj de homoj. Kutimaj vortaroj estas preparitaj por homoj, kiuj konas minimume bone unu lingvon. Tial unu lingvo en vortaro estas ofte nur skeme priskribita. Homoj uzas ofte la\u016d bezono pliajn vortarojn por plenumigi ilian laboron, kaj povas anka\u016d uzi aliajn fontojn de lingva scio, ekzemple gramatikaj libroj. Homoj konas sufi\u0109e bone la lingvon por mem trovi la bazan formon de vorto kaj derivi bezonatan formon de vorto. Esceptoj estas priskribitaj kiel normala teksto a\u016d kiel ekzemplo de uzado.<\/p>\n<p>Kutimaj vortaroj de esperanto, kiujn oni povas trovi en reto, havas aspekton.<\/p>\n<pre>-ilo; ~zeug, Werkzeug\r\nadjukti; (\u00f6ffentlich) aufschreiben\r\nadministra; Verwaltungs~\r\n~ad~ ;Nachsilbe f\u00fcr andauernde Handlung, z.B. \"kuradi\" = \"Dauerlaufen\"\r\nrapida; schnell\r\nfermi; schliessen\r\narbo; Baum<\/pre>\n<p>Oni povas bone rimarki, ke la listo enhavas ne nur normalajn vortajn parojn, sed anka\u016d priskriboj pri esperanta a\u016d germana vortfarado a\u016d e\u0109 gramatiko. La vortaro kondi\u0109as, ke la uzanto bone regas la germanan lingvon kaj konas anka\u016d la esperantan lingvon. Oni vane ser\u0109as vortojn kiel: <em>rapide, komputila, malfermi<\/em>. La preparinto de vortaro supozas, ke la uzanto mem scias, kiel konstrui adverbon de adjektivo kaj anka\u016d bone konas la malan vorton al &#8218;fermi&#8216; (malfermi = \u00f6ffnen). Germano anka\u016d scias, ke la genro de vorto &#8218;<em>Baum<\/em>&#8218; estas vira (&#8218;<em>der Baum<\/em>&#8218;) kaj ke pluralo estas &#8218;<em>B\u00e4ume<\/em>&#8218;, li anka\u016d povas konstrui la akuzativon de \u011di &#8218;<em>den Baum<\/em>&#8218;.<\/p>\n<p>Sed por komputilo la nura scio pri lingvo devenas de algoritmoj de programo kaj de glosaro. Enmeti tiun scion en algoritmojn ne estas bona ideo, do tiu scio pri lingvo devas esti plejparte en glosaro.<\/p>\n<p>Tial la glosaro por ma\u015dina tradukado enhavas aliajn pluajn informojn kaj \u011dia kovro devas esti pli granda.<\/p>\n<p>Ekzemploj por pola a\u016d germana lingvo<\/p>\n<ul>\n<li>Por substantivoj oni bezonas genron.<\/li>\n<li>Oni bezonas fleksian grupon a\u016d listo de esceptoj por fleksio.<\/li>\n<li>Pliaj gramatikaj priskriboj ekzemple: tipo de substantivo (abstrakta, gruponomo, nekalkulebla), \u0109u verbo estas transitiva, aspekto de verbo.<\/li>\n<\/ul>\n<p>Projekto de tiuj pliaj priskriboj estas tre malfacila laboro. Estas anka\u016d tre malfacile a\u016dtomate pliri\u0109igi la kutimajn vortlistojn je tiuj necesaj priskriboj. Ofte oni povas uzi statistikajn analizojn sur granda teksta korpuso por diveni la necesajn informojn. Aliokaze oni povas feli\u0109e trovi tiujn informojn de aliaj fontoj. Fine restas nur unu vojo, entajpi tiujn informojn mane.<\/p>\n<p>Esperantilo enhavas redaktilon de vortaro, kiu facile ebligas redaktadon de glosaro. La redaktilo anka\u016d helpas korekte ekkoni kaj enmeti necesajn priskribojn.<\/p>\n<p>Unu enskribo en glosaro enhavas sekvantajn kampojn:<\/p>\n<ul>\n<li><strong>traduko<\/strong> &#8211; unu esperanta vorta en baza formo<\/li>\n<li><strong>senco<\/strong> &#8211; la kampo estas \u011dis nun ne uzata, sed povas enhavi priskriboj por multsencaj vortoj<\/li>\n<li><strong>fgrupo<\/strong> &#8211; fleksia grupo, tiu priskribo estas necesa pro fleksilo<\/li>\n<li><strong>gramatiko<\/strong> &#8211; tie oni enmetas pliaj informoj necesaj por tradukado<\/li>\n<\/ul>\n<p>Precizaj informoj pri priskriboj oni trovu sur pagoj de esperantilo, ekzemple <a href=\"http:\/\/www.esperantilo.org\/detradukado.html\">germana lingvo<\/a>. En glosaro mi anka\u016d enmetis regulojn, kiuj estas necesaj por transformigo de prepozicioj kaj kazoj.<\/p>\n<p>Asemblo de tiu glosaro estas peniga laboro, \u0109ar por bona kvalito, \u0109iu de 50000 enskriboj devas esti kontrolitaj. Nun la programo funkcias anka\u016d, kiam la priskribojn mankas, en tiu kazo, la algoritmoj uzas la plej ver\u015dajnan kombinon kaj tio ofte rezultigas per malalta kvalito de tradukita teksto.<\/p>\n<p>Mi nun koncentri\u011das pri programado de algoritmoj, \u0109ar nun nur mi tiun povas fari. La glosaron povas kompletigi la uzanto mem. La programo permesas eksportadon kaj importadon de glosaro, tiel la ma\u015dina tradukado povas progresi e\u0109 sen mia partopreno.<\/p>\n<p>Alia bona afero estas, ke la rezulta glosaro de tiu projekto povas esti libere uzata en aliaj projektoj la\u016d la <a href=\"http:\/\/www.gpl.org\">GPL Permisilo<\/a>. Tiumaniere la sekvontaj projektoj povos komenci de fora punkto.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Bona glosaro estas tre grava por bonkvalita ma\u015dina tradukado. La aspekto de vortlistoj, kiuj estas uzataj en ma\u015dina tradukado, havas aliajn necesojn ol vortaroj uzataj de homoj. Kutimaj vortaroj estas preparitaj por homoj, kiuj konas minimume bone unu lingvon. Tial unu lingvo en vortaro estas ofte nur skeme priskribita. Homoj uzas ofte la\u016d bezono pliajn [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[4,3],"tags":[],"class_list":["post-11","post","type-post","status-publish","format-standard","hentry","category-lingvistiko","category-masxina-tradukado"],"_links":{"self":[{"href":"http:\/\/blog.esperantilo.org\/index.php?rest_route=\/wp\/v2\/posts\/11","targetHints":{"allow":["GET"]}}],"collection":[{"href":"http:\/\/blog.esperantilo.org\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"http:\/\/blog.esperantilo.org\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"http:\/\/blog.esperantilo.org\/index.php?rest_route=\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"http:\/\/blog.esperantilo.org\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=11"}],"version-history":[{"count":0,"href":"http:\/\/blog.esperantilo.org\/index.php?rest_route=\/wp\/v2\/posts\/11\/revisions"}],"wp:attachment":[{"href":"http:\/\/blog.esperantilo.org\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=11"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"http:\/\/blog.esperantilo.org\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=11"},{"taxonomy":"post_tag","embeddable":true,"href":"http:\/\/blog.esperantilo.org\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=11"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}