{"id":44,"date":"2007-01-27T11:31:11","date_gmt":"2007-01-27T10:31:11","guid":{"rendered":"http:\/\/blog.esperantilo.org\/?p=44"},"modified":"2007-01-27T11:31:11","modified_gmt":"2007-01-27T10:31:11","slug":"tre-similaj-vortoj","status":"publish","type":"post","link":"http:\/\/blog.esperantilo.org\/?p=44","title":{"rendered":"Tre similaj vortoj"},"content":{"rendered":"<p>En lasta tempo kelkaj Esperantistoj ekinteresi\u011dis pri a\u016dtomata korektado en Programo Esperantilo. La vigla korespondado fini\u011dis per nova mesa\u011d-grupo <a href=\"http:\/\/groups.google.de\/group\/komputila_lingvistiko\">Komputila lingvistiko<\/a>. La unua frukto de tiu kunlaboro estas korektita bazo de erarekzemploj  <a href=\"http:\/\/www.esperantilo.org\/erarekzemploj.xml\">Ekzemploj de eraroj<\/a>, kiun mi uzas por testado kaj kiel teoria fonto de programado de korektilo.<\/p>\n<p>\u0108ar mi denove pensis pri a\u016dtomata korektado, mi decidis analizi la vortprovizon de esperanto je tre similaj vortoj. La analizo trovis vortoj, kiuj estas:<\/p>\n<ul>\n<li>same longaj<\/li>\n<li>sama unua kaj lasta litero<\/li>\n<li>diferencas nur je unu litero<\/li>\n<li>sen participoj<\/li>\n<\/ul>\n<p>Mi analizis \u0109iujn vortojn \u011dis frekventaca grupo 15 de mia frekventeca bazo de vortoj. \u0108ar la vortoj devenas de analizo de tekstaro, estas eble, ke kelkajn vortojn nun estas oftaj skriberaroj. Mi dividis la listojn je 3 kategorioj:<\/p>\n<ul>\n<li><a id=\"p41\" href=\"http:\/\/blog.esperantilo.org\/wp-content\/uploads\/2007\/01\/similaj.txt\">similaj<\/a>: \u0109iuj vortoj &#8211; nombro 10446<\/li>\n<li><a id=\"p42\" href=\"http:\/\/blog.esperantilo.org\/wp-content\/uploads\/2007\/01\/similajsono.txt\">similaj sone<\/a>: vortoj, kiuj simile sonas, do ili diferencas je litergrupoj (dt rl pb s\u015d c\u0109 h\u0125) &#8211; nombro 679. Tiuj vortoj kutime estas problemaj por azianoj.<\/li>\n<li><a id=\"p43\" href=\"http:\/\/blog.esperantilo.org\/wp-content\/uploads\/2007\/01\/similajvido.txt\">similaj vide<\/a>: vortoj, kiuj simile aspektas , do ili diferencas je litergrupoj (nm rn ao bh) &#8211; nombro 420<\/li>\n<\/ul>\n<p>Mi nun ne scias, kiel oni povas uzi tiujn listojn en praktiko. Mi supozas, ke tiuj vortoj estas ofte intermiksitaj.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>En lasta tempo kelkaj Esperantistoj ekinteresi\u011dis pri a\u016dtomata korektado en Programo Esperantilo. La vigla korespondado fini\u011dis per nova mesa\u011d-grupo Komputila lingvistiko. La unua frukto de tiu kunlaboro estas korektita bazo de erarekzemploj Ekzemploj de eraroj, kiun mi uzas por testado kaj kiel teoria fonto de programado de korektilo. \u0108ar mi denove pensis pri a\u016dtomata korektado, [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[4,2],"tags":[],"class_list":["post-44","post","type-post","status-publish","format-standard","hentry","category-lingvistiko","category-programado"],"_links":{"self":[{"href":"http:\/\/blog.esperantilo.org\/index.php?rest_route=\/wp\/v2\/posts\/44","targetHints":{"allow":["GET"]}}],"collection":[{"href":"http:\/\/blog.esperantilo.org\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"http:\/\/blog.esperantilo.org\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"http:\/\/blog.esperantilo.org\/index.php?rest_route=\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"http:\/\/blog.esperantilo.org\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=44"}],"version-history":[{"count":0,"href":"http:\/\/blog.esperantilo.org\/index.php?rest_route=\/wp\/v2\/posts\/44\/revisions"}],"wp:attachment":[{"href":"http:\/\/blog.esperantilo.org\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=44"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"http:\/\/blog.esperantilo.org\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=44"},{"taxonomy":"post_tag","embeddable":true,"href":"http:\/\/blog.esperantilo.org\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=44"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}