{"id":86,"date":"2007-07-30T18:43:43","date_gmt":"2007-07-30T17:43:43","guid":{"rendered":"http:\/\/blog.esperantilo.org\/?p=86"},"modified":"2007-07-30T15:45:16","modified_gmt":"2007-07-30T14:45:16","slug":"pola-projekto-denise-myth-pri-artefarita-inteligento","status":"publish","type":"post","link":"http:\/\/blog.esperantilo.org\/?p=86","title":{"rendered":"Pola projekto Denise-Myth pri artefarita inteligento"},"content":{"rendered":"<p>Mi regule traser\u0109as la interreton je projektoj en la kampo de komputila ligvistiko. Nun mi trovis la projekton <a href=\"http:\/\/www.denise.cog-lab.com\/\">Denise-Myth<\/a>. La projekto estis kreita kiel fina labora\u0135o de pola universitato de Szymon Jessa. La celo de projekto estis krei la programon, kiu povus per natura lingvo komuniki kun uzanto kaj<br \/>\nkrei bazon de kono (bazo de faktoj). La programo kolektas per dialogo kun uzanto informojn. \u011ci povas mem demandi. Fine la programo povas respondi je demandoj. Kvankam \u011denerale la problemo estas tre malfacila, la programo en komenca stato plenigas bone siajn taskojn. \u011ci povas analizi kaj kompreni simplajn polajn frazojn. Se oni povas bone demandi, la programo povas anka\u016d bone respondi. La programo regas anka\u016d la bazan logikon kaj povas rezoni. La a\u016dtoro de projekto devis solvi multajn problemojn. \u0108iu de tiuj problemoj estas por si mem tre ambicia kaj \u011dis nun ne<br \/>\nsufi\u0109e solvita.<br \/>\nTiuj problemoj estas:<\/p>\n<ul>\n<li>Kompreno de natura lingvo<\/li>\n<li>Konservado de faktoj en programaj strukturoj<\/li>\n<li>Traser\u0109ado de bazo de faktoj<\/li>\n<li>Rezonado kaj provado de faktoj<\/li>\n<li>Genero de respondoj en natura lingvo<\/li>\n<\/ul>\n<p>Interesa estas anka\u016d la teknika aspekto de projekto. La problemoj estus kutime la domeno de altnivelaj lingvoj kiel <cite>prolog<\/cite> kaj <cite>lisp<\/cite>. Pro rezonado kaj konservado de faktoj la programa lingvo &#8222;prolog&#8220; havas specialajn funkciojn, kiuj estas normala parto de tiu programa lingvo. Tamen la a\u016dtoro decidis programi en simpla programa lingvo &#8222;C&#8220;. Li volis, ke la programo rulos sur \u0109iu ebla sistemo. Nun tre ofte sistemoj de altnivelaj lingvoj kiel: calm, prolog, schema, haskel, tcl, python kuras sur multaj operaciumaj sistemoj. Tio estas ebla, \u0109ar ili ofte esta programite en C, do tiu argumento ne estas pro mi tre konvinka. Mi supozas, ke a\u016dtoro simple tre \u015datis tiun programan lingvon. En bona maniero de programistoj la a\u016dtoro enmetas kompleksan logikon kaj multajn regulojn en specialjn dosierojn la\u016d propra teksta formato. Por mi la plej interesa parto en tiu projekto estis la analizo de pola lingvo. Tiu tasko estas multe pli komplika ol analizo de esperanta lingvo, kiun mi programis en la programo Esperantilo. Beda\u016drinde la plena priskribo de analizo ne ekzistas kiel iu dokumento, do la nura eblo estas legi la programan kodon. La programo enhavas tabelojn kun finiloj de pola lingvo kaj povas de tiuj informoj mem derivi la kazon, arton kaj bazan formoj de vorto.<br \/>\nTiu estas alia maniero de prilaboro ol la projekto de <a href=\"http:\/\/morfologik.blogspot.com\/\">morfologik<\/a>, kiu enhavas la grandegan bazon de \u0109iuj eblaj polaj vortoj kun gramatika priskribo kaj baza formo. La kompleta sintaksa analizo ne estas farata, \u0109ar la programo akceptas nur kutimajn frazojn en kutima ordo de pola lingvo. La faktoj estas konstruitaj helpe de tiel nomataj \u015dlosilaj vortoj kiel: &#8222;esti&#8220;, &#8222;signifi&#8220;, &#8222;estas parto de&#8220;. La programo me povas rekoni \u0109u la uzanto aldonas novan fakton a\u016d \u0109u ili demandas pri io. La programa teksto ne estas e\u0109 tro longa kaj tamen funkcias por siaj celoj.<br \/>\nInteresa fakto en tiu projekto estas, ke en bazo de faktoj la \u0109efan rolon havas subjekto. A\u016dtoro diras pri tn.<br \/>\nlineaj frazoj. Do la programo transformas la sintaksaj arboj de frazo al lineaj strukturoj. La\u016d tiu modelo la frazo: &#8222;Roberto iras rapide sur la vojo&#8220; havas 2 lineaj frazojn: &#8222;Roberto iras rapide&#8220; kaj &#8222;Roberto iras sur la vojo&#8220;.<br \/>\nLa kutima semantika prezento de tiu frazo estas: <cite>iri(Roberto,sur(vojo),rapide)<\/cite>. Do predikato havas la unuan pozicion. En la sistemo Denise tio estus <cite>Roberto -&gt; iri -&gt; rapide<\/cite>.<br \/>\nKial la a\u016dtoro elektis alian metodon? \u0108u ekzistis la kultura kialo por tio? Mi pensas, ke por slavoj la substantivo estas pli grava elemento de frazo. En rusa lingvo kutime mallongaj frazoj tute ne havas verbon (ekzistas do nur latenta predikato).<br \/>\nLa labora\u0135o donas anka\u016d multajn ekzemplojn kiel ekstrakti logikaj faktoj de frazoj. La programo povas rezoni la\u016d logikaj reguloj kaj regas la vortetojn: &#8222;iu, \u0109iu, neniu&#8220;. Mi iom ludis kun la programo, kaj povas e\u0109 kelkfoje ricevi veraj informoj. Tio estas tre \u011doiga sperto.<\/p>\n<h2>Projekto Cyc<\/h2>\n<p>Dum la legado de labora\u0135o mi anka\u016d eksciis pri pli fama projekto <a href=\"http:\/\/www.opencyc.org\/\">Cyc<\/a>. La celo de tiu projekto estas la kolekto de \u0109iuj faktoj de baza nivelo.<br \/>\nEkzemple:<\/p>\n<ul>\n<li>Homo, kiu studas, estas studanto.<\/li>\n<li>Oni studas en universitato.<\/li>\n<li>Studanto estas homo.<\/li>\n<\/ul>\n<p>Tiu bazo povus servi por krei programon, kiu mem elektos informojn de tekstoj en natura lingvo. Poste la sistemo povos mem derivi novajn faktojn de konataj faktoj. \u011ci povos respondi je \u0109iuj demandoj. La sistemo estas nun evoluita dum multaj jaroj kaj jam povas funkcii kaj plenumi planitajn taskojn. Do e\u0109 kompleksa rezonado funkcias.<br \/>\nLa bazo de faktoj estas libere atingebla. Tiuj faktoj (precipe ontologio) estas tre similaj al projekto <a href=\"http:\/\/wordnet.princeton.edu\/\">WordNet<\/a>.<br \/>\nAnka\u016d en ma\u015dina tradukado la a\u016dtomata kompreno de teksto estas tre grava por bona kvalito de traduko. Mi pensas, ke kun metodoj de similaj programoj kaj bazoj de sistemoj <cite>Cyc<\/cite> a\u016d <cite>WordNet<\/cite> la kvalito de tradukado povos atingi la akcepteblan kvaliton. Tie la vorto &#8222;akceptebla&#8220; signifas, ke la ma\u015dina tradukado estas same bona kiel la homa tradukado.<\/p>\n<p>Kvankam oni nun pensas, ke komputiloj neniam povus kompreni tekstojn en natura lingvo, tio tamen iom post iom okazas.<br \/>\n&#8222;Komprenado&#8220; en tiu kazo ne estas egala al homa komprenado. Tamen ma\u015dinoj povas kolekti faktojn de tekstoj kaj rezonadi sur bazo de tiuj faktoj. La labora\u0135o de Szymon Jess enhavas kelkajn interesajn pensojn pri tiu temo. Se mi observas la ser\u0109ma\u015dinon &#8222;Google&#8220;, mi pensas, ke nun \u011di estas la plej granda leganto de interreto. Tiu sistemo laboras nun la\u016d tre primitivaj metodoj, tamen tiuj metodoj pliboni\u011das konstante. La celo de google ne estas kompreno, sed komerca varbado, tamen iam tiu funkciado similos al komprenado.<\/p>\n<p>Nun tekniko kaj interreto helpos al Esperanto \u0109e \u011di evoluo kaj disvastigado. Sed la evoluo de tekniko povus signifi anka\u016d la  morton de Esperanto. Tio okazos, kiam la komputiloj povus kompreni tekstojn, kaj estos mem la plej grandaj legantoj de tekstoj. Tiuj programoj plej ver\u015dajne komprenus unue nur kelkajn lingvojn. Tiuj lingvoj certe estos: &#8222;angla, franca, japana, \u0109ina, germana, &#8230;&#8220;.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Mi regule traser\u0109as la interreton je projektoj en la kampo de komputila ligvistiko. Nun mi trovis la projekton Denise-Myth. La projekto estis kreita kiel fina labora\u0135o de pola universitato de Szymon Jessa. La celo de projekto estis krei la programon, kiu povus per natura lingvo komuniki kun uzanto kaj krei bazon de kono (bazo de [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[4,2],"tags":[],"class_list":["post-86","post","type-post","status-publish","format-standard","hentry","category-lingvistiko","category-programado"],"_links":{"self":[{"href":"http:\/\/blog.esperantilo.org\/index.php?rest_route=\/wp\/v2\/posts\/86","targetHints":{"allow":["GET"]}}],"collection":[{"href":"http:\/\/blog.esperantilo.org\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"http:\/\/blog.esperantilo.org\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"http:\/\/blog.esperantilo.org\/index.php?rest_route=\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"http:\/\/blog.esperantilo.org\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=86"}],"version-history":[{"count":0,"href":"http:\/\/blog.esperantilo.org\/index.php?rest_route=\/wp\/v2\/posts\/86\/revisions"}],"wp:attachment":[{"href":"http:\/\/blog.esperantilo.org\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=86"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"http:\/\/blog.esperantilo.org\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=86"},{"taxonomy":"post_tag","embeddable":true,"href":"http:\/\/blog.esperantilo.org\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=86"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}