Esperantilo Blogo en Esperanto pri projekto Esperantilo kaj komputila lingvistiko

30.7.2007

Pola projekto Denise-Myth pri artefarita inteligento

Filed under: lingvistiko,programado — artur @ 18:43

Mi regule traserĉas la interreton je projektoj en la kampo de komputila ligvistiko. Nun mi trovis la projekton Denise-Myth. La projekto estis kreita kiel fina laboraĵo de pola universitato de Szymon Jessa. La celo de projekto estis krei la programon, kiu povus per natura lingvo komuniki kun uzanto kaj
krei bazon de kono (bazo de faktoj). La programo kolektas per dialogo kun uzanto informojn. Ĝi povas mem demandi. Fine la programo povas respondi je demandoj. Kvankam ĝenerale la problemo estas tre malfacila, la programo en komenca stato plenigas bone siajn taskojn. Ĝi povas analizi kaj kompreni simplajn polajn frazojn. Se oni povas bone demandi, la programo povas ankaŭ bone respondi. La programo regas ankaŭ la bazan logikon kaj povas rezoni. La aŭtoro de projekto devis solvi multajn problemojn. Ĉiu de tiuj problemoj estas por si mem tre ambicia kaj ĝis nun ne
sufiĉe solvita.
Tiuj problemoj estas:

  • Kompreno de natura lingvo
  • Konservado de faktoj en programaj strukturoj
  • Traserĉado de bazo de faktoj
  • Rezonado kaj provado de faktoj
  • Genero de respondoj en natura lingvo

Interesa estas ankaŭ la teknika aspekto de projekto. La problemoj estus kutime la domeno de altnivelaj lingvoj kiel prolog kaj lisp. Pro rezonado kaj konservado de faktoj la programa lingvo „prolog“ havas specialajn funkciojn, kiuj estas normala parto de tiu programa lingvo. Tamen la aŭtoro decidis programi en simpla programa lingvo „C“. Li volis, ke la programo rulos sur ĉiu ebla sistemo. Nun tre ofte sistemoj de altnivelaj lingvoj kiel: calm, prolog, schema, haskel, tcl, python kuras sur multaj operaciumaj sistemoj. Tio estas ebla, ĉar ili ofte esta programite en C, do tiu argumento ne estas pro mi tre konvinka. Mi supozas, ke aŭtoro simple tre ŝatis tiun programan lingvon. En bona maniero de programistoj la aŭtoro enmetas kompleksan logikon kaj multajn regulojn en specialjn dosierojn laŭ propra teksta formato. Por mi la plej interesa parto en tiu projekto estis la analizo de pola lingvo. Tiu tasko estas multe pli komplika ol analizo de esperanta lingvo, kiun mi programis en la programo Esperantilo. Bedaŭrinde la plena priskribo de analizo ne ekzistas kiel iu dokumento, do la nura eblo estas legi la programan kodon. La programo enhavas tabelojn kun finiloj de pola lingvo kaj povas de tiuj informoj mem derivi la kazon, arton kaj bazan formoj de vorto.
Tiu estas alia maniero de prilaboro ol la projekto de morfologik, kiu enhavas la grandegan bazon de ĉiuj eblaj polaj vortoj kun gramatika priskribo kaj baza formo. La kompleta sintaksa analizo ne estas farata, ĉar la programo akceptas nur kutimajn frazojn en kutima ordo de pola lingvo. La faktoj estas konstruitaj helpe de tiel nomataj ŝlosilaj vortoj kiel: „esti“, „signifi“, „estas parto de“. La programo me povas rekoni ĉu la uzanto aldonas novan fakton aŭ ĉu ili demandas pri io. La programa teksto ne estas eĉ tro longa kaj tamen funkcias por siaj celoj.
Interesa fakto en tiu projekto estas, ke en bazo de faktoj la ĉefan rolon havas subjekto. Aŭtoro diras pri tn.
lineaj frazoj. Do la programo transformas la sintaksaj arboj de frazo al lineaj strukturoj. Laŭ tiu modelo la frazo: „Roberto iras rapide sur la vojo“ havas 2 lineaj frazojn: „Roberto iras rapide“ kaj „Roberto iras sur la vojo“.
La kutima semantika prezento de tiu frazo estas: iri(Roberto,sur(vojo),rapide). Do predikato havas la unuan pozicion. En la sistemo Denise tio estus Roberto -> iri -> rapide.
Kial la aŭtoro elektis alian metodon? Ĉu ekzistis la kultura kialo por tio? Mi pensas, ke por slavoj la substantivo estas pli grava elemento de frazo. En rusa lingvo kutime mallongaj frazoj tute ne havas verbon (ekzistas do nur latenta predikato).
La laboraĵo donas ankaŭ multajn ekzemplojn kiel ekstrakti logikaj faktoj de frazoj. La programo povas rezoni laŭ logikaj reguloj kaj regas la vortetojn: „iu, ĉiu, neniu“. Mi iom ludis kun la programo, kaj povas eĉ kelkfoje ricevi veraj informoj. Tio estas tre ĝoiga sperto.

Projekto Cyc

Dum la legado de laboraĵo mi ankaŭ eksciis pri pli fama projekto Cyc. La celo de tiu projekto estas la kolekto de ĉiuj faktoj de baza nivelo.
Ekzemple:

  • Homo, kiu studas, estas studanto.
  • Oni studas en universitato.
  • Studanto estas homo.

Tiu bazo povus servi por krei programon, kiu mem elektos informojn de tekstoj en natura lingvo. Poste la sistemo povos mem derivi novajn faktojn de konataj faktoj. Ĝi povos respondi je ĉiuj demandoj. La sistemo estas nun evoluita dum multaj jaroj kaj jam povas funkcii kaj plenumi planitajn taskojn. Do eĉ kompleksa rezonado funkcias.
La bazo de faktoj estas libere atingebla. Tiuj faktoj (precipe ontologio) estas tre similaj al projekto WordNet.
Ankaŭ en maŝina tradukado la aŭtomata kompreno de teksto estas tre grava por bona kvalito de traduko. Mi pensas, ke kun metodoj de similaj programoj kaj bazoj de sistemoj CycWordNet la kvalito de tradukado povos atingi la akcepteblan kvaliton. Tie la vorto „akceptebla“ signifas, ke la maŝina tradukado estas same bona kiel la homa tradukado.

Kvankam oni nun pensas, ke komputiloj neniam povus kompreni tekstojn en natura lingvo, tio tamen iom post iom okazas.
„Komprenado“ en tiu kazo ne estas egala al homa komprenado. Tamen maŝinoj povas kolekti faktojn de tekstoj kaj rezonadi sur bazo de tiuj faktoj. La laboraĵo de Szymon Jess enhavas kelkajn interesajn pensojn pri tiu temo. Se mi observas la serĉmaŝinon „Google“, mi pensas, ke nun ĝi estas la plej granda leganto de interreto. Tiu sistemo laboras nun laŭ tre primitivaj metodoj, tamen tiuj metodoj pliboniĝas konstante. La celo de google ne estas kompreno, sed komerca varbado, tamen iam tiu funkciado similos al komprenado.

Nun tekniko kaj interreto helpos al Esperanto ĉe ĝi evoluo kaj disvastigado. Sed la evoluo de tekniko povus signifi ankaŭ la morton de Esperanto. Tio okazos, kiam la komputiloj povus kompreni tekstojn, kaj estos mem la plej grandaj legantoj de tekstoj. Tiuj programoj plej verŝajne komprenus unue nur kelkajn lingvojn. Tiuj lingvoj certe estos: „angla, franca, japana, ĉina, germana, …“.

19.7.2007

Blogo de projekto Esperantilo nun maŝine tradukita al pola lingvo

Filed under: ĝenerale — artur @ 18:30

Mi longe pensis pri tiu paŝo. Kial ne uzi la programon Esperantilo por aŭtomate traduki la blogon al pola lingvo. Tamen mi volis atendi, ke la kvalito de traduko estas bone komprenebla. Tre malbona traduko estus ja malavantaĝa varbado por la projekto. Nun mi decidis tion fari kaj. Tie vi povas legi la blogon ankaŭ en pola lingvo.

Nun kelkdek milionoj aldonaj homoj povas legi ĝin. Mi esperas, ke almenaŭ por kelkaj Poloj la enhavo de blogo estas interesa. Mi skribis etan programon por tiu tasko. La programo bezonis 15 minutoj por traduki ĉirkaŭ 50 artiklojn. La traduko ne estas perfekta. Ofte problemojn faras tekstoj, kiu enhavas frazojn en aliaj lingvoj. Tamen la profesia traduko de tiu blogo kostus kelkdek mil eŭroj kaj daŭrus kelkajn semajnojn. Mi pensas, ke per tiuj tradukoj multaj Poloj ekscios pri ekzisto de Esperanto.

Nun la nova epoko en blogo ekestis. Iam ĉiu blogo estos legebla en kelkaj lingvoj samtempe. Teorie ankaŭ uzantoj povus skribi komentojn en kelkajn lingvojn. Por tio la bloga softvaro devus enhavi tradukajn funkciojn. Nun almenaŭ por esperanta kaj pola lingvoj tio estas ebla.

17.7.2007

Unuaj esperantaj tekstoj

Filed under: ĝenerale — artur @ 19:29

Sur la paĝo de muzeo de planlingvoj en Vieno troviĝas kelkaj tre maljunaj libroj en esperanta lingvo.
Mi tralegis la libron: Stankievic, V.: El la vivo de Esperantistoj
Nurnbergo, 1896
. Bedaŭrinde la libro ne estas en teksta formato, kiu estus legebla direkte por komputilo, sed kiel bildo. Bildoj estis skanitaj ankaŭ iom malakurate (ne rekte), do la legado kaj konvertado de bildo per OCR-tekniko ne estus facila.

La libro estas interesa en du vidpunktoj. Unue mi interesiĝis pri la lingvaĵo de libro. Mi volis scii, kiel aspektis esperanto en unuaj jaroj de sia ekzisto. Tre interesa estas ankaŭ la enhavo de libro, ĉar li parolas pri la tiama esperanta komunumo kaj ankaŭ estas gvidlibro por esperantistoj. Tiu enhavo estus por mi eĉ pli surpriza, ĉar ili estas propaganda (aŭ eduka) materialo en maniero, kiu nun ne estas kutima.

Pri la lingvaĵo

Mi rimarkis, ke la teksto ne estas facila. Mi pensas, ke komencantoj ne povus ĝin bone kompreni. La sintaksaj strukturoj estas komplikaj. Aŭtoro tre libere uzas la esperantan vortfaradon, kiu eĉ superas la regulojn de unua libro.
Jen ekzemploj:

  • ĉefemaniere
  • longaflugila
  • dank‘ al
  • konas unu alia
  • de alte
  • li atingis ja la sian
  • tio ĉi estis tro multa
  • scivoleco
  • sed tiel multe estis da volontuloj

Nun oni frontas la vorton „scivolemo“ sed ne „scivoleco“, kiu estus same bona. Tio estas por mi la indiko, ke la lingvo evoluas. En tiamaj tempoj ekzistoj pli da libereco de uzado. Nun tuj oni pritaksas iun esprimon kiel stranga aŭ nekutima. Ekzistas kelkaj dubindaj esprimoj, kiuj radikas en naciaj lingvoj kaj estas idiotaĵoj. Mi pensas, ke aŭtoro volis montri, ke Esperanto havas la saman esprimpovon kiel ĉiu nacia lingvo kaj li simple direkte tradukis de nacia lingvo. Okulfrape estas, ke li uzis pli ofte „tia“ en frazoj, kie oni nun uzus „tiu“ (ekz. „tiamaniere“). Mi frue pensis, ke vortoj kiel „tiamaniere“ estas la moderna maniero de adverbigo. En tiu kazo de prepozicia frazo „en tia maniero“ al „tiamaniere“. Sed evidentiĝis, ke tiu fenomeno ekzistis ankaŭ en tre frua Esperanto. Bedaŭrinde mi ne povis ekscii pri la nacieco de aŭtoro. Estus eble, ke li rekte tradukis tiun vorton de sia propra lingvo.

Esperanta propagando

La libro temas pri obstakloj de unu juna esperantisto ĉe esperantigo de sia amiko. Post longaj obstakloj kaj eĉ intrigoj kaj mensogoj, la rakonto finas per amo kaj edziĝo. Rezulto estas 2 novaj esperantistoj. Unu esperantigita kaj la dua naskita laŭ natura vojo, kiel bebo de du esperantistoj. La libro donas ankaŭ al la legantoj sugestojn kiel devas sin konduki vera esperantisto kaj kiun kaj kiel esperantigi.

Jen pripesindaj frazoj de tiu libro:

  • „Vi komprenas, ke, fariĝinte esperantisto, mi ne povus limiĝi per sola lernado de vortaro kaj korespondado kun amikoj; mi devus uzi parto de mia energio por la propagando kaj por la apostola agado, …“
  • … ke Monblero povus esti tre utila al la afero Esperanta. Li estis tre riĉa kaj ne sole ne avare, sed eĉ, kie li trovis bezona, tre malavara …
  • .. kaj tial Ĉielson, fariĝinte esperantisto, ĵetis ĉiujn antaŭajn aferojn kaj tuta trempis sin en la propagandon de la lingvo internacia. Li korpremis, ke la propagando devis esti afero ne kabineta, sed societa, kaj tial li penadis akiri la plej diversajn kaj vastajn interligojn kaj konatecojn, kio, dank‘ al lia bela eksteraĵo, elegantaj manieroj kaj viva, akra saĝo, estis afere facila atingebla.
  • moron salutadi unu alian per la vortoj: „Ĉu vi esperas“? – „Jes, mi esperas.“ – ĉe renkonto, kaj „Esperu“! – „jes, mi esperos“ – anstataŭ adiaŭ.
  • Pro eniri la Ligon, vi devas aboni nian gazeton „Lingvo Internacia“ kaj la „Bibliotekon“; kiel ekstera signo servu al vi stelo sur la brusto kaj malkaŝita parolado …
  • , ke laŭ la komisio de Ĉielson Siksten decidis altiri Monbleron al Esperanto,
  • Se li unu fojon fariĝos esperantisto, li estos jam ĉiam esperantisto varmega.

Por mi tiu libro enhavas multajn pripensindajn aferojn. Unue temas ne nur pri lingvo Esperanto sed pri iom pli. Esperanto estas en tiu libro socio aŭ organizo, kiu konscie elektas homojn por esperantigo laŭ iliaj monaj rimedoj. Tiuj homoj devas ne nur lerni la lingvon, sed labori por tiu socio. Esperantistoj devas subigi al siaj gvidantoj kaj plenumi iliajn komisiojn.
Ili devas publike stigmatigi sin per videbla esperanta ŝtelo. La celo de esperantigo estas pli grava ol uzataj rimedoj. Do oni povas mensogi kaj intrigi por atingi tion. Tio funkcias laŭ konata jam de jarmiloj skemo, kiu estis praktikata de religioj, politikaj movadoj (komunismo) kaj sektoj. Laŭ tiu skemo ĉiu ideo bezonas:

  • Kreinto kaj idolo
  • Libro aŭ manifesto
  • Apostoloj aŭ progresuloj
  • difinita fina venko

Ni komparu tion kun kelkaj ideoj.

kristanismo komunismo esperanto
idolo Jezuso Marks kaj Engels Zamenhof
libro nova biblio komunista manifesto fundamento
apostoloj 12 apostoloj kaj eklezio partio esperantaj asocioj
fina venko paradizo komuna socio totala esperantigo. solvo de lingva problemo.

Tiu modelo devus esti kutima por multaj homoj, ĉar tiun komparon mi vidis ofte (sed sen Esperanto). Ĝenerale neniu malbona rezultas de tiu skemo, sed mi pensas, ke ofte ĉe tiuj aferoj kreiĝas senlima memfido je propraj opinioj. Apostoloj estas pretaj agi nemorale por atingi siaopinie pli altaj celoj. Tio rekte kondukas al radikalismo. Tiu radikalismo frontas al memdefendo kaj ofte malutilas al ideo, kiu eĉ povus esti bona.

Mi estas konscia, ke ne ekzistas unu opinio pri Esperanto kaj ankaŭ en tiamaj tempoj oni eble ankaŭ diference pensis pri tio. La ofta riproĉo al Esperantistoj je sektismo havas ankaŭ siajn kaŭzojn eble en tiamaj tempoj.

Por mi timiga estas la granda preso, kiun oni en la libro ligis kun esperantigo. Esperantisto havas multajn devojn je la Esperanto. Do ne sufiĉas nur paroli esperanton por esti esperantisto. Interesa estus la demando, ĉu tio estis la unusola ebla vojo por certigi daŭrigon de Esperanto? Por mi Esperanto estas mia ŝatokupo, tamen mi donas multe de mia energio al esperanto.
Homoj povas fari multe nur kiel sia ŝatokupo (hobio). Ekzistas homoj, kiuj nur pro ĝojo lernas la lingvon de klingonoj, kvankam kun tio lingvo ne ligiĝas neniu granda celo de savo de homaro de komunika ĥaoso. Aliaj homoj donas multe da tempo kaj mono al konstruo de etaj fervojoj (infanaj ludiloj).
Mi pensas, ke la plej granda parto de hodiaŭaj parolantoj de esperanto aŭ interesiĝas pri la lingvo profesie kiel lingvistoj aŭ programistoj aŭ ili traktas Esperanton kiel ŝatokupon. Do ĉu vere Esperanto estas solvo de lingva kaj komunika problemo? Ĉu ĝi estas la plej bona solvo? Ĉu tio solvo estas necesa kaj ebla? Ĉu ne ekzistas pli gravaj problemoj ol lingva problemo? Ĉu oni havas rajton demandi pri tio kiel vera Esperantisto? Eble Esperanto ne bezonas Esperantistojn sed nur uzantojn de tiu lingvo.

15.7.2007

Esperantilo 0.94

Filed under: ĝenerale — artur @ 09:50

Ankaŭ en julio aperas nova eldono de programo Esperantilo. La novaĵo en tiu eldono estas la rapida vortara listo apud la redaktila fenestro. Jam dum tipado la vortaro montras samtempe eblajn tradukojn. Tiun vortaron instigis al mi Eckchard Stoll, kiu estas kreinto de programo Ecoso. Tiu programo enhavas tian vortaron. Mi ankaŭ forigis unu eraron ĉe tradukado. Dum la unua tradukado ĉiam aperis la erara fenestro.

Aliaj ŝanĝoj:

  • Mi refreŝigis la tradukon de uzula interfaco por ĉiuj lingvoj (pola, germana, angla).
  • Mi korektis kelkajn erarojn en tekstoj de programo.
  • Esperantilo nun povas ĉe tradukado de nomoj uzi polajn regulojn de fleksio.
    Do frazo „Mi parolas pri Artur Trzewik.“ rezultas nun „Mówię o Arturze Trzewiku.“.
  • Oni povas raporti erarojn direkte de programo per interreto.
  • Kelkaj aliaj plibonigoj de sintaksa analizo kaj tradukado al pola lingvo.
  • Pola vortaro estis plivastigita je kelkcent novaj vortoj.

12.7.2007

Aŭtomata raportado kaj informado per interreto

Filed under: ĝenerale,programado — artur @ 18:39

La projekto Esperantilo estas evoluigita de unu persono. Tio estas preskaŭ normala afero ĉe liberaj programoj.
Tamen multaj homoj partoprenis iugrade ĉe la projekto per raportoj aŭ sugestoj. La nombro de tiuj raportoj ne estas granda.
Mankas erarraportoj, kiuj multe helpus al la projekto. Ankaŭ ĝis nun mi ne ricevis neniujn korektojn de vortaroj, kvankam la programo
mem ebligas adapti la vortaron kaj la ŝanĝoj povus esti eksportitaj per funkcio „preferaĵoj->konservu lokajn ŝanĝojn por eksportado“.
Mi pensas, ke ofte homoj ne scias pri tiuj ebloj aŭ tia partopreno en projekto estas tro klopoda. De informoj, kiuj mi ricevis de uzantoj, mi supozas, ke spertaj esperantistoj ne bezonas la programon kaj komencantoj simple ne kapablas helpi aŭ raporti. Do mi devus atendi la tempon, kiam kelkaj nunaj komencantoj iĝos spertaj kaj havos emon raporti :-). Eble la programo havas tro da eraroj kaj la uzantoj pensas, ke ne indas raporti. Mi tute pri tio ne scias.

Komercaj firmaoj, kiuj laboras pri programaro por vasta publiko, havas tute aliajn rimedojn. En tiuj projektoj partoprenis multaj personoj, kiu prizorgas nur pri unu kampo de kreado. Do ekzistas: fakaj specialistoj, testantoj, specialistoj pri varbado, projektantoj, gvidantoj kaj fine programistoj.

Projekto Esperantilo havas subajn problemojn en tiu kampo.

  • Mi ricevas tro malmulte da eraraj raportoj. (Ĝis nun ĉirkaŭ 10)
  • Due mi tute ne scias, kiel homoj uzas la programon. Kiuj funkcioj estas uzataj kaj ŝatataj kaj kiuj funkcioj neniam estas uzataj?
  • La komuna prilaboro de vortaroj ne funkcias.
  • La eraroj (cimoj) en programo povas esti korektitaj nur per nova eldono. Ne ekzistas la eblo de instalado de flikoj (angle: patch).
  • Uzantoj uzas verŝajne ofte malnovan eldonon de programo kaj malofte refreŝigas la programon.
    Tiu estas eble tre verŝajna, ĉar preskaŭ ĉiun duan monaton ekestos nova eldono de programo kun malgrandaj ŝanĝoj.

Kelkaj novaj programoj kiel Firefox aŭ OpenOffice ankaŭ frontas tiujn problemojn. La solvo de tiuj programoj estas, ke la programo uzas interreton por aŭtomate ricevi aŭ sendi informojn. Mi nun testas kelkajn eblojn. Tiuj estas:

  • Direkta raportado de eraroj per interreto.
  • Rapida kaj aŭtomata instalado de programaj flikoj (sen granda elŝuto de tuta programo).
  • Aŭtomata informado pri nova eldono de Esperantilo.
  • Facila sendado de ŝanĝoj en vortaro.
  • Statistiko pri uzado de programo.

Tiaj funkcioj frue ne estis akceptitaj de uzantoj. Oni precipe ne volis, ke programo mem kontaktis servilon per interreto kaj sendas iujn informojn. Sed nun preskaŭ ĉiuj programoj uzas tiujn eblojn. Nuntempe preskaŭ ĉiu komputilo estas daŭre konektita kun interreto.
Ofte multe uzantoj ne havas tempon por lerni pri tiuj ebloj de programo. Ili estas nur maloftaj uzantoj de komputiloj kaj ne scias pri maniero de libera programado. Do ekzistas verŝajne granda grupo de uzantoj, de kiuj mi ne ricevis neniun informon. Mi planas, ke tiujn novajn funkciojn oni povas influi per agordo de preferaĵoj. Kutime uzantoj tamen neniam tuŝas preferaĵojn.
Mi esperas, ke tiuj funkcioj, kiuj ja estas konataj de aliaj programoj, estos bonvenigitaj de uzantoj.

Powered by WordPress