Fuentes web
Entradas
Comentarios

Artikulu honetan, ‘LA RECOPILACIÓN Y CONSERVACIÓN DEL PATRIMONIO DIGITAL’, euskarri digitalen kontserbaziorako pausuak zeintzuk diren aztertzen da.

Paperetik euskarri digitalerako jauzia egin denez eta gure bizitza, zentzu zabalean, teknologia berri hauen menpean dagoenez, Europar Batasuneko erakunde batzuek, UNESCO eta IFLA, digitalizazioa babesteko eta garatzeko xehetasunak eman zituzten.

Dokumentu digitalen kontserbazioaren azterketak, agerian utzi zituen euskarri honen abantaila eta desabantailak zeintzuk diren. Ikerketa hori eginik, ondare digitalaren kontserbaziorako bideak aipatzen dira.

Hasiera batean, ordenagailuak lan bibliografiko eta estatistikoak egiteko erabiltzen bazen, hamarkada bat geroago, bere erabilera zabaldu eta informazioa bildu, moldatu eta banatzeko erabiltzen hasi ziren. Gainera, baliabide hau, gero eta aberatsagoa suertatu zaigu denborarekin, izan ere, terminal infortmatiko batetik mundu guztira zabal daitezke dokumentuak eta bertan pilatutako informazioa. Era berean, lanerako eta hezkuntzarako ezinbestekoa zaigu gaur egun, informazioa ordenadore bidez prozesatze, honek bizkoratsunaz gain garbitasuna ere dakarrelako.

Testuan aipatzen denez, gailu informatikoak garatu diren heinean, berauek kontserbatzeko moduak ere aldatu dira eta, horrek, digitalizazioaren kontserbaziorako premia dakar.

Horrez gain, mundua goitik behera aldatu duena Internet sarea izan da, zalantzarik gabe:

‘ Pero el mayor logro de esta década es la popularización de Internet, sobre todo a partir de 1991, en el que se pone en funcionamiento la World Wide Web, y de 1993, año en que se utiliza el primer programa navegador gráfico: Mosaic, antecesor de Netscape y de Internet Explorer’ .

‘El World Wide Web, Web o WWW es, junto con el correo electrónico, una de las aplicaciones más utilizadas en Internet. Los pilares de su éxito son el lenguaje utilizado para codificar la información (el HTML o XML), que permite enlazar diferentes partes de un documento, documentos albergados en el mismo o en otro ordenador servidor sin que apenas lo perciba el usuario final’

Sarrera honi jarraipena emateko, termino bat definitu behar da, aldez aurretik:  Zer da ondare digitala?

Ondare digitala gizakion adierazpen kulturalak, zientifikoak, administratiboak, teknikoak, juridikoak, medikoak etab. formato digitalean batzen dituen baliabidea litzateke.

Objetu digitalak testuak, datu baseak, irudiak, irudiak mugimenduak, grabaketak, grafikoak, programa informatikoak, Web orrialdeak etab. izan daitezke. Beren kontserbazioak jarduera zehatz bat eskatzen du beren produkziorako, kudeaketarako eta mantenimendurako.

Gertatzen dena da, ondare digitalak galera arrisku handia daukala, izan ere, hain arin ari direnez euskarri digital hobeak garatzen, kontserbazioa gero eta zailagoa suertatzen da.

Ondorioz, estrategia berehalakoak eta neurri zehatzak ezarri behar dira euskarri digitalekin, bertan gordetzen den dokumentazio usua gal ez dadin.

Ondare digitala irekia denez, hots, munduko edozein txokotik hel daitekeenez edozein informazio elektronikora, tokian-tokiko dokumentazio digitala ere babestu beharko litzateke. Horrela, hainbat kulturetako liburutegiek, artxiboek, museoek etab. gorderik daukaten informazio guztia tokian-tokiko neurriekin gorde beharko litzateke baina, digitalizazioaren kontserbaziorako neurriekin, beti ere.

UNESCOren betebeharrak ondare digitalaren kontserbaziorako:

a) incorporar los principios establecidos en esta Carta al funcionamiento de sus programas y promover su aplicación tanto dentro del sistema de las Naciones Unidas como por las organizaciones internacionales, gubernamentales y no gubernamentales, relacionadas con la preservación del patrimonio digital;

b) ejercer de referente y de foro en el que los Estados Miembros, las organizaciones internacionales, gubernamentales y no gubernamentales, la sociedad civil y el sector privado puedan aunar esfuerzos para definir objetivos, políticas y proyectos que favorezcan la preservación del patrimonio digital;


c) impulsar la cooperación, sensibilización y creación de capacidades y proponer directrices éticas, jurídicas y técnicas normalizadas para apoyar la preservación del patrimonio digital;

d) basándose en la experiencia que adquirirá en los seis años venideros con la aplicación de la presente Carta y las directrices, determinar si se requieren nuevos instrumentos normativos para promover y preservar el patrimonio digital.

Erreferentziak:

Terminologia

Autenticidad. Garantía del carácter genuino y fidedigno de ciertos materiales digitales, es decir, de que son lo que se afirma de ellos, ya sea objeto original o en tanto que copia conforme y fiable de un original, realizada

mediante procesos perfectamente documentados.

Certificación. Proceso de evaluación del grado en que un programa de preservación cumple con un conjunto de

normas o prácticas mínimas previamente acordadas.

Patrimonio digital. Conjunto de materiales digitales que poseen el suficiente valor para ser conservados para

que se puedan consultar y utilizar en el futuro.

Preservación digital. Acciones destinadas a mantener la accesibilidad de los objetos digitales a largo plazo.

Programa de preservación. Conjunto de disposiciones (y de los responsables de tomarlas) destinadas a

garantizar la accesibilidad permanente a los materiales digitales.

Identidad de objetos digitales. Característica que permite distinguir un objeto digital del resto, incluidas otras

versiones o copias del mismo contenido.

Ingesta. Operación consistente en almacenar objetos digitales, y la documentación relacionada, de manera

segura y ordenada.

Verificación. Acción de comprobar si un objeto digital, en un formato de fichero dado, está completo y cumple

con la especificación de formato.

Derechos. Facultades o poderes legales que se tienen o ejercen con respecto a los materiales digitales, como son

los derechos de autor, la privacidad, la confidencialidad y las restricciones nacionales o corporativas impuestas.

Erreferentzia:

  • UNESCO. http://unesdoc.unesco.org/images/0013/001300/130071s.pdf. Bilaketa: 2009ko azaroaren 9an, 13:40tan.

RAEren hiztegi elektronikoan ‘documentación’ sarrera bilatzerakoan honako azalpena ematen digu:

1. f. Acción y efecto de documentar.

2. f. Documento o conjunto de documentos, preferentemente de carácter oficial, que sirven para la identificación personal o para documentar o acreditar algo.

Honako definizio honek adierazten duenez, dokumentazioa informazio pertsonal baten edo ofizial baten identifikazioa eta egiaztatzea da, hots, autentikotasuna frogatzea. Hortan zalantzarik ez dago baina, egiaztatze hau nola egin daiteke?

Orain urte gutxi arte, dokumentazioak ez du oinarri digitalik izan eta informazioa pilatzeko oinarri bakarra papera zen. Gaur egun informazioa gordetzeko hainbat era dago eta hedatze hori digitalizazioari esker gauzatu da. Ohiko dokumentazioari errespetua zor bazaio ere, egun ez da beste erremediorik geratzen digitalizazioak suposatu duen iraultzari nagusigoa ematea baino.

Konparaketa bat egin behar bagenu, lehenbiziko oharra argi eta garbi, bakoitzaren euskarrian izango litzateke:

  • ohiko dokumentazioa paperean egiten zen, testuekin eta irudiekin.
  • dokumentazio digitala formato elektronikoekin gauzatzen da, horretarako ezinbestekoa da gailu informatikoa erabiltzea.

Gordeketa digitalen euskarrien biziraupena dokumentazio tradizionalarena baino laburragoa denez, ezinbestekoa da baliabide teknologiko zehatzen bizirautea hauek etengabe ari baitira eraberritzen.  Honakoa da euskarri digitalen arriskurik handiena, izan ere, izugarrizko abiadan aldatu eta ordezkatzen dira gaur egun merkatuan baliabide teknologikoak. Honek, dokumenu eta edukien galera ekar dezakeenez, estrategia zehatzak finkatzea erabakigarria ikusi du UNESCOk ‘Carta para la preservación del patrimonio digital’ delakoan.

Bestalde, esan liteke euskarri digitalak sekulako iraultza ekarri digula eta etengabe ari da bere mugak gainditzen baliabide berriei aukera ematen dien heinean. Ezaugarri positiboen artean honako adibideak dauzkagu:

  • Izaera interaktiboa. Ohiko dokumentuak pasibotzat jo litezke, izan ere, beren zurruntasunean agortu egiten dira. Bertan daude, gorderik, idatzirik, baina ezin alda daitezke. Dokumentu digitalek, ordea, testuen gainean inolako kalterik gabe idazteko, iruzkintzeko, frogatzeko eta abar luzerako aukera ematen dute. Dokumentu elektronikoa eskuartean daukanak, badu dokumentu horren gainean jaso eta erantzuterik. Erreakzionatu eta elkarreragiteko aukera ezin-hobea dakar.
  • Izaera multimediatikoa. Tradiziozko dokumentuek informazioa zuzen-zuzenean ematen dute, testu bidez zein irudi bidez, baina bertan amaitzen dira aukerak. Gaur egungo digitalizazioari esker, dokumentuak asko aberastu ahal dira, izan ere, informazioa testu gisa, irudi gisa, bideo gisa zein soinu-hots gisa horni daiteke. Adibidez: gero eta egunkari gehiago argitaratzen dira Internet sarean ( berriak testu bidez ematen dira, baita irudi, grafiko, bideo eta soinu bidez).
  • Izaera hipertestuala. Euskarri digital baten ezaugarri nabarmenetako bat honakoa da, izan ere, dokumentu elektroniko bat edukitzeak, dokumentu elekrtoniko ‘guztiak’ edukitzea suposatzen du. Demagun, testu digital bat irakurtzen ari garela eta halako batean, hitz baten esanahia ulertzen ez dugula, horren gainean ‘klik’ bat egite hutsa nahikoa da, beste helbide elektroniko baterako jauzia egin eta informazioa eskuratu ahal izateko. Beraz, euskarri digitalak, irakurketa lineala (tradiziozkoa) eta baita jauzikakoa eskaintzen digu.
  • Komunikazio irekia. Internet sareko edozein orrialde zabaltzerakoan WWW ezartzen ditugu bilatzailean. Sigla hauen esanahiak dioen bezala, World Wide Web, munduko edozein txokotik beste edonorako jauzia egin daiteke dokumentu eta helbideen arteko barne-lotura horiei esker.

Tradiziozko dokumentazioan egin izan den bezala, euskarri digitalekoak ez dira nolanahi aurkezten, izan ere, badira zitak eta loturak ezartzeko arau ortotipografiko eta bisual batzuk ere. Citar lo digital aldizkari elektroniko honetan esaterako, dokumentuen digitalizazioa gauzatzerakoan jarraitu beharreko arauak azaltzen dira.

Erreferentziak:

Aurtengo fondo digitalen kudeaketa ikasgaiean ikertzen ari garen gaietako bat social bookmarking legez ezagutzen dena da, hots, Internet sarean, barne-barneko loturak sailkatu, pilatu eta konpartitzeko ekintza izango litzatekeena.

Etiketatze sozial honen sistemaren barnean, pertsona batek daukan aukera zera izango litzateke, Internet sarean topatutako baliabide interesgarri eta baliagarrienak zerrenda gisa gordetzea. Etiketa eta lotura zerrenda hori publikoki edo era pribatuan aurkeztu ahal da eta, horrela, antzerako interesak bilatzen dituzten beste pertsona batzuek, lotura hauek kategoria edo etiketa gisa ikusiko dituzte.

Gainera, markadore sozial hauek egiteko aukera eskaintzen duten zerbitzu hauek, tag izeneko etiketatzea (hitzaren beraren esanahia) ahalbidetzen dute. Hau da, pertsona batek gai zehatz batekiko interesa daukanean, Internet sarearen bidez lotura bat ezarri nahiko balu, gai konkretu batekiko tag edo etiketa bat sortuko du. Horrela, beste pertsonaren batek interes bera daukanean, tag berean txertatuko du bere lotura.

Gizartean hedatuz joan da apurka-apurka mugimendu hau eta arrakastaren ondorioz, zerbitzu gehiago eskaintzen dira sare sozial hauen garapenerako. Aurreko eskoletan ikusi dugunez, delicious da gaur egungo bookmarking zerbitzu hori eskaintzen dutenen artean ezagunenetakoa. Citeulike ere oso hedatua da munduan zehar, etiketatze zerbitzu hori eskaintzen baitu.

Bertako erabiltzaileen interesen arabera, kategoria ezberdinak sortuko dira;  gizartean interesik handiena pizten dutenak zerrendako lehen postuak okupatuko dituzte.

Etiketatze ekintza honek egunean- eguneko atentzioa eskatzen duenez, zerbitzu honek kategorien berritze eta aldaketen berri edukitzea dakar. Baliabiderik erakargarri eta baliagarrienak direnez jendearen gehiengoak direnez etiketatuenak, zerbitzu hauek RSSetara atxikitzeko aukera ematen dute, dela tag bidez, dela tag kolekzioen bidez.

Honako bideo honek  argi azaltzen du gaur egun, Internet sarearen barnean hamaika aukera dagoela norberak gogokoen dituen web orrialde edota zerbitzuen artean loturak ezartzeko. Bideoa ingelesez badago ere, erraz ulertzen da azaurkezpena irudi bidez azalduta dagoelako.

 

Errferentziak:

  • http://en.wikipedia.org/wiki/Social_bookmarking. Bilaketa: 2009ko azaroaren 3an, 10:03tan.
  • http://www.youtube.com/watch?v=x66lV7GOcNU. Bilaketa: 2009ko azaroaren 2an. 10:19tan.
  • http://delicious.com. Bilaketa: 2009ko azaroaren 3an, 10:28tan.
  • http://ocw.uoc.edu/informatica-tecnologia-y-multimedia/marcadores-sociales-una-herramienta-para-organizar-la-red/Course_listing. Bilaketa: 2009ko azaroaren 3an, 10:31tan.
  • http://www.citeulike.org/ . Bilaketa: 2009ko azaroaren 3an, 10:41etan.

Artikulu honetan machine translation, machine aided translation, multilingual content management eta translation technology kontzeptuen azalpenak ematen ahaleginduko naiz, izan ere, hauek guztiak itzulpengintzaren alorrarekin loturik daude.

  • Machine translation (MT) edo makina bidezko itzulpengintza: Hizkuntza batetik besterako testuen itzulpenak egiteko makina bidezko itzulpengintzari deritzo, hau da, makinak erabiliz egindako itzulpenak egitea. Lengoaia natural batetik besterako itzulpen fase horretan software bereziak erabiltzen dira itzulpenak egiteko eta, ondoren, Christian Boitetek dioenez, gizakiek, testuak gainbegiratu egiten dituzte anbiguotasuna saihesteko.
  • Machine aided translation edo makinaz lagunduriko itzulpengintza: Kasu honetan, gizakiak berak egiten du itzulpen lan osoa baina, ekintza horretarako, makina du lantresna.
  • Multilingual content management edo Eleanitzeko edukien kudeaketa: Informazio eta teknologien munduan murgildurik gaudenez, ezinbestekoa suertatzen da informazioa hainbat hizkuntzatan itzulita eduki eta denontzako eskuragai izatea. Horregatik, egun, webgune asko sortzen dira bertsio eleanitzetan. Ondorioz, iturri batetik informazio eskerga atera dezakegu kudeatzaile batzuei esker.
  • Translation technology edo itzulpen-teknologia: Lengoaia natural batetik besterako itzulpenak egitean datza. Gaur egungo itzulpengintzako erronkarik handiena soinu-hotsezko hizkuntza batetik besterako itzulpen simultaneoak egitea da. Lan honetarako, software oso garatuak behar dira hots errekonozimenduak egin eta hizkuntza ezberdinetan interpretazioak egiteko.

Iturriak:

Itzulpenak

MT ( machine translation) sistemen bidez interneteko web orrialdeetan egin daitezkeen hainbat itzulpenen adibideak erakutsiko ditut artikulu honetan.

Itzulpen mamitsu eta zuzenenak egin ahal izateko, hizkuntza biekiko ezagutza aberatsa izan beharra dagoela argi dago. Hala ere, gaur egungo teknologia berriei esker, posible da hainbat hizkuntzetatiko itzulpenak egin eta beste hizkuntza batera itzulpen hurbilak egitea. Hizkuntze osaketa eta jatorria antzekoa izanik, errazagoa eta eraginkorragoa izango da egin nahi dugun itzulpena. Bestalde, zailagoa suertatzen da oinarri sintaktiko erabat ezberdina duten bi hizkuntzen arteko itzulpen zehatzak egitea. Ikus dezagun:

  • Ingelesetik gaztelerara itzulitako testua. Let it be Beatles taldearen kantu ezagunaren pasarte baten itzulpena:

Let it be ( ingelesetiko bertsio originala)

” When I find myself in times of trouble
Mother Mary comes to me
Speaking words of wisdom, let it be.
And in my hour of darkness
She is standing right in front of me
Speaking words of wisdom, let it be.
Let it be, let it be.
Whisper words of wisdom, let it be” .

Ordenagailu bidezko itzulpena ( Instituto Cervantes)

Cuando encontrarme a mí mismo en épocas de la madre Maria del apuro vengo a mí las palabras de discurso de la sabiduría, déjelo ser. Y sobre mi hora de la oscuridad ella está estando paradas derecho delante de mí palabras de discurso de la sabiduría, lo dejó ser. Dejáis le deba, déjelo ser. Susurre las palabras de la sabiduría, déjelas ser”.

Interneten aurkitutako itzulpen baten adibidea:

” Cuando tengo momentos de angustia
La madre Mary se acerca a mí
Diciendo sabias palabras
Déjalo estar
Y en mis horas de oscuridad
Ella se queda delante de mí
Diciendo sabias palabras
Déjalo estar
Déjalo estar, déjalo estar
Déjalo estar, déjalo estar
Susurrando sabias palabras
Déjalo estar”

  • Frantsesetik gaztelerara egindako itzulpena ( Instituto Cervantes)

Allons enfants de la Patrie
Le jour de gloire est arrivé
Contre nous de la tyrannie
|: L’étendard sanglant est levé :|
Entendez vous dans les campagnes
Mugir ces féroces soldats
Ils viennent jusque dans vos bras,
égorger vos fils, vos compagnes
Aux armes citoyens! Formez vos bataillons!
Marchons, marchons,
Qu’un sang impur abreuve nos sillons.

Gazteleraz:

Vayamos niños de la Patria el día de gloria llegó contra nosotros de la tiranía |: el estandarte sangriento se aumenta: |
¡Les óiga les en las campañas Mugir estos salvajes soldados ellos vienen hasta en sus brazos, degollar sus hijos, sus compañeras a las armas ciudadanos! ¡Forme a sus batallones!
Vayamos, vamos, que una sangre impura riega nuestros surcos.

* Ikus daitekeenez, hizkuntza biren jatorria hurbila bada eta, horrez gain, formakuntza sintaktikoa antzekoa izanda, itzulpena errazagoa eta eraginkorra da erabat.

  • Demagun alemaniera ezagutzen ez dudala:

” Deutschland ist ein in Mitteleuropa gelegener Bundesstaat, der aus den 16 deutschen Ländern gebildet wird. Bundeshauptstadt ist Berlin. Die Bundesrepublik Deutschland ist Gründungsmitglied der Europäischen Union und mit über 82 Millionen Einwohnern deren bevölkerungsreichster Staat, ferner unter anderem Mitglied der Vereinten Nationen, der OECD, der NATO, der OSZE und der Gruppe der Acht (G8)”

( Wikipedian alemanieraz idatzitako testu bat hartu eta ingelesera itzuli dut hura ulertzeko)

Itzulpena ( Reverso Translate Online):

Germany is a Federal State convenient in Central Europe which is formed from 16 German countries(lands). Federal capital is Berlin. The Federal Republic of Germany is an establishment member of the European Union and with over 82 million inhabitants their(her) government(state) richest in population, farther among other things member of the United Nations, the OECD, the NATO, the OSZE and the group of Eight (G8).

  • Ingelesetik catalanerako itzulpena. National Geographic-etik hartutako berri bat:

” When anglers called that March afternoon to say they had caught a giant freshwater stingray near this bustling Thai city, biologist Zeb Hogan couldn’t believe it”.

Itzulpena ( Comprendium Translator):

“Quan els pescadors anomenaven aquella tarda de Marxa per dir que havien
agafat un gegant stingray d’aigua dolç prop d’aquesta ciutat
tailandesa que s’afanyava, el biòleg Zeb Hogan no el podria creure”.

ITURRIAK:

- Deutschland. Wikipedia. Enciclopedia Libre. Kontsulta data: 2008ko apirilaren 30a, 10:08. http://de.wikipedia.org/wiki/Deutschland

- Marsellesa. Wikipedia. Enciclopedia libre. Kontsulta data: 2008ko apirilaren 30a, 09:59. http://es.wikipedia.org/wiki/La_Marsellesa

- Reverso Translate Online. Kontsultaren data: 2008ko apirilaren 30a, 10:10. http://elmundo.reverso.net/textonly/default.asp

- Instituto Cervantes. Servicio de traducción automática interactivo. Kontsultaren data: 2008ko apirilaren 30a, 10:14. http://oesi.cervantes.es/traduccionAutomatica.html

- Comprendium Translator. Traducció de text. Kontsulta data: 2008ko apirilaren 30a, 10:19. http://www.translendium.net:8080/home/text.do

- National Geographic news. Kontsultaren data: 2008ko apirilaren 30a, 10:20.

http://news.nationalgeographic.com/news/2008/04/080429-giant-stingray.html

- OpenTrad. Kontsultaren data: 2008ko apirilaren 30a, 10:28. http://www.opentrad.org/demo/

Hizkuntza batean idatitako testu baten mezua eta edukia ulertu ondoren, beste hizkuntza baterako baliokidea litzatekeen testu bat sortzea da itzulpengintza. Hizkuntza ezberdinetako testuen arteko baliokidetza sortzeko jarduera, alegia.

FMETI itzulpengintzarako makinen sistemak  antolatu eta erabiltzen laguntzeko sorturiko erakundea da. MT (machine translation) itzulpenerako makinen erabilerarik egokiena antolatzeaz arduratzen da eta, ekimen honen aburuz, itzulpenik onenak burutzeko, hiru ezaugarri edo hiru faktore dira garrantzitsu:

1. Asimilazioa. Asimilatzea antolakuntza honetatik kanpoko jendeak idatzitako testu talde andana ulertu, ikusktu eta erregulatzea litzateke. Era honetan,  jasotako dokumentu itzuliak bizkor aztertzea bilatzen da, geroago prozesamendu bat egiteko.

Beraz, eskuz nahiz automatikoki itzulitako testu zatiak aztertu eta prozesatzea da funtsezko helburua; testuen barnetiko kohesio eta eduki aberatsa lortzea, alegia.

2.  Barreiatzea. Erakunde barruko nahiz kanpotikoei, antolakuntzan bertan itzulitako dokumentuak igortzea da helburua. Hots, kultura eta terminologia zehatzen inguruko ezagutzak tratatzen dituzten testuak hedatzea, hain zuzen ere.

3. Komunikazioa. Eleanitzetako elkarrizketei eutsi ahal izateko eta komunikazio akatsik gabe eta etenik gabea izateko, itzulpen goxo eta zuzenen premia dago. Hau da, egokitasun sintaktikoa beharrezkoa da askotariko itzulpenak egiteko. Beraz, ildo hori jarraituz, testu onak eskatuko dira, ondoren hauek antolakuntza barnekoengana iristeko.

ITURRIAK:

Printable version of FEMI. Kontsulta data: 2008ko apirilaren 28a, 17:04. http://www.issco.unige.ch:8080/cocoon/femti/printable.html

Bigarren galdeketarekin jarraituz hiru ikerkuntza gairen azalpena egingo dut artikulu honetan zehar:

1. Lehenik eta behin, Euskal Herriko Unibertsitateko Informatika Fakultateko IXA taldea aztertzea erabaki dut. Izan ere, gertuko ikerkuntza taldea izanik, aurrera daramatzaten proiektuak eta beraien xedeak zeintzuk diren aztertzea interesgarria delakoan nago.

Orain arte zerrendaturiko ikerketa gai guztien xede nagusia giza lengoaiaren teknologia prozesamendua dela ikusi izan dugu. Hala bada, esan daiteke, IXA taldea ” euskararen gaineko ikerketaz” arduratzen dela. EHU-ko informatika fakultatean sortutako talde honek hainbat proiektutan egin du lan.

IXA

Ezaguna da, esaterako, XUXEN egiaztatzaile ortografikoa. Bertan, euskaraz idatzitako testuetan ageri diren akats ortografikoak zuzendu eta egokitzeaz arduratzen den zuzentzailea da. Hasiera batean, ordenagailuan instalatu beharra zegoen, egun, aldiz, www.sc.ehu.es/xuxen-e.htm helbidean eskuragarri dago zerbitzua.

Bestalde, ordenagailuekin lanean gabiltzalarik, oso lagungarria suerta dakiguke Elhuyar-Word hiztegi-sistema. Honekin, bai euskarazko zein gaztelerazko hitzen esanahi eta iztulpenak segituan ikus ditzakegu. Horrela, ele biak bizkor maneiatzea aise egiten da.

Kuriosoa da baita ere, IXAk bertsolaritzari eskainitako proiektua; BertsolariXa du izena eta “bukaera bat emanda, errimak aurkitzen ditu”. Helbidea: http://ixa3.si.ehu.es/tresnak/bertso/sarrera.html.

 

2. Bigarrenez, Espainiako elkarte baten proiektuak eta eskaintzak zeintzuk eta nolakoak diren azalduko ditut.  Sociedad  Española para el  Procesamiento  del  Lenguaje Natural izena du  lan taldeak.  Hainbat soziok eta instituziok eratutako lan taldea da; hau ere  lengoaiaren prozesamenduaz  arduratzen da.

Urtero legez, Kongresu bat antolatu du aurtengoan eta, bertan, lengoaiaren prozesamenduan diharduten estatuko elkarteak bilduko dira. Madrilen burutuko den kongresuan, hainbat erabaki hartuko dute. Web orrialdean, eztabaidatuko diren gaiak zerrendaturik agertzen dira. Esanguratsuenak: itzulpengintza automatikoa, anbigutasuna saihestea eta  testuen edukiaren analisia egitea dira.

Web orrialdearen helbidea http://basesdatos.uc3m.es/sepln2008/web/ da.

 

3. Azkenik, National Centre for Language Technologies Irlandar ikerkuntza zentru honen aburuz, hizkuntza da komunikazioa gertatu ahal izateko gakoa edo giltza. Hori dela eta, giza baliabideak komputuekiko elkarreraginean uztartzea dute helburu. Gauzak horrela, zentru teknologiko hau hizkuntzen itzulpengintzan eta batasunean zentratu eta hainbat makina sortu dituzte hauek merkaturatzeko.

National Centre for Language Technologies

Aipagarriak dira ordura arte zentruak merkaturatutakoak. Izan ere, ordenagailuetarako programa itzultzaileak, DVD-etako azpitituluen itzulpenetarako zuzentzaileak, hainbat hizkuntzetako gramatikako irakaspenetarako programak, konputu eta ahotsen arteko elkarreragina uztartzen dituzten programak etab. eskaintzen dituzte.

ITURRIAK:

- Lengoaia Naturalaren Prozesamendurako IXA Taldea (EH).  http://ixa.si.ehu.es/Ixa. Kontsultaren data: 2008ko apirilaren 07a, 13:05.

- Sociedad Española para el Procesamiento del Lenguaje Natural. http://www.sepln.org/. eta http://basesdatos.uc3m.es/sepln2008/web/ .Kontsultaren data: 2008 apirilaren 07, 13:12.

-National Centre for Language Technologies. http://www.computing.dcu.ie/research/nclt/. Kontsultaren data: 2008ko apirilaren 07a, 16:26.

Klaseko bigarren galdeketan Giza Lengoaiaren Teknologien inguruan internet sarean aurki ditzakegun bilaketa gai esanguratsuenen zerrendaketa egitea eskatzen zaigu. Horrela bada, hona hemen aipagarrienak:

Lengoaia Naturalaren Prozesamendurako IXA Taldea (EH).  http://ixa.si.ehu.es/Ixa. Euskal Herriko Unibertsitateko Informatika Fakultateko IXA taldearen xede nagusia ” euskararen gaineko ikerketa aplikatua” da.

  • APLIKAZIO ETA TRESNA KOMERTZIALAK
    • EDBL (Euskararen Datu-Base Lexikala), 80.000 hitz inguruko datu-basea http://sipl54.si.ehu.es/edbl2000.
    • MORFEUS, estaldura zabaleko analizatzaile morfologikoa.
    • XUXEN, zuzentzaile/egiaztatzaile ortografiko komertziala (patentatua), Unix, Windows eta Mac-erako garatua. www.sc.ehu.es/xuxen-e.htm helbidean eskuragarri.
    • GAIN, internet/intraneterako bilatzaile adimenduna. Jalgin eta Euskaldunon Egunkariaren hemerotekan erabilia.
    • EUSLEM, euskararako lematizatzaile/etiketatzailea.
    • Multimeteo-euskara, eguraldi-iragarpenak euskaraz sortzeko sistema.
    • Elhuyar Hiztegia Word2000 testu-editorean integratua.

    PROTOTIPOAK

    • HIZTSUA, hiztegi-sistema urgazle adimenduna.
    • ANHITZ, itzulpenean laguntzeko hiztegi adimenduna.
    • Hiztegixa, itzulpenean laguntzeko tresna.

 

The German Research Center for Artificial Intelligence . http://www.dfki.de/lt/ Alemaniako DFKI bilateka zentrua.

- Lengoaiaren prozesamendurako teknika arin eta sakonen barneraketa estuagoa.

- Dokumentuen zerrendaketa bai ingelesez zein alemanieraz.

- Automatikoki antolaturiko eta gainbegiratutako lanetikako informazioa.

- Azterketa sakonen prozesamendurako azterketa estatistikoak.

 

Language Technology Documentation Centre in Finland. Finlandiako Lengoaiaren Ikerkuntzarako dokumentazio-zentroa. http://www.ling.helsinki.fi/filt/info/index-en.shtml.

- Teknologia eta zerbitzu berrien garapena SST-en osaketa eta sistemetarako.

- Inprobisatutako testuen exekuzioen aitorpena.

- Testuen laburpena

- Testuen itzulpena

- Hainbat hizkuntza baliabide.

 

National Centre for Language Technologies (IR). Lengoaiaren teknologien prozesamendurako bilaketa zentru nazionala da. http://www.computing.dcu.ie/research/nclt/

- Baliabide linguistikoak bultzatzeko idatzohar automatikoetarako metodoen garapena

- softwaren bilaketak

- Testuen itzulpena- globalizazioa

-lengoaien ingururako aplikazioak

 

The Standford Natural Language Processing Group. http://nlp.stanford.edu/.

- Esaldien ulermena

- Lanak etiketatzeko modu probabilistikoak

- Galde-erantzuketa automatikoa

- Ambibuotasuna ezerezteko hitzen ulermena

 

BILAKETA SAREAK ( research networks):

European Network of Exellence in Human Language Technologies. http://www.elsnet.org/.

- Informazioaren azterketa sakona

- Komiteak lengoaiaren teknologien azterketen inguruan

- Giza baliabideen eta konputuen ustiapenen garapena

Common Language Resources and Technology Infrastructure (CLARIN). http://www.clarin.eu/.

- Edozein testu mota digitalizatu ahal izateko aukera

- Multimediako grabaketak

- Testuen ulermenerako tresnak

- Idatzohar automatikoak

- Kontzeptuen erregistratzeak

 

ELKARTEAK ( associations)

Sociedad Española para el Procesamiento del Lenguaje Natural (ESP)http://www.sepln.org/.

- Ikertzaileei lanak aurkezteko aukera eta laguntza eskaintza

- Lengoaiaren prozesamendurako ikerketen arteko ezberdintasun eta iritziak ematea eta eztabaidatzea

- Informazioaren erauzketaren inguruan eztabaidatzeko aukera

 

 

ITURRIAK:

- Sociedad Española para el Procesamiento del Lenguaje Natural. http://www.sepln.org/. . Kontsultaren data: 2008ko apirilaren 6a, 15:16.

- European Network of Exellence in Human Language Technologies. http://www.elsnet.org/. Kontsultaren data: 2008ko apirilaren 6a, 14:58.

- Common Language Resources and Technology Infrastructure (CLARIN). http://www.clarin.eu/. Kontsultaren data: 2008ko apirilaren 6a, 14:47.

- National Centre for Language Technologies. http://www.computing.dcu.ie/research/EIpresentations2002/NCLT.ppt. Kontsultaren data: 2008ko apirilaren 6a, 14:33.

- The Standford Natural Language Processing Group. http://nlp.stanford.edu/. Kontsultaren data: 2008ko apirilaren 6a, 14:23.

- Language Technology Documentation Centre in Finland. http://www.ling.helsinki.fi/filt/info/index-en.shtml. Kontsultaren data: 2008ko apirilaren 6a, 14:17.

- The German Research Center for Artificial Intelligence . http://www.dfki.de/lt/. Kontsultaren data: 2008ko apirilaren 6a, 14:12.

- Lengoaia Naturalaren Prozesamendurako IXA Taldea (EH).  http://ixa.si.ehu.es/Ixa. Kontsultaren data: 2008ko apirilaren 6a, 13:47.

 

Giza Lengoaia Naturalaren Prozesamenduaren inguruan diharduten elkarte, instituzio eta ikerkuntza esanguratsu eta ezagunenen proiektu eta helburu ugari aipatu dira artikulu honetan.

BA AL DAGO DEFINIZIO ZEHATZIK?

HLT kontzeptua ulertzeko garrantzitsua iruditzen zait atalez atal terminoak azaltzen joatea.

Interneten informazioa bilatzen jarri eta Informazioaren Gizartean hizkuntzak betetzen duen papera zein den zehazten duen Web orrialde interesgarri batekin egin dut topo:

http://liceu.uab.es/~joaquim/publicacions/FDS2000.html

Bertan azaltzen denez, lengoaia gizakiok elkarren artean banatzen dugun jakintza eta informazioa da. Gainera, ez da lengoaia bezalako sistema eraginkorragorik existitzen gure ideien ezagutzera emateko.

Gaur egun, hizkuntza esparru zabalagoetara hedatu nahi da, Informazioaren Gizartean bizi gara eta. Izan ere, gizartean, ezagutza elkarbanatzeko hedabideen areagotzea teknologiari esker eman da,

Internet sarearekiko lotura duten teknologiek elkarreragina baliabidetzen duten sistemetara hurbiltzen laguntzen digute. Lehen pentsaezina suertatuko litzateke gaur egun posiblea den ordenadore bidezko irakaskuntza, edota ordenadore bidezko erosketak, adiskideekin harremantzea, informazioa oso bizkor bilatu eta aurkitzea, etab.

Erraztasun honek errealitate birtual batera garamatza, ez baitago denbora nahiz leku mugarik. Ezaugarri honi esker, informazioen gizartearen aberastasuna ematen da, teknologien eraginkortasuna, alegia.

Hortaz, elkarreraginean, informazio trukaketa hobetzeko baliabide eta teknika bereziak erabiltzen dira, hau da, ingenieritza linguistikoa.

DFKI LT – What is Language Technology?

( Uszkoreiten esanetan)

Alemaniako DFKI bilateka zentruak, bere lanean oinarritutako definizio bat ematen du Language Technology termino hori ulerterraza izateko:

Haien esanetan, konputu bidezko metodoa da hizkuntzen teknologia, hots, hizkuntzaz baliatuz, ordenagailurako programak egiten dira eta, hauekin, informazio eta testuen azterketa, produkzioa eta eraldaketa ahalbidetu egiten da. Horregatik eman ohi zaio ingenieritza linguisitkoaren izena.

Giza hizkuntzak eta ezagutza ulertu eta elkarbanatzeko software-ak sortzea litzateke finean, proiektu erraldoi hauen helburu nagusia. Hots, gizakiaren eta makinen arteko elkarreragina ahalik eta handiena izatea. Izan ere, egun, ordenagailuek ez dute gure hizkuntza ulertzen eta beste kode batzuekin funtzionatzen dute.

Ahozkotasunaren eta konputuen arteko bateratzeak ikaragarrizko eraldaketa ekar dezakeela uste dute DFKIn, lan sistema erabat aldatuko baitu. Honela, makinak ez dira aparailu soilak izango.

Iturriak:

Europako hiru ikerkuntza zentru:

    • Language Tecnology Documentation Centre. http://www.ling.helsinki.fi/filt/info/index-en.shtml. Finlandiako ikerkuntza zentru honek, Helsinkiko Unibertsitatean dihardu. Hauek ere komputu bidezko hizkuntzaren erabileran sinisten dute eta metodo berrien ikerkuntza bultzatzeko proiektua dute. Kontsultaren data: 2008ko martxoaren 26a, 12:06.
        • Lengoaia Naturalaren Prozesamendurako IXA TALDEA. http://ixa.si.ehu.es/Ixa. “Euskal Herriko Unibertsitateko Informatika Fakultateko IXA taldeak Lengoaia Naturalaren Prozesamenduan eginiko ikerketa-lana du helburu nagusi. Ikerketa arlo honi hizkuntz ingeniaritza ere deitzen zaio gaur egun. Arlo zabal horren barruan, euskararen gaineko ikerketa aplikatua da gure xede nagusia, baina beste hizkuntzen gaineko ikerketa zein produktu komertzialen garapena ere sartzen dira gure eginkizunen artean. Lan horretan diziplinarteko taldea osatzen dugu, informatikarien eta linguisten artean batez ere”.

          Entradas antiguas »