Terminološki resursi

U zavisnosti od sadržaja, strukture i načina organizacije rečnici u opštem smislu posmatrani, kao terminološki resursi mogu biti: indeksi, glosari, taksonomije, tezaurusi i ontologije. Iako granice među ovim tipovima resursa nisu uvek oštre, na slici je prikazan jedan pogled koji predstavlja svaki od ovih resursa kao proširenje prethodnog. Na levoj strani se kreće od indeksa, kao najjednostavnijih lista termina za pojedinu oblast, obično alfabetski sortiranih, za kojim sledi glosar kao indeks koji sadrži definicije termina.

Glosari mogu da budu i dvo ili višejezični. Kada je u pitanju višejezično povezivanje termina često se prave i paralelne dvojezične liste, odnosno liste uparenih termina, koje obično nemaju definicije pojmova. Kontrolisani rečnik predstavlja konzistentnu kolekciju termina izabranih za specijalnu namenu, koje je autor rečnika odabrao.

Terminološki resursi

Dalje uređenje resursa ide ka uvođenju relacija među terminima odnosno pojmovima koji su predstavljeni konkretnim terminom. Prve i osnovne relacije među konceptima koji su predstavljeni terminima su: podređeni i nadređeni koncept, a mogu se posmatrati i kao širi i uži pojam. Termini u hijerarhiji su povezani relacijom je (eng. is a), koja može biti:

podređeni je tipa nadređeni
podređeni je deo od nadređeni
podređeni je primerak od nadređeni

Taksonomija predstavlja hijerarhijsku klasifikaciju pojmova, stvari, objekata, mesta, bića, događaja ili principa koji se klasifikuju. Stablo ili drvo je struktura koja omogućava definisanje hijerarhijske veze među rečima. Relacije roditelj-dete u drvetu predstavljaju nadređen-podređen relaciju između koncepata vezanih za termine. Bogatije relacije između koncepata, koje uključuju i meronime, antonime, izvedene pojmove i sl. se ne mogu predstaviti strukturom drveta, pa se za opise semantičkih relacija koriste strukture grafa. Primer takve strukture su različiti tezaurusi, kontrolisani rečnici, semantičke mreže, ontologije. Definicije granice između tezaurusa i ontologije u literaturi su različite, od onih koji kažu da su ontologije isto što i tezaurusi, samo sa različitom namenom do onih koji pod pojmom ontologije podrazumevaju isključivo resurse koji omogućavaju izvođenje novih znanja iz postojećih.

Pod taksonomijama u najširem smislu se podrazumeva izučavanje opštih principa naučne ili sistematske klasifikacije. Kada se kaže taksonomija ili sistematska klasifikacija, obično se misli na uređenu klasifikaciju biljnog i životinjskog sveta koja je urađena u skladu sa pretpostavljenim prirodnim vezama koje u njemu postoje. U informatici taksonomije predstavljaju inženjerski proizvod i nisu prosto apstraktan proizvod ljudskog mišljenja. Informatičko shvatanje taksonomije se shodno tome razlikuje, pa one u informatici predstavljaju klasifikaciju informatičkih entiteta u obliku hijerarhije u skladu sa pretpostavljenim vezama koje postoje između objekata u realnom svetu koje ovi informatički objekti predstavljaju.

U semantičkom spektru se iznad taksonomija nalaze tezaurusi koji bi se mogli definisati kao rečnici uređeni na neki jasan način i struktuirani tako da relacije ekvivalencije, homografije, hijerarhije i asocijativnosti između termina budu jasno izložene i da se lako mogu prepoznati preko standardnih indikatora. Prvenstvena uloga tezaurusa je da olakša pronalaženje dokumenata i da ostvari konzistentnost u indeksiranju zabeleženih dokumenata (ili zapisa u bazi podataka). Da bi zadovoljili ovu funkciju tezaurusi obično povezuju grubo značenje jednog termina sa grubim značenjem drugog termina. Oni su najčešće domenski ograničeni – npr. za vojnu tehniku. Kontrolisani rečnik tezaurusa je zamišljen da podrži pronalaženje informacija pružajući istovremeno pomoć čoveku koji dodeljuje termine, odnosno indeksira dokument (ili zapis), i čoveku koji želi da pronađe informacije da pretražuje koristeći iste termine koji su korišćeni pri indeksiranju. Iz svega ovoga se zaključuje da su tezaurusi prevashodno namenjeni čoveku, čak iako se koriste u informatičkom okruženju.

Sledeći korak ka povećanju semantičkog bogatstva je konceptualni model koji predstavlja model nekog predmetnog područja ili područja znanja. On predstavlja osnovne entitete (ili stvari iz domena), veze između entiteta, atribute entiteta i veza između njih, kao i vrednosti atributa, a često i pravila koja povezuju entitete, veze između njih i njihove atribute na složen način.

U konceptualnom modelu je moguće da se na pravi način definiše relacija „podklasa od“ između klase roditelja i klase deteta. Objektno-orijentisani jezik za modeliranje, kao UML (eng. Unified Modeling Language, naziva se i objedinjeni jezik za modelovanje, jedinstveni jezik za modeliranje) je dovoljno bogat da se pomoću njega izrazi semantika relacije „podklasa od“ koja povezuje dve date klase.

Treba imati u vidu da se u literaturi i praksi, pod pojmom ontologije često podrazumevaju strukture od jednostavnih taksonomija sa minimalnom strukturom nadređenosti i podređenosti, preko taksonomija sa rečima i sinonimima i konceptualnih modela sa komleksijim znanjima, sve do teorija logike sa bogatim, kompleksnim, konzistentnim i sadržajnim znanjima.

Na osnovu svega ovoga moglo bi se reći da ontologija definiše reči i koncepte koji se koriste za predstavljanje nekog područja znanja i na taj način standardizuje značenja. Ontologije koriste ljudi, baze podataka i aplikacije koji dele informacije iz istog domena. One kodiraju znanje iz nekog domena kao i ono znanje koje pokriva više domena. Na taj način one čine mogućim ponovno korišćenje kodiranog znanja. Jedna ontologija sadrži:

Klase (ili opšte obrasce entiteta) iz različitih domena od interesa
Primerke (pojedinačne entitete)
Veze između ovih entiteta
Osobine i vrednosti osobina ovih entiteta
Funkcije i procese u koje su ovi entiteti uključeni
Ograničenja i pravila koja uključuju ove entitete

Dakle, ontologija se može posmatrati kao skup znanja, koji uključuje rečnik, semantičke veze i jednostavna pravila zaključivanja i logiku o nekoj posebnoj oblasti. Takođe, može se posmatrati i kao model podataka koji predstavlja određenu oblast, odnosno domen i koristi se za zaključivanje među objektima u tom domenu i vezama među njima. Ontologije se koriste u veštačkoj inteligenciji, semantičkom vebu, informacionim sistemima, i sl. kao oblik predstavljanja znanja o svetu ili nekom njegovom delu. Uopšteno, ontologije opisuju: objekte na osnovnom nivou, zatim klase kao skupove, kolekcije ili tipove objekata, potom atribute kao svojstva, obeležja ili parametre koje objekti mogu da dele i relacije kojima su objekti međusobno povezani.

Rudonto kao kontrolisani rečnik

Rudonto je organizovan kao taksonomija sa definicijom za svaki termin, sinonimima i bibliografskim referencama izvora iz kojeg su preuzeti, kao i ekvivalentnim terminima u drugim jezicima (trenutno je prisutnansamo engleski ekvivalenti). Namera je da se obuhvate osnovni, opšteprihvaćeni geološki termini koji se najčešće koriste u praksi.
Relacije među konceptima koji su predstavljeni terminima su: podređeni i nadređeni, koji se mogu posmatrati i kao širi i uži pojam. Termini u hijerarhiji imaju je (eng. is a) relaciju:

podređeni je tipa nadređeni
podređeni je deo od nadređeni
podređeni je primerak od nadređeni

Dalje se relacije mogu proširivati relacijom sinonimije gde se osnovnom terminu pridružuju termini koji imaju isto značenje. Relacije uključuju i povezivanje na definiciju termina u drugim jezicima.
Kontrolisani rečnik predstavlja konzistentnu kolekciju termina izabranih za specijalnu namenu, koje je autor rečnika odabrao. Preko kontrolisanih rečnika izvedenih iz Rudonto-a se vrši validacija, klasifikacija i specifikacija vrednosti atributa svojstava opserviranog i interpretiranog.
Primeri ovih rečnika su petrološka klasifikacija, minerološka klasifikacija, geohronološka skala i leksikon kartiranih jedinica. Dalje slede rečnici izdvojeni iz terminologije vezane za strukturnu, ekonomsku, inžinjersku geologiju i hidrogeologiju, koji se mogu prelistati na LINK.

Pravci daljeg razvoja

Posmatrajući semantičku skalu različitih terminoloških rečnika i svojstva Rudonto-a uočava se da se on nalazi između taksonomije i tezaurusa.

Pravci daljeg razvoja Dalji razvoj će biti usmeren ka obogaćivanju semantičkih relacija kao što su meronimija, antonimija i slično, potom "koristi_se_za"," izveden_je_od"  i onih koji su specifični za geologiju.
U planu su i mogućnosti izvoza rečnika u standne jezike za ontologije kao što je na prim owl, po ugledu na inicijativu koju je pokrenuo GeoSciML.