OZ 2003/2

106 ORGANIZACIJA ZNANJA 2003, LETN. 8, ZV. 2 skupaj pojavljajo znotraj pojmov, npr. dva dokumenta, ki se prekrivata v več istih pojmih. Z mapiranjem kategorij lahko identificiramo grozde podobnih objektov za brskan- je in lokacijo neke podzbirke za iskanje želenih enot. Za navigacijo po pojmih, ki jo podpira prototip interspa- cea se za indeksiranje uporablja uravnotežena semantika ( scalable semantics ). Uravnoteženost se nanaša na obseg predmetnih področij, ki ga lahko semantično indeksira- mo, semantika pa na globino pomena, ki jo s semantičnim indeksiranjem lahko dosežemo. Medtem ko je tradi- cionalna tehnologija za iskanje polnih besedil široka in plitva, v primeru ekspertnih sistemov pa globoka in ozka, je semantično indeksiranje, ki se uporablja v prototipu interspacea uravnoteženo glede na omenjene skrajnosti za plitvo analizo velikih zbirk in globoko analizo malih zbirk. Rezultat analize ( parsing ) so generični pojmi izvlečeni iz objektov, rezultat indeksiranja pa korelacije med temi generičnimi pojmi v nešteti množici različnih virov po enotni statistični obdelavi. Za tekstovne dokumente so generični pojmi samostalniške besedne zveze. S statističnimi indeksi pa beležimo frekvenco skupnega pojavljanja besed, to pomeni, kako pogosto se vsaka besedna zveza pojavlja z vsako drugo besedno zvezo v dokumentu znotraj zbirke. Avtomatska analiza vseh pojmov in računalniški izračuni vseh odnosov podpirajo t. i. pojmovne preklope ( concept switching ) od grozda do grozda, potem pa od izraza do izraza. Pojmovni preklopi od grozda do grozda generirajo neki razred enakovrednih sorodnih pojmov v določeni situaciji, potem pa mapirajo določen razred enakovrednih sorodnih pojmov iz enega prostora v najbolj relevantne razrede enakovrednih pojmov v drugih prostorih. Za popolne pojmovne preklope v prihodnje bo najbrž upora- bljena tehnologija nevronskih omrežij. Prototip interspacea omogoča navigacijo čez različne ravni prostorov za dokumente, pojme in kategorije. Up- orabniki se lahko premikajo iz neke mape kategorij v pojmovni prostor, pojme, dokumente in spet nazaj od pojmov v določenem dokumentu proti višjim ravnem abstrakcije. Vmesnik predstavlja implementacijo Visu- alWords Smalltalka, uporabniki pa so v interakciji preko emulatorja, razvitega s pomočjo programske opreme Ap- plied Reasoning’s ClassicBlend, ki preoblikuje grafiko smalltalka v grafiko java in s tem omogoča, da se pokliče spletni brskalnik. Simulacija interspacea z uporabo superračunalnika je bila izvedena na repozitorijih za inženirstvo v okviru pro- jekta Illinois Digital Library (1994–1998) in za medicino (1998). Bil je narejen semantični indeks Medspace vseh zapisov v bazi Medline. Medicina je največja znanstvena disciplina. Z uporabo klasifikacije NLM Medical Subject Heading je bila zbirka razdeljena na približno 10.000 repozitorijev posameznih skupnosti na danem special- iziranem predmetnem področju. Za vsako skupnost so bili narejeni pojmovni prostori, tako da je Medspace vse- boval 400 milijonov besednih zvez znotraj 40 milijonov izvlečkov. Bruce R. Schatz (2002) napoveduje, da bo  povprečni uporabnik čez manj kot deset let rutinsko opravljal semantično indeksiranje na lastnem osebnem računalniku. Semantično indeksiranje pa se bo razvilo do te mere, da se bo onkraj pojmov in kategorij razširilo na perspektive, ki se tičejo pojmov znotraj kategorij in na situacije, ki za- devajo kategorije znotraj zbirk. Naraščajoče zmogljivosti osebnih računalnikov bodo omogočile izračune mnogo- terih odnosov. Informacijska infrastruktura bo podpirala navigacijo znotraj najširšega konteksta vseskupnega dostopnega znanja, bolj abstraktne semantične ravni pa tesnejše povezovanje pomena v naših glavah in objektov v realnem svetu. Opombe 1 Pridobljeno 29. 11. 2002 s svetovnega spleta http://citi.rice.edu/dls/dlsppt/schatz/sld002.htm. Tvrtko Šercar

RkJQdWJsaXNoZXIy MTAxMzI5