Tesaurus bat hainbat kontzepturen enuntziatuen zerrenda egituratua da, agiri-sistema bateko agirien eta sistema horretara zuzendutako galderen eduki kontzeptuala modu unibokoan adierazteko eratzen dena. Agiriak indexatzeko eta galderak formulatzeko eragiketen bitartez gauzatzen da adierazpen hori; era horretara, agirietan eta galderetan dauden kontzeptuak tesauruseko deskribatzaileen bidez azaltzen dira.
Indexatzeko eta galderak egiteko mekanismo horien beharra nabaria da, sarritan oso hizkuntza zehaztugabea erabiltzen baitute agirien egileek zein agirien bila dabiltzan erabiltzaileek:
Agiriak eta galderak indexatzeko, deskribatzaileak baino ezin dira erabili. Tesaurusean dauden ez-deskribatzaileek, berriz, deskribatzaile egokia zein den erakusten diote erabiltzaileari.
Tesaurus eleaniztunak badu beste onura bat: hainbat hizkuntzatan emandako kontzeptu berdinen arteko korrespondentziei esker, erabiltzaileak bere hizkuntzan egin ahal izango dio galdera agiri-sistemari, tesauruseko hizkuntzetako edozeinetan indexatutariko agiriak aurkitzeko.
Hauek dira, beraz, tesaurusaren osagaiak:
Deskribatzaileak, hau da, tesaurusak hartzen duen eremuko kontzeptuak anbiguotasunik gabe adierazten dituzten hitz edo esamoldeak (adibidez, "nekazaritza-sektorea").
Ez-deskribatzaileak, hau da, hizkuntza naturalean erabiltzen diren hitz edo esamoldeak: deskribatzaileek adierazitako kontzeptu berak izendatzen dituzte (adibidez, "nekazaritza- eta abeltzaintza-sektorea"/"nekazaritza-sektore"), edo kontzeptu baliokideak (adibidez, "nekazaritza"/"nekazaritza-sektore"), edota tesaurusaren hizkuntzan baliokidetzat jotzen diren kontzeptuak (adibidez, "banana"/"fruitu tropikal").
Erlazio semantikoak, hau da, terminoek esanahi aldetik dituzten erlazioak (deskribatzaile eta ez-deskribatzaileen arteko erlazioak eta deskribatzaileen arteko erlazioak).
Eurovoc tesaurusak Europako erakundeen jarduera-arlo guztiak biltzen ditu:
Eremu batzuk zabalago jorratu dira besteak baino, zentzuzkoa denez, Erkidegoaren interes-ardatzetatik gertuago daudelako. Hala, Europar Batasuneko estatu guztietako eskualdeen zerrenda dago tesaurusean, baina ez Erkidegotik kanpoko herrialdeetako eskualdeena.
Bestalde, tesaurus guztien —eta, beraz, Eurovocen— ondoko ezaugarri hau azpimarratu behar da: deskribatzaileak gai-eremuetan sailkatzeko orduan arbitrarioki jokatzen da, neurri batean. Bistan da deskribatzaile batzuk bi gai-eremutan edo gehiagotan sar litezkeela. Hala ere, tesaurus bat ondo kudeatu dadin eta tamaina egokia izan dezan, guztiek onartua da mugatu egin behar dela hierarkia anizkoitzaren fenomenoa, hots, ez dela sistematikoki sartu behar deskribatzaile bakoitza ahal den eremu guztietan. Horregatik, bi eremutan edo gehiagotan sailkatu litezkeen deskribatzaileak haietako batean bakarrik sartu ohi dira. Erabiltzaile gehienei bururatuko litzaiekeen eremua aukeratzen da normalean.
Eurovoc tesaurusa Europako Erkidegoko hizkuntza ofizialetan argitaratuta dago:
Eurovoc 4.2 Europar Batasuneko 21 hizkuntza ofizialetan dago (bulgariera, gaztelania, txekiera, daniera, alemana, estoniera, grekoa, ingelesa, frantsesa, italiera, letoniera, lituaniera, hungariera, nederlandera, poloniera, portugesa, errumaniera, eslovakiera, esloveniera, finlandiera eta suediera), eta, horrez gain, beste bi hizkuntzatan ( kroaziera eta, orain, euskara). Beste zenbait herrialdetako nazio-parlamentuek ere tesaurusaren itzulpena egin dute (Albania, Errusia eta Ukraina).
Tesauruseko hizkuntza guztiek estatutu bera dute, alegia, edozein hizkuntzatako edozein deskribatzailek badu ordaina gainerako hizkuntza guztietan.
Aldiz, ez dago baliokidetasunik hizkuntza desberdinetako ez-deskribatzaileen artean, hizkuntza bakoitzak bere ondare lexikoa duelako, eremu semantikoen arabera aldatzen dena.
Eurovoc tesaurusak zehatz-mehatz betetzen ditu Estandarizaziorako Nazioarteko Erakundeak ezarritako arau hauek:
Eurovoc tesaurusaren egitura orokorra, izan ere, bi mailatan antolaturiko sailkapen hierarkiko baten emaitza da:
Gai-eremuak, bi zifrako zenbaki batez eta enuntziatu batez izendatzen direnak, adibidez:
10 EUROPAKO ERKIDEGOAK
Mikrotesaurusak, lau zifrako zenbaki batez eta enuntziatu batez izendatzen direnak (lehenengo bi zifrek mikrotesaurusa zein gai-eremuri dagokion adierazten dute). Adibidez:
1011 ERKIDEGOAREN ZUZENBIDEA
Gai-eremuek eta mikrotesaurusek zenbaki berberak dituzte hizkuntza guztietan.
Deskribatzaileen eta ez-deskribatzaileen mailan, erlazio semantiko batzuek osatzen dute Eurovoc-en egitura:
Deskribatzaile batzuen ondoan badago ohar bat, SN (Scope Note) ikurrarekin. Ohar horiek bi helburu dituzte:
Deskribatzaile guztiek mikrotesaurus baten erreferentzia dute ondoan, MT (Mikrotesaurusa) ikurraz markaturik, deskribatzaile bakoitza zein edo zeintzuk mikrotesaurusetakoa den adierazteko.
Deskribatzaileen eta ez-deskribatzaileen arteko baliokidetasun-erlazioa honako ikur hauen bidez adierazten da:
Baliokidetasun-erlazioak zenbait erlazio mota biltzen ditu. Hauek dira azpimarragarrienak:
Deskribatzaileen arteko erlazio hierarkikoa ikur hauen bidez adierazten da:
BT (Broader Term = termino generikoa), deskribatzaile espezifiko baten eta deskribatzaile generiko baten artean kokatua. Ikurraren ondoan dagoen zenbakiak adierazten du zenbat maila hierarkiko dagoen deskribatzaile espezifikotik deskribatzaile generikora.
Oharrak:
NT (Narrower Term = termino espezifikoa), deskribatzaile generiko baten eta deskribatzaile espezifiko baten artean kokatua. Ondoan duen zenbakiak adierazten du zenbat maila hierarkiko dagoen deskribatzaile generikotik deskribatzaile espezifiko bakoitzera.
Deskribatzaileen arteko erlazio asoziatiboa RT ikurraren bidez adierazten da (Related Term = termino lotua). Uztartuta dauden bi terminoen artean dago.
Erlazio asoziatiboak zenbait erlazio mota biltzen ditu. Hauek dira azpimarragarrienak:
Erlazio asoziatiboak ezaugarri garrantzitsu batzuk ditu:
Eurovoc tesaurusak osagai hauek ditu hizkuntza guztietan:
Gai-eremuak, mikrotesaurusak, deskribatzaileak, erlazio hierarkikoak eta erlazio asoziatiboak pare-parekoak dira hizkuntza guztietan.
Oharren eta ez-deskribatzaileen kopuruak, berriz, aldatu egiten dira:
| Hizkuntza | Oharrak | Ez-deskribatzaileak |
|---|---|---|
| EUS | 883 | 7 596 |
| ES | 891 | 7 756 |
| CS | 834 | 13 139 |
| DA | 827 | 6 602 |
| DE | 728 | 8 295 |
| EL | 825 | 6 866 |
| EN | 759 | 6 769 |
| FR | 840 | 6 691 |
| IT | 754 | 9 453 |
| LV | 680 | 6 009 |
| HU | 889 | 8 618 |
| NL | 849 | 6 828 |
| PL | 17 | 172 |
| PT | 761 | 6 308 |
| SL | 27 | 150 |
| FI | 859 | 5 445 |
| SV | 818 | 6 491 |