Estás en:
Un tesauro de descriptores es una lista estructurada de enunciados de conceptos. Dichos enunciados pretenden representar de forma unívoca el contenido conceptual de los documentos y de las preguntas en un sistema documental. Esta representación se efectúa mediante operaciones de indización de documentos y de formulación de preguntas, de tal forma que los conceptos correspondientes tanto a los primeros como a las segundas se expresan a través de los descriptores del tesauro.
La necesidad de recurrir a esos mecanismos de indización e interrogación se hace patente si se tiene en cuenta que el lenguaje utilizado libremente, tanto por parte de los autores del material documental como de los usuarios que pretenden encontrar los documentos, es a menudo muy ambiguo:
Para indizar los documentos y las preguntas, únicamente pueden utilizarse los descriptores. Los no-descriptores que se incluyen en el tesauro indican al usuario cuál es el descriptor adecuado.
Un tesauro multilingüe ofrece otra ventaja: las correspondencias entre conceptos idénticos expresados en diferentes lenguas permiten interrogar un sistema documental en la propia lengua del usuario y encontrar los documentos indizados en cualquiera de las lenguas del tesauro.
Estos son, por tanto, los elementos constitutivos del tesauro:
Descriptores, es decir: palabras o expresiones que designan sin ambigüedad los conceptos constitutivos del área cubierta por el tesauro (por ejemplo, sector agrario).
No-descriptores, es decir: palabras o expresiones que designan, en lenguaje natural, el mismo concepto (por ejemplo, sector agropecuario/sector agrario) o conceptos equivalentes (por ejemplo, agricultura/sector agrario) o considerados equivalentes, en el lenguaje del tesauro, a los conceptos que representan los descriptores (por ejemplo, plátano/fruto tropical).
Relaciones semánticas, es decir: vinculadas al sentido de los términos (relaciones entre descriptores y no-descriptores y relaciones de los descriptores entre sí).
El Tesauro Eurovoc cubre todas las áreas de actividad de las instituciones europeas:
Como es natural, algunos campos presentan un mayor desarrollo relativo, en la medida en que se encuentran más cerca de los ejes de interés comunitario. Así, el Tesauro incluye una lista de regiones de todos los Estados miembros de la Unión Europea, pero ignora las regiones de los países no comunitarios.
Por lo demás, conviene insistir en una de las características de los tesauros en general y de Eurovoc en particular: la división del conjunto de descriptores en campos temáticos es, en cierta medida, arbitraria. Es evidente que algunos descriptores podrían pertenecer a dos o varios campos temáticos. Ahora bien, se admite comúnmente que la correcta gestión de un tesauro y el razonable acotamiento de su volumen imponen una limitación del fenómeno de la polijerarquía, es decir, la inclusión sistemática de cada descriptor en todos los campos a los que podría pertenecer. Por ello, los descriptores que podrían incluirse en dos o varios campos se asignan normalmente a uno solo de ellos, que suele ser el que la mayoría de los usuarios considera más natural.
El Tesauro Eurovoc se publica en las lenguas oficiales de la Comunidad Europea lenguas:
Eurovoc 4.2 existe en las 21 lenguas oficiales de la Unión Europea (búlgaro, español, checo, danés, alemán, estonio, griego, inglés, francés, italiano, letón, lituano, húngaro, neerlandés, polaco, portugués, rumano, eslovaco, esloveno, finés y sueco) y otras dos lenguas (croata y, ahora, euskera). Además de las versiones mencionadas, Eurovoc ha sido traducido por los parlamentos nacionales de algunos otros países (Albania, Rusia y Ucrania).
Todas las lenguas del Tesauro tienen el mismo estatuto, es decir: a cualquier descriptor en cualquiera de la lenguas le corresponde un descriptor en todas las demás.
No hay, por el contrario, equivalencia entre los no-descriptores de las diferentes lenguas, ya que cada una de ellas se caracteriza precisamente por una riqueza léxica que varía según los campos semánticos.
El Tesauro Eurovoc sigue estrictamente las normas establecidas por la Organización Internacional de Normalización, a saber:
En el plano genérico, el Tesauro Eurovoc presenta una estructura formada por una clasificación jerárquica organizada, a su vez, en dos niveles, a saber:
Campos temáticos, identificados por un número de dos dígitos y un enunciado, ejemplo:
10 COMUNIDADES EUROPEAS
Microtesauros, identificados por un número de cuatro dígitos 3/4 de tal forma que los dos primeros corresponden al campo temático al cual pertenece el microtesauro3/4 y un enunciado, ejemplo:
1011 DERECHO COMUNITARIO
La numeración de los campos temáticos y de los microtesauros es idéntica en todas las versiones lingüísticas.
En el plano específico de los descriptores y no-descriptores, el Tesauro Eurovoc presenta una estructura formada por relaciones semánticas, a saber:
Algunos descriptores van acompañados de una nota, introducida por el símbolo SN (Scope Note). Las notas tienen una doble función:
Para indicar a qué microtesauro o microtesauros pertenecen, todos los descriptores van acompañados de una relación de pertenencia, introducida por el símbolo MT (Microtesauro).
La relación de equivalencia entre descriptores y no-descriptores se indica mediante los siguientes símbolos:
La relación de equivalencia engloba, en realidad, varios tipos de relaciones, entre las que cabe destacar:
La relación jerárquica entre descriptores se indica mediante los siguientes símbolos:
BT (Broader Term = término genérico), situado entre un descriptor específico y un descriptor genérico y acompañado de una cifra que indica el número de niveles jerárquicos entre el descriptor específico y cada uno de los descriptores genéricos que le corresponden.
Observaciones:
NT (Narrower Term = término específico), situado entre un descriptor genérico y un descriptor específico y acompañado de una cifra que indica el número de niveles jerárquicos entre el descriptor genérico y cada uno de sus descriptores específicos.
La relación asociativa entre descriptores se indica mediante el símbolo RT (Related Term = término asociado), situado entre dos descriptores asociados.
La relación asociativa engloba, en realidad, varios tipos de relaciones, entre las que cabe destacar las siguientes:
La relación asociativa presenta una serie de características importantes, a saber:
Todas las versiones lingüísticas del Tesauro Eurovoc están constituidas por los siguientes elementos:
Los campos temáticos, los microtesauros, los descriptores, las relaciones jerárquicas y las relaciones asociativas son rigurosamente equivalentes en todas las lenguas.
Por el contrario, el número de notas y no-descriptores no coincide en las diferentes lenguas:
Lenguas | Notas | No-descriptores |
---|---|---|
EUS | 883 | 7 596 |
ES | 891 | 7 756 |
CS | 834 | 13 139 |
DA | 827 | 6 602 |
DE | 728 | 8 295 |
EL | 825 | 6 866 |
EN | 759 | 6 769 |
FR | 840 | 6 691 |
IT | 754 | 9 453 |
LV | 680 | 6 009 |
HU | 889 | 8 618 |
NL | 849 | 6 828 |
PL | 17 | 172 |
PT | 761 | 6 308 |
SL | 27 | 150 |
FI | 859 | 5 445 |
SV | 818 | 6 491 |
© Bizkaiko Foru Aldundia - Diputación Foral de Bizkaia