saltar al contenido

Logo de la Diputación
 
 

Estás en:

Presentación del tesauro

Información

  1. Objetivos de un tesauro
  2. Campos temáticos
  3. Versiones lingüísticas y normas utilizadas
  4. Estructura
    1. Campos temáticos y microtesauros
    2. Relaciones semánticas
      1. Notas de aplicación y definición
      2. Relación de pertenencia a un microtesauro
      3. Relación de equivalencia
      4. Relación jerárquica
      5. Relación asociativa
  5. Características cuantitativas

1. Objetivos de un tesauro

Un tesauro de descriptores es una lista estructurada de enunciados de conceptos. Dichos enunciados pretenden representar de forma unívoca el contenido conceptual de los documentos y de las preguntas en un sistema documental. Esta representación se efectúa mediante operaciones de indización de documentos y de formulación de preguntas, de tal forma que los conceptos correspondientes tanto a los primeros como a las segundas se expresan a través de los descriptores del tesauro.

La necesidad de recurrir a esos mecanismos de indización e interrogación se hace patente si se tiene en cuenta que el lenguaje utilizado libremente, tanto por parte de los autores del material documental como de los usuarios que pretenden encontrar los documentos, es a menudo muy ambiguo:

  • El mismo concepto puede expresarse mediante varios sinónimos o términos muy próximos (por ejemplo, agricultura, sector agrario, sector agropecuario). Sería imposible encontrar un documento indizado bajo cualquiera de esos términos a partir de una pregunta referente a uno de sus sinónimos. Así pues, uno de los cometidos fundamentales del tesauro consiste en evitar los inconvenientes derivados de la sinonimia: se escoge, de forma más o menos arbitraria, uno de los sinónimos como descriptor; y a los demás sinónimos, o términos que designan conceptos muy próximos al que representa el descriptor, se les confiere el estatuto de no-descriptores.

    Para indizar los documentos y las preguntas, únicamente pueden utilizarse los descriptores. Los no-descriptores que se incluyen en el tesauro indican al usuario cuál es el descriptor adecuado.

    Un tesauro multilingüe ofrece otra ventaja: las correspondencias entre conceptos idénticos expresados en diferentes lenguas permiten interrogar un sistema documental en la propia lengua del usuario y encontrar los documentos indizados en cualquiera de las lenguas del tesauro.

  • Un término puede tener significados distintos (por ejemplo, prensa puede significar máquina para comprimir o, en sentido figurado, imprenta, o también conjunto o generalidad de las publicaciones periódicas y especialmente las diarias, o conjunto de personas dedicadas al periodismo [DRAE]). La interrogación de un término homónimo remitiría a documentos sin ninguna relación con el tema que interesa al usuario. Otro de los cometidos fundamentales del tesaruro consiste, pues, en evitar los inconvenientes derivados de la homonimia: todos los descriptores se sitúan en un contexto determinado, de forma que su significado es unívoco.

Estos son, por tanto, los elementos constitutivos del tesauro:

  • Descriptores, es decir: palabras o expresiones que designan sin ambigüedad los conceptos constitutivos del área cubierta por el tesauro (por ejemplo, sector agrario).

  • No-descriptores, es decir: palabras o expresiones que designan, en lenguaje natural, el mismo concepto (por ejemplo, sector agropecuario/sector agrario) o conceptos equivalentes (por ejemplo, agricultura/sector agrario) o considerados equivalentes, en el lenguaje del tesauro, a los conceptos que representan los descriptores (por ejemplo, plátano/fruto tropical).

  • Relaciones semánticas, es decir: vinculadas al sentido de los términos (relaciones entre descriptores y no-descriptores y relaciones de los descriptores entre sí).

subir

2. Campos temáticos

El Tesauro Eurovoc cubre todas las áreas de actividad de las instituciones europeas:

  • Vida política
  • Relaciones internacionales
  • Comunidades Europeas
  • Derecho
  • Vida económica
  • Intercambios económicos y comerciales
  • Asuntos financieros
  • Asuntos sociales
  • Educación y comunicación
  • Ciencia
  • Empresa y competencia
  • Trabajo y empleo
  • Transportes
  • Medio ambiente
  • Agricultura, silvicultura y pesca
  • Sector agroalimentario
  • Producción, tecnología e investigación
  • Energía
  • Industria
  • Geografía
  • Organizaciones internacionales

Como es natural, algunos campos presentan un mayor desarrollo relativo, en la medida en que se encuentran más cerca de los ejes de interés comunitario. Así, el Tesauro incluye una lista de regiones de todos los Estados miembros de la Unión Europea, pero ignora las regiones de los países no comunitarios.

Por lo demás, conviene insistir en una de las características de los tesauros en general y de Eurovoc en particular: la división del conjunto de descriptores en campos temáticos es, en cierta medida, arbitraria. Es evidente que algunos descriptores podrían pertenecer a dos o varios campos temáticos. Ahora bien, se admite comúnmente que la correcta gestión de un tesauro y el razonable acotamiento de su volumen imponen una limitación del fenómeno de la polijerarquía, es decir, la inclusión sistemática de cada descriptor en todos los campos a los que podría pertenecer. Por ello, los descriptores que podrían incluirse en dos o varios campos se asignan normalmente a uno solo de ellos, que suele ser el que la mayoría de los usuarios considera más natural.

subir

3. Versiones lingüísticas y normas utilizadas

El Tesauro Eurovoc se publica en las lenguas oficiales de la Comunidad Europea lenguas:

Eurovoc 4.2 existe en las 21 lenguas oficiales de la Unión Europea (búlgaro, español, checo, danés, alemán, estonio, griego, inglés, francés, italiano, letón, lituano, húngaro, neerlandés, polaco, portugués, rumano, eslovaco, esloveno, finés y sueco) y otras dos lenguas (croata y, ahora, euskera). Además de las versiones mencionadas, Eurovoc ha sido traducido por los parlamentos nacionales de algunos otros países (Albania, Rusia y Ucrania).

Todas las lenguas del Tesauro tienen el mismo estatuto, es decir: a cualquier descriptor en cualquiera de la lenguas le corresponde un descriptor en todas las demás.

No hay, por el contrario, equivalencia entre los no-descriptores de las diferentes lenguas, ya que cada una de ellas se caracteriza precisamente por una riqueza léxica que varía según los campos semánticos.

El Tesauro Eurovoc sigue estrictamente las normas establecidas por la Organización Internacional de Normalización, a saber:

  • ISO 2788-1986 - Guidelines for the establishment and development of monolingual thesauri
  • ISO 5964-1985 - Guidelines for the establishment and development of multilingual thesauri

subir

4. Estructura

4.1. Campos temáticos y microtesauros

En el plano genérico, el Tesauro Eurovoc presenta una estructura formada por una clasificación jerárquica organizada, a su vez, en dos niveles, a saber:

  • Campos temáticos, identificados por un número de dos dígitos y un enunciado, ejemplo:

    10 COMUNIDADES EUROPEAS

  • Microtesauros, identificados por un número de cuatro dígitos 3/4 de tal forma que los dos primeros corresponden al campo temático al cual pertenece el microtesauro3/4 y un enunciado, ejemplo:

    1011 DERECHO COMUNITARIO

La numeración de los campos temáticos y de los microtesauros es idéntica en todas las versiones lingüísticas.

subir

4.2. Relaciones semánticas

En el plano específico de los descriptores y no-descriptores, el Tesauro Eurovoc presenta una estructura formada por relaciones semánticas, a saber:

  • Notas de aplicación y definición
  • Relaciones de pertenencia a un microtesauro
  • Relaciones de equivalencia
  • Relaciones jerárquicas
  • Relaciones asociativas

subir

4.2.1. Notas de aplicación y definición

Algunos descriptores van acompañados de una nota, introducida por el símbolo SN (Scope Note). Las notas tienen una doble función:

  • Precisar el sentido del correspondiente descriptor (nota de definición)
  • Determinar los supuestos de utilización del correspondiente descriptor en las operaciones de indización e interrogación (nota de aplicación)

subir

4.2.2. Relación de pertenencia a un microtesauro

Para indicar a qué microtesauro o microtesauros pertenecen, todos los descriptores van acompañados de una relación de pertenencia, introducida por el símbolo MT (Microtesauro).

4.2.3. Relación de equivalencia

La relación de equivalencia entre descriptores y no-descriptores se indica mediante los siguientes símbolos:

  • UF(Used For = usado por), situado entre el descriptor y el no-descriptor o no-descriptores que representa
  • USE(= utilícese), situado entre un no-descriptor y el descriptor que lo representa

La relación de equivalencia engloba, en realidad, varios tipos de relaciones, entre las que cabe destacar:

  • La sinonimia total (es decir: la identidad de sentido)
  • La cuasi-sinonimia (es decir: la proximidad de sentido)
  • La antonimia (es decir: la oposición de sentido)
  • La inclusión (es decir: un determinado descriptor engloba uno o varios conceptos específicos, a los que se confiere el estatuto de no-descriptores porque su uso es menos frecuente)

subir

4.2.4. Relación jerárquica

La relación jerárquica entre descriptores se indica mediante los siguientes símbolos:

  • BT (Broader Term = término genérico), situado entre un descriptor específico y un descriptor genérico y acompañado de una cifra que indica el número de niveles jerárquicos entre el descriptor específico y cada uno de los descriptores genéricos que le corresponden.

    Observaciones:

    1. Los descriptores que no tienen términos genéricos se denominan cabezas de jerarquía o cabeceras de serie de una jerarquía (top terms).
    2. Algunos descriptores de los campos temáticos 72 (Geografía) y 76 (Organizaciones internacionales) son polijerárquicos, es decir: tienen varios términos genéricos de primer nivel.
  • NT (Narrower Term = término específico), situado entre un descriptor genérico y un descriptor específico y acompañado de una cifra que indica el número de niveles jerárquicos entre el descriptor genérico y cada uno de sus descriptores específicos.

subir

4.2.5. Relación asociativa

La relación asociativa entre descriptores se indica mediante el símbolo RT (Related Term = término asociado), situado entre dos descriptores asociados.

La relación asociativa engloba, en realidad, varios tipos de relaciones, entre las que cabe destacar las siguientes:

  • Causa y efecto
  • Instrumentalidad
  • Jerarquía (en las campos en los que no se admite la multiplicidad, según lo descrito en el segundo punto, en lugar de relaciones jerárquicas se utilizan relaciones asociativas para ayudar al usuario)
  • Concomitancia
  • Sucesión en el tiempo o el espacio
  • Relación con elementos constitutivos
  • Relación de propiedad
  • Objeto de una acción, proceso o disciplina
  • Localización
  • Similitud (cuando se ha conferido la categoría de descriptores a términos prácticamente sinónimos)
  • Antinomia

La relación asociativa presenta una serie de características importantes, a saber:

  • Simetría
  • Incompatibilidad con la relación jerárquica: si dos descriptores están vinculados por una relación jerárquica, no puede unirlos una relación asociativa, y viceversa
  • Los descriptores situados bajo un mismo top term no pueden estar unidos por una relación asociativa.

subir

5. Características cuantitativas

Todas las versiones lingüísticas del Tesauro Eurovoc están constituidas por los siguientes elementos:

  • 21 campos temáticos
  • 127 microtesauros
  • 6645 descriptores, 519 de los cuales son top terms
  • 6669 relaciones jerárquicas recíprocas (a saber: 6669 BT y 6669 NT)
  • 3636 relaciones asociativas recíprocas

Los campos temáticos, los microtesauros, los descriptores, las relaciones jerárquicas y las relaciones asociativas son rigurosamente equivalentes en todas las lenguas.

Por el contrario, el número de notas y no-descriptores no coincide en las diferentes lenguas:

Notas y no-descriptores por lengua
Lenguas Notas No-descriptores
EUS 883 7 596
ES 891 7 756
CS 834 13 139
DA 827 6 602
DE 728 8 295
EL 825 6 866
EN 759 6 769
FR 840 6 691
IT 754 9 453
LV 680 6 009
HU 889 8 618
NL 849 6 828
PL 17 172
PT 761 6 308
SL 27 150
FI 859 5 445
SV 818 6 491

subir