vidal mayor

La palabra tesauro proviene del latín “thesaurus” (tesoro) y esta a su vez del término griego θησαυρός thēsaurós, con el significado de colección. Más tarde las lenguas modernas comenzaron a utilizar el término tesauro para referirse a repertorios de palabras o colecciones de una o varias áreas del conocimiento.

En España aparece por primera vez la palabra thesaurus en la obra «Compilatio Maior o itt excelsis Dei Thesaurus«, compilación realizada por el jurista Vidal de Cañellas en el siglo XIII.

Los primero tesauros comienzan a aparecer en España a finales de la década de los años 70:

  • Thesaurus Textil Internacional, publicado en 1971, traducción del Thesaurus del Instituto de Tecnología de Massachusetts publicado en Estados Unidos en 1966.
  • Tesauro de Ciencias de la Información, realizado por Antonio García Gutiérrez, fue el primero elaborado y publicado en nuestro país. Forma parte de la tesis doctoral del autor: «Propuesta de tesauro español de las Ciencias de la Información», presentada en 1982 y dirigida por el profesor López Yepes.

¿Qué son los tesauros?

Los tesauros son  vocabularios controlados y estructurados formalmente, formados por términos que guardan entre sí relaciones semánticas y genéricas: de equivalencia, jerárquicas y asociativas. Se trata de un instrumento de control terminológico que permite convertir el lenguaje natural de los documentos en un lenguaje controlado, ya que representa, de manera unívoca, el contenido de estos, con el fin de servir tanto para la indización, como para la recuperación de los documentos.

Su misión es facilitar al usuario el acceso a la información contenida en bases de datos bibliográficas, textos, museos, colecciones multimedia, bibliotecas, portales y otras bases de conocimiento.

De manera resumida los tesauros basan su estructura en los siguientes elementos:

UNIDADES LÉXICAS que agrupan los términos de indización por temas o por clases de términos:

  • Descriptores o términos permitidos: Un descriptor es una palabra o conjunto de palabras que representan un único concepto que será el utilizado para el análisis y recuperación del documento.
  • No descriptores o términos no aceptados. Al elegir un único término para eliminar la sinonimia del lenguaje natural, se rechazan los términos restantes, que serán los no descriptores.

RELACIONES SEMÁNTICAS que se establecen entre los distintos términos del tesauro:

  • Relaciones de equivalencia: por proximidad fonética o sémica entre los descriptores y no descriptores (sinónimos, cuasi-sinónimos, etc). Se suelen representar mediante las referencias:
    • USE: Reenvía del término no descriptor (no aceptado) al término descriptor (aceptado). Ejemplo:
      Revistas. USE Publicaciones periódicas
    • UP (Usado por): Conecta el término descriptor con el no descriptor. Ejemplo:
      Publicaciones periódicas. UP Revistas
  • Relaciones jerárquicas: son relaciones asimétricas, establecidas entre los descriptores, en la que un término es superior o genérico de otro. Para la presentación de las relaciones jerárquicas se suelen utilizar determinadas siglas como T.G. (Término Genérico) y T.E. (Término Específico).
  • Relaciones asociativas: son las relaciones asimétricas establecidas entre descriptores de distintas familias, distintas a las jerárquicas o de equivalencia, y que designan conceptos capaces de evocar mutuamente, por asociación de ideas, relaciones entre ellos. Este tipo de relación se suele representar mediante las siglas T.R. (Término Relacionado). La mayoría de las relaciones asociativas se establecen entre términos que comparten un lexema común o que mantienen unas relaciones de hiperonimia o hiponimia.

Algunos ejemplos de tesauros

  • SKOS Tesauro de la UNESCO. Lista controlada y estructurada de términos para el análisis temático y la búsqueda de documentos y publicaciones en los campos de la educación, cultura, ciencias naturales, ciencias sociales y humanas, comunicación e información.
  • Tesauros de CER.es Colecciones en Red. Tesauros-Diccionarios del patrimonio cultural de España mediante el enlace directo a las publicaciones y a su consulta en línea.
  • Tesauro de biblioteconomía y documentación (CINDOC). Cuenta en total con 1153 términos, de los que 914 son términos preferentes y 239 son no preferentes. Consta de un índice alfabético, otro jerárquico y un tercero permutado tipo KWOC. Se puede consultar en línea o descargar en pdf.
  • Tesauro Digital Complutense (TDC). Universidad Complutense de Madrid.

Fuente:

GIL URDIACIAíN, B. Orígenes y evolución de los tesauros en España. Revista General de Información y Documentación, 1998. Disponible en: (https://revistas.ucm.es/index.php/RGID/article/view/RGID9898120063A)

Lamarca Lapuente, María Jesús. Tesauros. Hipertexto: El nuevo concepto de documento en la cultura de la imagen. (http://www.hipertexto.info/documentos/tesauros.htm)

Imagen: Vidal Mayor. Manuscrito con la compilación de los Fueros de Aragón.

Esta entrada es la respuesta a la pregunta semanal del Test mínimo:

La referencia USE en un Tesauro:
A. Reenvía del término no descriptor al término descriptor.
B. Reenvía del término aceptado al no aceptado.
C. Conecta un término descriptor a otro descriptor más general.
D. Cumple la misma función que la referencia UP: reenvía del término no aceptado al aceptado.