Por favor utiliza este link para citar o compartir este documento: http://repositoriodigital.academica.mx/jspui/handle/987654321/14968
Título: Compression Algorithms for the Storage of Bibliographic Information (First of two parts)
Algoritmo de compresión para el almacenamiento de información bibliográfica (primera de dos partes)
Autores: 
Palabras clave: DATABASES; INDEX AUTOMATION; ALGORITHMS
BASES DE DATOS; AUTOMATIZACION DE INDICES; ALGORITMOS
Fecha de publicación: 13-Sep-2011
Editorial: Centro Universitario de Investigaciones Bibliotecológicas
Descripción: BIBLIOGRAPHICAL DATA BASES WHICH HAVE BEEN DEVELOPED IN PC COMPUTERS HAVE BEEN LIMITED REGARDING TOTAL NUMBER OF FICHES AND THEIR PERFORMANCE DUE TO THE SIZE OF THE PLATFORM IN WHICH THOSE DATA BASES ARE DEVELOPED AND INSTALLED. COMMERCIAL PC DATA BASE MANAGEMENT SOFTWARE HAVE BEEN CONSTRUCTED WITH A GENERAL APPROACH, THINKING IN STANDARD APPLICATIONS, AND DO NOT CONSIDER THE PARTICULAR FEATURE OF THE BIBLIOGRAPHIC INFORMATION. THUS, THEY DECREASE IN PERFORMANCE EXPONENTIALLY IN RELATION WITH THE SIZE OF THE DATA BASE. IN THIS FIRST PART OF THE SURVEY, THE PROBLEMS ARE DISCUSSED, AS WELL AS THOSE TYPICAL FEATURES OF THE BIBLIOGRAPHIC INFORMATION REGARDING TO ITS INCLUSION IN COMPUTARIZED DATA BASES. A BIBLIOGRAPHIC DATA COMPRESSION MODEL IS INTRODUCED AS AN ALGORITHM, ALLOWING BETWEEN 40 AND 70 % OF COMPRESSION RATE WITHOUT LOSING INFORMATION QUALITY. IN THE SECOND DOCUMENT, PROCEDURES FOR CREATION AND COMPRESSION OF PRECONSTRUCTED INDEXES WILL BE PRESENTED, AS WELL AS RETRIEVAL FILES FOR WORD FREE-SEARCHING. SOME TECHNIQUES FOR CREATION AND RETRIEVAL OF BOTH ACCESS PATHS WILL BE FULLY DISCUSSED. IN THAT PART THE FINAL CONCLUSION SHOWS THAT DATA BASES WITH SEVERAL HUNDREDS OF THOUSANDS OF RECORDS OWNING SEVERAL MILLIONS OF RETRIEVAL WORDS CAN BE COMPRESSED TO THE AVAILABLE SPACE OF A CD- ROM (650 MB), AND EVEN EXPANDED TO GREATER FIGURES.
LOS BANCOS DE DATOS BIBLIOGRÁFICOS DESARROLLADOS EN COMPUTADORAS DE TIPO PERSONAL SE HAN VISTO LIMITADOS EN CUANTO AL NUMERO DE FICHAS Y POR SU RENDIMIENTO EN FUNCIÓN DEL TAMAÑO DE LA PLATAFORMA EN DONDE SE DESARROLLAN E INSTALAN. LOS MANEJADORES COMERCIALES DE BASE DE DATOS PARA ESTOS EQUIPOS HAN SIDO CONSTRUIDOS DE ACUERDO CON NECESIDADES DE TIPO GENERAL EN EL MERCADO Y NO CONTEMPLAN LAS CARACTERÍSTICAS PROPIAS DE LA INFORMACIÓN BIBLIOGRÁFICA, POR LO QUE DECRECE SU RENDIMIENTO RÁPIDAMENTE EN FUNCIÓN AL TAMAÑO DEL BANCO DE DATOS. EN ESTA PRIMERA PARTE DEL DOCUMENTO SE ANALIZA ESA PROBLEMÁTICA Y LAS CARACTERÍSTICAS PROPIAS DE LA INFORMACIÓN BIBLIOGRÁFICA EN LO TOCANTE A SU INCLUSIÓN EN BANCOS DE DATOS ELECTRÓNICOS, Y SE PRESENTA UN MODELO DE COMPRESIÓN DE DATOS BIBLIOGRÁFICOS EN FORMA DE ALGORITMO QUE PERMITE ENTRE UN 40% Y 70% DE COMPRESIÓN SIN MENOSCABAR LAS CARACTERÍSTICAS PROPIAS DE LA INFORMACIÓN BIBLIOGRÁFICA. EN LA SEGUNDA PARTE DEL DOCUMENTO SE PRESENTAN LAS TÉCNICAS PARA CREAR Y COMPRIMIR ÍNDICES PRECONSTRUIDOS DE RECUPERACIÓN Y ARCHIVOS DE RECUPERACIÓN POR PALABRAS EN BÚSQUEDA LIBRE, ASÍ COMO LAS TÉCNICAS PARA ACCEDERLOS Y SERLE PRESENTADOS AL USUARIO FINAL. EN ESA PARTE SE CONCLUYE QUE BANCOS DE DATOS DE CIENTOS DE MILES DE FICHAS Y MILLONES DE PALABRAS DE RECUPERACIÓN PUEDEN COMPRIMIRSE EN EL ESPACIO DE UN CD-ROM (650MEGABYTES), Y AUN EXTRAPOLARSE ESTOS VALORES A COSTAS MUCHOS MAYORES.
Other Identifiers: http://revistas.unam.mx/index.php/ibi/article/view/3975
Aparece en las Colecciones:Investigación Bibliotecológica

Archivos de este documento:
No hay archivos asociados a este documento.


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.