International Organization for Standardization (ISO)
Ultima versión
ISO 28500:2017
Alcance
Este documento especifica el formato de archivo WARC:
——para almacenar tanto el contenido de la carga útil como la información de control de los principales protocolos de capa de aplicación de Internet, como HTTP, DNS y FTP;
——almacenar metadatos arbitrarios vinculados a otros datos almacenados (por ejemplo, clasificador de materias, idioma descubierto, codificación);
——soportar la compresión de datos y mantener la integridad de los registros de datos;
——almacenar toda la información de control del protocolo de recolección (por ejemplo, encabezados de solicitud), no sólo la información de respuesta;
——almacenar los resultados de transformaciones de datos vinculados a otros datos almacenados;
——almacenar un evento de detección duplicado vinculado a otros datos almacenados (para reducir el almacenamiento en presencia de recursos idénticos o sustancialmente similares);
——ampliarse sin alterar la funcionalidad existente;
——para soportar el manejo de registros demasiado largos mediante truncamiento o segmentación, cuando se desee.
ISO 28500:2017 Historia
2017ISO 28500:2017 Información y documentación: formato de archivo WARC
2009ISO 28500:2009 Información y documentación: formato de archivo WARC