Este estándar internacional especifica el formato de archivo WARC:
——para almacenar tanto el contenido de la carga útil como la información de control de los principales protocolos de capa de aplicaciones de Internet, como HTTP, DNS y FTP;
——para almacenar metadatos arbitrarios vinculados a otros datos almacenados (por ejemplo, clasificador de materias, lenguaje descubierto, codificación);
——para soportar la compresión de datos y mantener la integridad del registro de datos;
——para almacenar toda la información de control del protocolo de recolección (por ejemplo, encabezados de solicitud), no solo información de respuesta;
——para almacenar los resultados de las transformaciones de datos vinculados a otros datos almacenados datos;
——para almacenar un evento de detección duplicado vinculado a otros datos almacenados (para reducir el almacenamiento en el
DS/ISO 28500:2009 Historia
2009DS/ISO 28500:2009 Información y documentación: formato de archivo WARC