T/BDAEA 003-2023
Requisitos técnicos para la interacción multimodal hombre-máquina (Versión en inglés)

Estándar No.
T/BDAEA 003-2023
Idiomas
Chino, Disponible en inglés
Fecha de publicación
2023
Organización
Group Standards of the People's Republic of China
Ultima versión
T/BDAEA 003-2023
Alcance
Este documento estipula los términos, definiciones, métodos de prueba, estándares de prueba y requisitos técnicos de la tecnología de interacción multimodal persona-computadora en el entorno, asegurando la facilidad de uso, confiabilidad e interoperabilidad del sistema interactivo y brindando a los usuarios más inteligencia y comodidad y ambiente de viaje confortable. Esta sección es aplicable a escenarios de interacción multimodal persona-computadora en metro, centros comerciales, bancos, estacionamientos subterráneos, etc. 5.4.1 Requisitos técnicos (1) Tener capacidades de reconocimiento de voz de palabras clave. En un entorno de poco ruido (la intensidad del ruido es inferior a 50 dB), la precisión de las palabras del reconocimiento de voz de palabras clave debe ser superior al 90%; en un entorno de mucho ruido En un entorno (la intensidad del ruido está entre 60 dB y 65 dB), la tasa de precisión de palabras del reconocimiento de voz de palabras clave debe ser superior al 85 %. La definición del indicador de rendimiento de la tasa de precisión de palabras se define en GB/T21023-2007 y solo puede identificar palabras clave y proporcionar servicios específicos basados en ellas. (2) Tener capacidades continuas de reconocimiento de voz. En un entorno con poco ruido (la intensidad del sonido es inferior a 50 dB), la precisión de las palabras del reconocimiento continuo de voz debe ser superior al 85%: en un entorno con mucho ruido (la intensidad del ruido está entre 60 dB ~65 dB), la tasa de precisión de palabras del reconocimiento de voz continuo es superior al 80 %. La definición del indicador de rendimiento de la tasa de precisión de palabras se define en GB/T21023-2007 y solo puede identificar palabras clave y proporcionar servicios específicos basados en ellas. (3) Los requisitos de reconocimiento de voz digital del sistema inteligente de interacción de voz de servicio al cliente incluyen: debe admitir reconocimiento y servicios digitales, debe admitir ejemplos de reconocimiento de diferentes expresiones digitales y la tasa de precisión debe ser superior al 99%. 5.5 Localización de la fuente de sonido 5.5.1 Requisitos técnicos (1) Precisión de posicionamiento: Error angular máximo: El error angular máximo entre el resultado del posicionamiento y la posición real de la fuente de sonido no debe exceder ±5°. (2) Error de distancia espacial máximo: el error de distancia espacial máximo entre el resultado del posicionamiento y la ubicación real de la fuente de sonido no deberá exceder los 0,5 metros. (3) Respuesta dinámica: el sistema debe completar el posicionamiento de la fuente de sonido y generar el resultado dentro de los 1000 milisegundos después de que cambie la posición de la fuente de sonido. (4) Tiempo real: el retraso de respuesta de posicionamiento de la fuente de sonido del sistema no debe exceder los 500 milisegundos. 5.5.2 Requisitos de la prueba (1) Prueba del método de diferencia de tiempo: utilice múltiples conjuntos de micrófonos en miniatura para registrar simultáneamente el momento en que la señal de la fuente de sonido llega a cada micrófono y determine la dirección de la fuente de sonido calculando la diferencia de tiempo. (2) Prueba del método de diferencia de amplitud: utilice múltiples conjuntos de micrófonos en miniatura para registrar simultáneamente la diferencia de amplitud de la señal de la fuente de sonido que llega a cada micrófono y determine la dirección de la fuente de sonido calculando la diferencia de amplitud. (3) Prueba de formación de haces: utilice el algoritmo de formación de haces y varios micrófonos para probar la precisión y solidez del algoritmo para la localización de fuentes de sonido. (4) Prueba de seguimiento de la fuente de sonido: pruebe la capacidad del sistema de posicionamiento de la fuente de sonido para rastrear fuentes de sonido en movimiento, incluidos los cambios en la velocidad y aceleración de la fuente de sonido.

T/BDAEA 003-2023 Historia

  • 2023 T/BDAEA 003-2023 Requisitos técnicos para la interacción multimodal hombre-máquina



© 2023 Reservados todos los derechos.