IBM está trabajando para hacer más rápidas las técnicas de reconocimiento de voz en sistemas de inteligencia artificial a través de la tecnología de Inteligencia Artificial de IBM. La empresa publicó un trabajo en el que presenta un modelo en el que es posible alcanzar un entrenamiento 15-fold acelerado, sin que resulte en pérdida de precisión. La nueva técnica promete la reducción de semanas de entrenamiento para apenas unos días, llegando hasta las 11 horas, sólo.

El entrenamiento de máquina de aprendizaje 15-fold se refiere a un tipo de validación llamado K-Fold Cross Validation. Es una técnica en la que se separa la cantidad de datos para prueba y otra para entrenamiento, haciendo que usted no tenga que usar toda la cantidad de datos en ambos momentos (prueba / entrenamiento).

El número K, significa la cantidad de veces que usted necesitará ejecutar el programa para tener un sistema entrenado, en el caso, 15 veces. Esto, considerando un sistema de aprendizaje de voz para el reconocimiento de voz es muy bajo.

Lo que el nuevo proyecto de IBM propone para conseguir crear un sistema rápido, pero que mantenga la eficiencia y precisión, es descentralizar y hacer asíncronos todos los procesos. Los investigadores explican que un sistema de reconocimiento de voz como Siri, Apple o Google Asistente, necesita captar el sonido y el código para entender el sistema. A continuación, debe volver a decodificar a un formato de texto que pueda ser entendido por los seres humanos.

Lo que generalmente los sistemas hacen para disminuir el tiempo de este proceso de entrenamiento es hacer las dos cosas al mismo tiempo, lo que puede resultar en más procesamiento y menos precisión. En cambio, es posible hacer que el sistema sea más lento, para ser más preciso.

El nuevo trabajo Tecnología de Inteligencia Artificial de IBM propone el procesamiento asincrónico y descentralizado, lo que, según los investigadores, puede generar un sistema mucho más rápido, pero que no genera caída en precisión.

La técnica se denomina «asincrónico descentralizado paralelamente descentralizado descentralizado» (ADPSGD). En pruebas, fue posible ver el entrenamiento de una inteligencia artificial para reconocimiento de voz en una caída de tiempo de una semana a 11,5 horas usando sólo un sistema con 32 GPUs.

El motivo de esta velocidad se utiliza en la tecnología de Inteligencia Artificial de IBM es que, al proponer esta arquitectura, los investigadores pueden procesar más información al mismo tiempo, un paquete que se denomina «lote por lotes».

La investigación de la Tecnología de Inteligencia Artificial de IBM se presentará en breve durante la conferencia en la conferencia IEEE Internacional en Acoustics, Speech y Procesamiento de Procesos.
La tecnología de Inteligencia Artificial de IBM, es la respuesta de las solicitudes para una mayor interacción entre los humanos y los equipos, las acciones en ese sentido han sido abordadas por grandes empresas en el segmento de tecnología y conectividad.

Para saber más sobre la tecnología de Inteligencia Artificial de IBM, basta con acceder al sitio web de la empresa y acompañar.