Forest Rim Technology: Textual ETL en la cúspide de la evolución para la comprensión completa del texto del big data

31 de March de 2021 | América del Sur

SANTIAGO, Chile, 31 de marzo de 2021 /PRNewswire/ -- Si estudiamos un poco la evolución de la tecnología para el análisis de texto con el correr de los años, veremos que ha cambiado de manera muy impresionante.

Al principio sólo se podía trabajar con herramientas muy simples, y el texto se manejaba en estructuras de datos. El campo de comentarios no lograba funcionar y nació el "blob" que permitía comentarios largos y cortos, pero surgió otro problema- no se podía dar sentido a su contenido. Para hacerlo nace el "sound ex", en un intento por codificar palabras según su sonido, pero no resolvió mucho. Luego vino "stemming", o la práctica de organizar las palabras según su raíz, fue útil, pero seguía habiendo confusión.

El primer avance real y significativo viene con la práctica del etiquetado o tagging que examinaba un documento en cuanto a su contenido, seleccionando palabras relevantes. El problema fue que debía uno saber exactamente qué palabras buscar en cada documento.

El siguiente paso fue organizar el etiquetado en taxonomías y más adelante el procesamiento del lenguaje natural NLP que empieza a identificar sentimientos. Luego se descubrió que se podían utilizar algoritmos autodefinidos dando pie al Machine Learning.

Finalmente se descubrió que el procesamiento de texto era aún más importante y Textual ETL se encuentra en la cúspide de la evolución para la comprensión completa del texto.

Con esto en mente nace la empresa FOREST RIM TECHNOLOGY que cuenta con la brillante mente del padre del data warehouse Bill Inmon como su creador y fundador.

"Resulta que la proporción de data no estructurada es muy superior a la proporción de data estructurada. Sin embargo, la toma de decisiones a nivel organizacional es limitada a esta porción menor de data estructurada" -comenta Easley Edmunds, director operativo de Forest RIM Technology para Latam.

Si nos adentramos en el tema, veremos que la data no estructurada es demasiado desafiante y costosa para navegar. Más allá, las herramientas de inteligencia de negocios no son compatibles con los datos no estructurados.

Para sacar provecho y cerrar la brecha existente en el universo de datos no estructurados, se presenta el novedoso sistema Textual ETL que en palabras sencillas es la transformación de datos textuales no estructurados a un ambiente estructurado.

Este sistema, tiene diferentes funcionalidades y algoritmos para resolver los retos que surgen en el lenguaje con la resolución taxonómica, o clasificación de palabras.

Es por ello que procesar y estructurar de manera ordenada grandes volúmenes de datos e información, proveniente de audios, videos, redes sociales, documentación, correos electrónicos, entre otros, ahora es posible.

Para más información: https://www.forestrimtech.com
https://www.linkedin.com/company/forestrim

Foto - https://mma.prnewswire.com/media/1478910/Forest_Rim_Technology_Big_Data.jpg
Logo - https://mma.prnewswire.com/media/1478909/Forest_Rim_Technology_Logo.jpg

FUENTE Forest Rim Technology

Compartir: