Limpieza de datos
Limpia, estandarizar y reformatear cualquier tipo de datos
En la era del big data, los analistas de datos se encuentran limpiando los datos - el tiempo que consume tarea mundana de recopilar, preparar y limpiar datos dispares. Ofrecemos la transformada Melissa Cleanser para Pentaho y Microsoft SQL Server® Integration Services (SSIS) para ayudar a automatizar y preparar datos para el proceso de limpieza. Esto permite a los usuarios crear scripts de limpieza de datos personalizados para datos que sufren una amplia gama de errores e inconsistencias. Con este componente, los analistas de datos tienen la capacidad de estandarizar y validar listas de inventario Para preparar mejor y limpiar los datos antes del análisis.
- Limpia cualquier tipo de datos y crear un estándar más alto de calidad de datos para integracion
- Obtenga un mejor control de sus datos cuando optimizado, y ahorra tiempo y recursos de tu negocio para estandarizar los datos
- Personalizar y crear reglas para estandarizar datos
Cómo funciona el Cleanser
Cleanser transform permite a los usuarios limpiar, estandarizar y reformatear cualquier tipo de datos - desde cambiar la carcasa o el uso de mayúsculas, agregar o quitar puntuación, expandiendo o contrayendo abreviaturas, y buscando y reemplazando cualquier parte de una cuerda. La herramienta aplica diferentes operaciones de limpieza a sus esfuerzos de integración de datos y almacenamiento. La transformación tiene seis operaciones principales de limpieza:
-
• Puntuación
Añadir o quitar puntuación -
• Abreviatura
Expandir o contraer abreviaturas, por ejemplo: CA a California -
• Buscar y reemplazar
Reemplazar partes de una cuerda -
• Expresiones
Crea expresiones programáticas para dar sentido a los valores de los datos -
Regex
Usa expresiones regulares para extraer, validar, etc
¿Listo para comenzar?
Recursos útiles