ANEXO 6
Auditoría de datos disponibles
Este anexo corresponde a la Fase 0 — Análisis previo, etapa “Auditoría de datos disponibles” y también se conecta con la etapa “Mapa de datos disponibles” de la tabla maestra FARO Connect. En la tabla, esta etapa busca saber qué datos existen, cuáles faltan y cuáles son confiables, usando como base el Diccionario FARO de datos mínimos por módulo, estimado inicialmente en 250 a 400 campos base.
1. Objetivo del anexo
El objetivo de la Auditoría de datos disponibles es determinar si la empresa tiene la información necesaria para que FARO Connect pueda funcionar con seriedad.
No alcanza con que la empresa diga:
“Tenemos ERP.” “Tenemos Excel.” “Tenemos reportes.” “Tenemos todo cargado.”
Eso no significa nada todavía.
FARO debe verificar:
Qué datos existen.
Dónde están.
Quién los carga.
Cada cuánto se actualizan.
Qué tan completos son.
Qué tan confiables son.
Qué campos faltan.
Qué datos están duplicados.
Qué datos están mal clasificados.
Qué datos sirven para KPIs.
Qué datos sirven para tensiones.
Qué datos sirven para acciones.
Qué datos sirven para FARO Score.
La pregunta central es:
¿La empresa tiene datos suficientes, confiables y trazables para transformar información en dirección ejecutiva?
2. Tesis de la auditoría de datos
La tesis es simple:
FARO Connect no puede generar dirección confiable si los datos de base son incompletos, débiles o no trazables.
La IA puede explicar mejor. Los dashboards pueden verse más lindos. Los gráficos pueden tener mejores colores.
Pero si el dato está mal, la conclusión también está mal.
En lenguaje directo:
Dato basura → KPI basura → alerta basura → decisión peligrosa.
O peor: decisión muy segura, pero equivocada. Esa es la más cara.
3. Diferencia entre dato existente, dato usable y dato confiable
| Tipo de dato | Qué significa | Ejemplo |
|---|---|---|
| Dato existente | El dato está en algún lado. | Hay una columna “producto” en Excel. |
| Dato usable | El dato puede procesarse. | El producto tiene nombre, código y formato consistente. |
| Dato confiable | El dato es completo, trazable, actualizado y validado. | El producto está vinculado a código maestro, costo, stock y categoría. |
Ejemplo:
Existe:
“Cem x50”
Usable:
“CEMENTO_BOLSA_50KG”
Confiable:
Producto ID PROD-001, costo actualizado, precio lista, stock actual, proveedor, rotación y margen esperado.
FARO no debe conformarse con que el dato exista. Debe saber si sirve para dirigir.
4. Qué debe auditar FARO
La auditoría debe revisar cinco grandes bloques.
| Bloque | Qué se audita |
|---|---|
| 1. Fuentes | ERP, Excel, CRM, POS, bancos, WhatsApp, PDFs, mails, APIs, sistemas internos. |
| 2. Campos | Columnas, nombres, formatos, tipos de dato, campos obligatorios. |
| 3. Calidad | Completitud, duplicados, errores, fechas, consistencia, trazabilidad. |
| 4. Cobertura | Si alcanza para calcular KPIs, reglas, alertas, tensiones y score. |
| 5. Brechas | Qué datos faltan y qué impacto tiene que falten. |
5. Fuentes de datos a relevar
| Fuente | Qué puede aportar | Riesgo típico |
|---|---|---|
| ERP | Facturas, ventas, compras, clientes, proveedores, stock, cuentas. | Datos cargados tarde o mal clasificados. |
| Excel | Reportes manuales, controles paralelos, comisiones, presupuestos. | Versiones múltiples y baja trazabilidad. |
| CRM | Clientes, oportunidades, seguimiento comercial. | Datos incompletos o no actualizados. |
| POS / sistema de ventas | Tickets, ventas, medios de pago, sucursales. | No siempre vincula margen o cobranza. |
| Bancos | Cobros, pagos, saldos, movimientos. | Dificultad para conciliar con ERP. |
| Pedidos, reclamos, aprobaciones informales. | Información valiosa pero desestructurada. | |
| PDFs / documentos | Facturas, remitos, contratos, presupuestos. | Requiere extracción y validación. |
| Mails | Aprobaciones, pedidos, reclamos, información operativa. | Baja estructura y alta dispersión. |
| Sistemas internos | Stock, logística, RRHH, producción, operaciones. | Integración variable. |
| APIs externas | Bancos, e-commerce, marketplaces, logística, clima, mercado. | Dependencia técnica y permisos. |
6. Diccionario FARO de datos mínimos por módulo
La auditoría debe comparar lo que la empresa tiene contra el Diccionario FARO de datos mínimos.
Una base inicial razonable puede tener:
250 a 400 campos base
Distribuidos así:
| Módulo | Campos mínimos estimados | Ejemplos |
|---|---|---|
| Comercial | 40-70 | cliente, vendedor, producto, precio, descuento, canal, condición. |
| Finanzas | 40-70 | cobro, pago, deuda, vencimiento, cuenta, caja, gasto, centro de costo. |
| Stock | 35-60 | producto, cantidad, stock mínimo, stock físico, ubicación, rotación. |
| Compras | 30-50 | proveedor, orden, precio compra, plazo, recepción, condición. |
| RRHH | 30-60 | empleado, sueldo, comisión, ausentismo, rol, área, productividad. |
| Operaciones | 25-50 | tarea, entrega, demora, reclamo, responsable, estado. |
| Dirección / Workflow | 25-50 | decisión, acción, responsable, vencimiento, estado, score. |
| Clientes / Proveedores | 30-60 | segmento, riesgo, historial, rentabilidad, cumplimiento. |
7. Campos mínimos por módulo
7.1 Comercial
| Campo | Para qué sirve | Obligatorio |
|---|---|---|
| Fecha de venta | Período, tendencia, comparación. | Sí |
| Cliente | Rentabilidad, cobranza, riesgo. | Sí |
| Producto / servicio | Margen, stock, mix. | Sí |
| Vendedor | desempeño, comisión, responsabilidad. | Sí |
| Cantidad | volumen vendido. | Sí |
| Precio lista | comparación contra precio base. | Sí |
| Precio final | venta real. | Sí |
| Descuento | margen y política comercial. | Sí |
| Costo unitario | margen bruto. | Sí |
| Canal de venta | análisis por canal. | Recomendado |
| Condición de pago | impacto en caja. | Recomendado |
| Sucursal | comparación y score por unidad. | Sí |
Si falta costo unitario, FARO puede calcular ventas, pero no margen. Y sin margen, no hay lectura comercial seria.
7.2 Finanzas
| Campo | Para qué sirve | Obligatorio |
|---|---|---|
| Fecha de cobro | días de cobranza. | Sí |
| Cliente | mora y riesgo. | Sí |
| Monto cobrado | flujo de caja. | Sí |
| Monto pendiente | cuentas por cobrar. | Sí |
| Fecha de vencimiento | mora. | Sí |
| Cuenta bancaria | conciliación. | Recomendado |
| Medio de pago | análisis financiero. | Recomendado |
| Gasto | control de egresos. | Sí |
| Área / centro de costo | gasto por área. | Sí |
| Proveedor | pagos y dependencia. | Sí |
| Documento asociado | trazabilidad. | Recomendado |
| Tipo de gasto | clasificación gerencial. | Sí |
7.3 Stock
| Campo | Para qué sirve | Obligatorio |
|---|---|---|
| Producto | base del inventario. | Sí |
| Código producto | normalización. | Sí |
| Stock actual | disponibilidad. | Sí |
| Stock mínimo | alerta crítica. | Sí |
| Stock máximo | sobrestock. | Recomendado |
| Ubicación | depósito / sucursal. | Sí |
| Costo unitario | valorización de stock. | Sí |
| Último movimiento | rotación. | Sí |
| Ingreso / egreso | trazabilidad. | Sí |
| Diferencia físico-sistema | exactitud. | Recomendado |
| Proveedor habitual | reposición. | Recomendado |
| Plazo de reposición | stock crítico. | Sí |
7.4 Compras
| Campo | Para qué sirve | Obligatorio |
|---|---|---|
| Proveedor | dependencia y análisis. | Sí |
| Producto comprado | relación con stock. | Sí |
| Fecha de compra | frecuencia y tendencia. | Sí |
| Cantidad comprada | reposición. | Sí |
| Precio compra | costo y margen futuro. | Sí |
| Orden de compra | trazabilidad. | Recomendado |
| Fecha de entrega | cumplimiento proveedor. | Sí |
| Condición de pago | impacto financiero. | Recomendado |
| Responsable compra | accountability. | Sí |
| Motivo de compra | urgencia, reposición, oportunidad. | Recomendado |
7.5 RRHH
| Campo | Para qué sirve | Obligatorio |
|---|---|---|
| Empleado | maestro de personas. | Sí |
| Área | imputación y productividad. | Sí |
| Rol | RACI y responsabilidades. | Sí |
| Sueldo base | costo laboral. | Sí |
| Comisión | variable comercial. | Recomendado |
| Bonos / adicionales | costo real. | Recomendado |
| Ausentismo | productividad. | Recomendado |
| Fecha ingreso | antigüedad. | Recomendado |
| Tareas asignadas | ejecución. | Recomendado |
| Tareas cumplidas | productividad. | Recomendado |
| Responsable superior | escalamiento. | Sí |
7.6 Operaciones / Workflow
| Campo | Para qué sirve | Obligatorio |
|---|---|---|
| Acción / tarea | ejecución. | Sí |
| Responsable | accountability. | Sí |
| Área | clasificación. | Sí |
| Fecha creación | seguimiento. | Sí |
| Vencimiento | control. | Sí |
| Estado | avance. | Sí |
| Prioridad | foco. | Sí |
| KPI relacionado | impacto. | Recomendado |
| Tensión relacionada | causa. | Recomendado |
| Fecha cierre | medición. | Sí |
| Resultado | aprendizaje. | Recomendado |
8. Dimensiones de calidad de datos
FARO debe evaluar la calidad de cada fuente y módulo según estas dimensiones.
| Dimensión | Pregunta clave | Ejemplo |
|---|---|---|
| Completitud | ¿El dato está completo? | Venta sin costo unitario. |
| Consistencia | ¿Coincide entre fuentes? | Venta en ERP ≠ cobro en banco. |
| Validez | ¿Tiene formato correcto? | Fecha inválida o importe negativo. |
| Unicidad | ¿Está duplicado? | Cliente cargado tres veces. |
| Actualización | ¿Está al día? | Stock actualizado una vez al mes. |
| Trazabilidad | ¿Se sabe de dónde salió? | Excel sin autor ni fecha. |
| Integrabilidad | ¿Se puede conectar? | ERP exporta CSV pero no API. |
| Granularidad | ¿Tiene suficiente detalle? | Venta total mensual sin producto. |
| Clasificación | ¿Está bien asignado? | Gasto de Directorio cargado a Administración. |
| Disponibilidad | ¿Se puede acceder de forma recurrente? | Reporte depende de una persona. |
9. Fórmulas de calidad de datos
9.1 Completitud
Completitud = campos completos / campos requeridos
def completitud(campos_completos, campos_requeridos):
if campos_requeridos == 0:
return 0
return campos_completos / campos_requeridos
9.2 Tasa de error
Tasa de error = registros con error / registros totales
def tasa_error(registros_error, registros_totales):
if registros_totales == 0:
return 0
return registros_error / registros_totales
9.3 Tasa de duplicados
Tasa de duplicados = registros duplicados / registros totales
def tasa_duplicados(duplicados, registros_totales):
if registros_totales == 0:
return 0
return duplicados / registros_totales
9.4 Score de calidad FARO
Score calidad =
Completitud × 35%
+ Consistencia × 25%
+ Validez × 15%
+ Actualización × 10%
+ Trazabilidad × 10%
+ Unicidad × 5%
def score_calidad_datos(completitud, consistencia, validez, actualizacion, trazabilidad, unicidad):
score = (
completitud * 0.35 +
consistencia * 0.25 +
validez * 0.15 +
actualizacion * 0.10 +
trazabilidad * 0.10 +
unicidad * 0.05
)
return round(score, 2)
10. Semáforo de calidad de datos
| Score | Estado | Lectura |
|---|---|---|
| 0.85 - 1.00 | Confiable | Puede usarse para KPIs, reglas y tensiones. |
| 0.70 - 0.84 | Usable con observaciones | Puede usarse, pero requiere control. |
| 0.50 - 0.69 | Débil | Sirve solo para lectura preliminar. |
| 0.00 - 0.49 | No confiable | No debería activar decisiones críticas. |
Ejemplo:
Ventas: 0.91 → confiable.
Stock: 0.64 → débil.
RRHH: 0.78 → usable con observaciones.
Finanzas: 0.86 → confiable.
11. Matriz de brecha de datos
La auditoría debe producir una matriz clara.
| Módulo | Datos disponibles | Datos faltantes | Impacto | Acción recomendada |
|---|---|---|---|---|
| Comercial | Ventas, cliente, producto, vendedor. | Costo actualizado, canal. | No se calcula margen confiable. | Integrar costos desde compras/ERP. |
| Finanzas | Cobros, pagos, bancos. | Centro de costo, vencimiento real. | Gasto y mora poco precisos. | Normalizar cuentas y vencimientos. |
| Stock | Stock actual, producto. | Stock mínimo, rotación, proveedor. | No se detecta stock crítico. | Completar maestros de stock. |
| Compras | Proveedor, precio, fecha. | Plazo entrega, motivo compra. | No se mide proveedor crítico. | Registrar plazo y cumplimiento. |
| RRHH | Empleado, sueldo, área. | Productividad, tareas, comisiones variables. | No se mide costo laboral real. | Integrar con workflow y ventas. |
| Dirección | Decisiones informales. | Responsable, vencimiento, cierre. | No se mide ejecución. | Crear workflow de decisiones. |
12. Impacto de datos faltantes sobre FARO
| Dato faltante | Qué impide calcular | Riesgo |
|---|---|---|
| Costo unitario | Margen bruto, rentabilidad por producto. | Vender mucho y ganar poco sin verlo. |
| Fecha de cobro | Días de cobranza, mora. | Caja débil invisible. |
| Stock mínimo | Stock crítico. | Quiebre no anticipado. |
| Proveedor | Cumplimiento proveedor, dependencia. | Compras reactivas. |
| Responsable | Acciones y workflow. | Nadie ejecuta. |
| Vencimiento | Seguimiento. | Tareas eternas. |
| Centro de costo | Gasto por área. | Costos ocultos. |
| Comisión | Incentivos comerciales. | Comisión desalineada. |
| Cliente | Mora, rentabilidad, riesgo. | Cliente grande pero peligroso. |
| Sucursal | Comparación territorial. | Score por sucursal imposible. |
13. Auditoría por muestra
Cuando hay muchos datos, FARO puede auditar una muestra.
Ejemplo:
Tomar últimos 90 días.
Revisar ventas, cobranzas, stock y gastos.
Validar 100 operaciones comerciales.
Validar 50 cobranzas.
Validar 50 productos de stock.
Validar 30 gastos relevantes.
Código simple para medir completitud en una muestra:
def auditar_muestra(registros, campos_requeridos):
resultado = []
for registro in registros:
completos = sum(1 for campo in campos_requeridos if registro.get(campo) not in [None, ""])
score = completos / len(campos_requeridos)
resultado.append(score)
return round(sum(resultado) / len(resultado), 2) if resultado else 0
14. Data profiling básico
FARO puede perfilar columnas para entender calidad.
def perfil_columna(valores):
total = len(valores)
vacios = sum(1 for v in valores if v in [None, ""])
unicos = len(set(valores))
return {
"total": total,
"vacios": vacios,
"porcentaje_vacios": round(vacios / total, 2) if total else 0,
"unicos": unicos,
"duplicacion_aproximada": round(1 - (unicos / total), 2) if total else 0
}
Ejemplo de salida:
{
"campo": "cliente",
"total": 10000,
"vacios": 320,
"porcentaje_vacios": 0.03,
"unicos": 1840,
"duplicacion_aproximada": 0.82
}
15. Validaciones mínimas por tipo de dato
| Tipo de dato | Validación |
|---|---|
| Fecha | No nula, formato válido, no futura salvo programación. |
| Importe | Numérico, no nulo, no negativo salvo nota de crédito. |
| Producto | Debe existir en maestro. |
| Cliente | Debe existir en maestro. |
| Vendedor | Debe existir en empleados o usuarios. |
| Sucursal | Debe existir en maestro de sucursales. |
| Stock | No negativo, salvo ajustes justificados. |
| Costo | Mayor a cero para calcular margen. |
| Descuento | Entre 0% y máximo permitido. |
| Responsable | Debe existir en matriz RACI. |
Ejemplo:
def validar_venta(venta):
errores = []
if not venta.get("fecha"):
errores.append("fecha_faltante")
if venta.get("importe", 0) <= 0:
errores.append("importe_invalido")
if not venta.get("producto_id"):
errores.append("producto_faltante")
if venta.get("costo_unitario") is None:
errores.append("costo_faltante")
if venta.get("descuento", 0) > 0.30:
errores.append("descuento_fuera_de_rango")
return errores
16. Datos mínimos para detectar tensiones iniciales
| Tensión | Datos mínimos requeridos |
|---|---|
| Crecimiento no rentable | ventas, costo, margen, descuento, cobranza. |
| Caja débil con ventas altas | ventas, cuentas por cobrar, fecha cobro, vencimiento, caja. |
| Stock crítico | stock actual, stock mínimo, ventas promedio, plazo proveedor. |
| Stock inmovilizado | stock actual, último movimiento, rotación, costo. |
| Comisión desalineada | venta, comisión, margen, cobranza, vendedor. |
| Cliente riesgoso | venta cliente, deuda, mora, margen cliente. |
| Proveedor crítico | proveedor, plazo, entregas, incumplimientos, dependencia. |
| Dirección sin ejecución | decisiones, acciones, responsables, vencimientos, cierres. |
Si faltan esos datos, FARO puede marcar la tensión como:
No detectable.
Detectable parcialmente.
Detectable con baja confianza.
Detectable con confianza alta.
17. Score de preparación por módulo
Además del score de calidad, conviene medir si un módulo está listo para implementarse.
Preparación módulo =
Disponibilidad de datos × 40%
+ Calidad de datos × 30%
+ Responsable definido × 15%
+ Proceso documentado × 15%
def score_preparacion_modulo(disponibilidad, calidad, responsable, proceso):
return round(
disponibilidad * 0.40 +
calidad * 0.30 +
responsable * 0.15 +
proceso * 0.15,
2
)
Lectura:
| Score | Estado | Recomendación |
|---|---|---|
| 0.80 - 1.00 | Listo | Implementar. |
| 0.65 - 0.79 | Viable | Implementar con controles. |
| 0.45 - 0.64 | Riesgoso | Ordenar datos antes. |
| 0.00 - 0.44 | No listo | No implementar todavía. |
18. Ejemplo: auditoría comercial
Datos encontrados
Ventas disponibles.
Cliente disponible.
Producto disponible.
Vendedor disponible.
Precio final disponible.
Descuento disponible.
Costo unitario incompleto.
Fecha de cobro no conectada.
Lectura FARO
Se pueden calcular ventas y descuentos.
El margen no es totalmente confiable.
No se puede relacionar correctamente venta con cobranza.
La tensión “crecimiento no rentable” puede detectarse con confianza media, no alta.
Acción recomendada
Integrar costo unitario desde compras o ERP.
Vincular ventas con cobranzas.
Normalizar productos.
19. Ejemplo: auditoría de stock
Datos encontrados
Stock actual disponible.
Producto disponible.
Sucursal disponible.
Stock mínimo incompleto.
Último movimiento incompleto.
Rotación no calculada.
Proveedor habitual no vinculado.
Lectura FARO
Se puede ver inventario actual.
No se puede anticipar stock crítico con precisión.
No se puede detectar stock inmovilizado con confianza alta.
Acción recomendada
Completar stock mínimo por producto.
Vincular ventas promedio por producto.
Registrar proveedor y plazo de reposición.
20. Ejemplo: auditoría de dirección / workflow
Datos encontrados
Decisiones se toman en reuniones.
No siempre se registran.
No siempre tienen responsable.
No siempre tienen vencimiento.
No se mide cierre ni resultado.
Lectura FARO
La empresa decide, pero no tiene trazabilidad de ejecución.
La tensión “dirección sin ejecución” es probable, pero requiere formalizar workflow.
Acción recomendada
Implementar registro de decisiones.
Asignar responsable.
Definir vencimiento.
Medir cierre.
Conectar acción con KPI o tensión.
21. Output final del Anexo 6
Al finalizar la auditoría de datos, FARO debe producir:
1. Inventario de fuentes de datos.
2. Mapa de datos disponibles por área.
3. Diccionario inicial de campos existentes.
4. Comparación contra Diccionario FARO de datos mínimos.
5. Brecha de datos por módulo.
6. Score de calidad por fuente.
7. Score de preparación por módulo.
8. Datos faltantes críticos.
9. Datos duplicados o inconsistentes.
10. Datos no trazables.
11. KPIs posibles de calcular hoy.
12. KPIs no calculables todavía.
13. Tensiones detectables hoy.
14. Tensiones no detectables todavía.
15. Recomendaciones de limpieza y normalización.
16. Prioridad de integración de fuentes.
17. Riesgos de implementación.
18. Roadmap de datos para FARO Connect.
22. Conexión con otros anexos
| Próximo anexo | Qué recibe desde Anexo 6 |
|---|---|
| Anexo 1 — Diagnóstico inicial | Nivel de madurez de datos. |
| Anexo 2 — Mapa de procesos | Datos generados por cada proceso. |
| Anexo 3 — Mapa de decisiones | Datos necesarios para decidir. |
| Anexo 5 — Tensiones iniciales | Datos necesarios para detectar tensiones. |
| Anexo 8 — Fuentes e ingesta | Qué fuentes deben conectarse primero. |
| Anexo 10 — Calidad de datos | Reglas de validación y scoring. |
| Anexo 11 — Staging y normalización | Datos que deben limpiarse. |
| Anexo 13 — Tablas maestras | Entidades a unificar. |
| Anexo 17 — Biblioteca de KPIs | KPIs calculables y no calculables. |
| Anexo 22 — Biblioteca de tensiones | Tensiones detectables según datos disponibles. |
| Anexo 35 — FARO Score | Variables disponibles para score inicial. |
La auditoría de datos define si FARO Connect puede operar con información confiable. Releva fuentes, campos, calidad, trazabilidad, brechas y preparación por módulo. Con eso evita prometer KPIs, tensiones o scores que la empresa todavía no puede sostener con datos reales.