Cualquier tipo de soporte
La grabación de datos es el proceso de capturar datos o convertir la información a un formato susceptible de ser digitalmente almacenado.
En principio, podríamos pensar que con un excel podemos grabar todo, y es en parte cierto, pero hay que considerar también que resultado obtendríamos con este sistema:
Grabamos unas fichas o cupones promocionales de clientes de teléfonos y emails con Excel:
Esto sucede porque no hay ningun control en la grabación.
Cuando trabajamos con encuestas, la calidad de las grabaciones es más que importante aún, ya que los investigadores de mercado
trabajan bajo la suposición –estadísticamente correcta- de que 400 personas pueden representar a 4 millones de personas.
Dada la situación, resulta imprescindible que cuanto digan esas 400 personas se refleje fielmente, además de tener una coherencia
y una trazabilidad muy condicionada por filtros y saltos, que resulta importante respetar
(A un señor que nunca a salido de España no deberíamos preguntarle qué le parece Francia).
Algo similar sucedería si grabaramos una factura de un proveedor sin considerar que cuadren los importes contenidos en ella,
por ejemplo.
En cualquier caso, todo tipo de documento que requiera ser grabado ha de serlo con calidad.
La calidad en la grabación de datos es fundamental, ya que no respetar los controles, filtros y saltos
requeridos nos haría disponer de un conjunto de datos,
sin depurar. Resulta imposible disponer de información de calidad si no se dispone de datos con calidad.
Para alcanzar conclusiones fiables, y tomar buenas decisiones es absolutamente necesario disponer de datos depurados y de calidad.
que permitan analizarla correctamente.
Tratamos ficheros de cualquier formato
Los datos suelen almacenarse o bien en ficheros, o bien en bases de datos, sean relacionales o no relacionales.
Es bastante frecuente encontrarse con ficheros donde no coinciden todos los campos y sin embargo hay que fusionarlos o unirlos.
O coincidiendo los campos puede suceder que sean muchos los ficheros a unir y copiar y pegarlos sucesivamente,
puede resultar una tarea muy ardua.
Independientemente de cual sea el proceso de importación, exportación y/o fusión,
siempre es necesario depurar y/o transformar los datos contenidos en esos ficheros
para garantizar que los datos contenidos son los esperados.
A veces incluso, en ciertos sectores, industria y eólicas por ejemplo, la depuración de datos
no es tanto sobre cada registros, sino sobre el conjunto de registros en el tiempo, es decir, para depurar estos
datos es necesario contemplar la sucesión de registros y no cada registro. Por ejemplo, si tenemos una medicion horaria de un instrumento
y la única forma de validar esa medición es a lo largo del tiempo, "si cada 5 horas la media de valores en la variable VAR no supera el valor X, entonces", es diferente
a verificar que "si la variable VAR tiene un valor 1 entonces la variable VAR2 no puede tener ningún valor".
Cualquier proceso de estas características, procedan de donde procedan los datos, o sea cual sea el formato de los ficheros,
requiere de controles de calidad que garanticen la calidad de los ficheros y datos resultantes de estos procesos.
Bases de datos
Frente a un fichero, que es un conjunto único de datos, la base de datos se constituye de una serie de ficheros relacionados. Los ficheros están organizados de una forma secuencial o indexados, pero las bases de datos se almacenan de forma jerárquica o relacional. Mientras que los ficheros permiten pocos y pobres análisis, las bases de datos sin tener la capacidad de un Datawarehouse, permiten :
Trabajamos Bases de datos relacionales y no relacionales::