Definición de Tabulación de datos | Diccionario Economico
La tabulación de datos se refiere a la organización y presentación sistemática de información en forma de tablas, facilitando el análisis y comprensión de los datos.
Así, es el proceso mediante el cual agrupamos datos y los mostramos en forma de gráficos o tablas para poder comprenderlos mejor.
La tabulación es un paso importante en el análisis descriptivo antes que otros como la inferencia. Así, en cuanto los recibamos, debemos prepararlos para su uso posterior, y lo hacemos agrupándolos con pestañas.
Fuente de datos de la tabla
A principios del siglo XIX, la estadística ya estaba enfocada a la recolección y clasificación de datos. William Playfair (1759–1823) fue el creador de los gráficos lineales, de barras o circulares que conocemos hoy. Por lo tanto, su utilidad es más que relevante para el análisis.
En cuanto a la tabulación, este proceso ocurrió más tarde como una forma de sintetizar los datos recopilados y clasificados. Su automatización pertenece a Herman Hollerith (1860-1929), quien creó la máquina con tarjetas perforadas.
Con el tiempo, este método ha mejorado significativamente, especialmente con el advenimiento de la tecnología informática. Por otro lado, la creación de aplicaciones como hojas de cálculo o el uso de software especial ha permitido procesar grandes cantidades de datos.
Proceso de tabulación de datos
El proceso de tabulación de datos dependerá del tipo de variable que se utilice. Es decir, si es cualitativo, cuantitativo, discreto o continuo. En un ejemplo, veremos una aplicación práctica.
variable cualitativa
Las variables cualitativas expresan categorías, como el grado de finalización. La tabulación de este tipo de datos es quizás la más sencilla.
La tabla tendrá, por un lado, datos numéricos. Por otro lado, se incluirán frecuencias absolutas (el número de cada valor) y frecuencias relativas (cada absoluto dividido por el total). Se agregan dos columnas más con frecuencias absolutas y relativas acumuladas.
Variable cuantitativa discreta
Estamos tratando con variables que se pueden agregar para que se puedan calcular medias, desviaciones estándar y otras estadísticas descriptivas de posición, varianza o forma. Sugerimos utilizar las mismas columnas que en el caso anterior.
variable de escala continua
Estas son variables que pueden tomar infinitos valores. En este caso, la tabulación se realiza agrupando por intervalos. Esto debería ser suficiente para no perder demasiada información, pero no demasiada. Se pueden utilizar fórmulas para calcular la cantidad adecuada.
Un ejemplo de tabulación de datos usando una hoja de cálculo
Veamos, para terminar, un ejemplo realizado con una hoja de cálculo. Se utilizaron variables número de hijos, edad y talla.
Como cualitativo (ordinal) tenemos el número de hijos en este caso. Si bien podrían agregarse, no tiene sentido ya que son diferentes tamaños de hogares. También podríamos usar variables nominales que no siguen un orden, como el género.
En el caso de indicadores cuantitativos, la edad en años será discreta y la talla en metros y centímetros será continua. La siguiente imagen muestra los datos y nuestra propuesta de agrupación. Calculamos las frecuencias absoluta (fi) y relativa (hi), así como la acumulada (Fi y Hi).
Podemos decir que solo en dos casos hubo cuatro hijos, que es el 10% del total. Que los hogares con menos de tres hijos sean el 70% (con uno y dos hijos). Por ejemplo, que había un 65% de menores de 40 años, o que había cuatro de los que medían 1,75 (el 20% del total).
Como puede ver, la tabulación de datos es importante para el análisis de la información estadística. Además, como siguiente paso, se pueden utilizar gráficos de barras, de líneas o circulares para representarlos visualmente y con mayor claridad.
¿Problemas o dudas? Te ayudamos
Si quieres estar al día, suscríbete a nuestra newsletter y síguenos en Instagram. Si quieres recibir soporte para cualquier duda o problema, no dude en ponerse en contacto con nosotros en info@wikieconomia.org