semana 11
Diagrama de tallos y hojas
Es un diagrama de gran utilidad para representar un conjunto de datos cuantitativos, este
tipo de representación presenta similitudes con el histograma en cuanto
que proporciona información del recorrido de la distribución de datos
en estudio, muestra la ubicación de la mayor concentración de mediciones
y revela la presencia o ausencia de simetría.
Cabe señalar que el diagrama de tallo y hojas tiene ventajas sobre el histograma, porque conserva la información que puede arrojar las mediciones individuales, situación que se pierde en los intervalos del histograma, otra ventaja, es que ésta representación elimina el paso de los datos originales a clases, lo que hace notar que se puede construir en el proceso de marcaje de los elementos en estudio.
Cabe señalar que el diagrama de tallo y hojas tiene ventajas sobre el histograma, porque conserva la información que puede arrojar las mediciones individuales, situación que se pierde en los intervalos del histograma, otra ventaja, es que ésta representación elimina el paso de los datos originales a clases, lo que hace notar que se puede construir en el proceso de marcaje de los elementos en estudio.
¿Cómo construir el diagrama de tallo y hojas?
- Señalar el título.
- Se debe dividir cada medición en dos partes, la primera se llama tallo y la segunda hojas.
- El tallo se forma con uno o más dígitos iniciales de la medición, y
las hojas se forman con uno o más de los dígitos restantes.
- La cantidad de tallos preferiblemente deben ser mayores o iguales a 5 y menores o iguales a 20.
- Los tallos forman una columna ordenada de menor a mayor del lado izquierdo del diagrama.
- Registrar las hojas por cada observación junto al valor correspondiente del tallo.
- Indicar fuente.
Ejemplo del diagrama de tallo y hojas:
Supongamos que durante el presente mes del año corriente, se mide el Tiempo en minutos que tardan un grupo de estudiantes para llegar a la Facultad de Medicina, Universidad de Los Andes (ULA).
Datos de Tiempo (minutos): 12, 13, 13, 14, 14, 15, 15, 20, 21, 22, 22, 22, 25, 27, 28, 29, 31, 31, 33, 34, 36, 38, 39, 40, 41, 41, 42, 44, 45, 50, 51 52.
Diagrama 1. Estudiantes de la Facultad de Medicina según Tiempo en minutos para llegar a la Facultad de Medicina. ULA, Mérida. Agosto, 2012.
- Los tallos forman una columna ordenada de menor a mayor del lado izquierdo del diagrama.
- Registrar las hojas por cada observación junto al valor correspondiente del tallo.
- Indicar fuente.
Ejemplo del diagrama de tallo y hojas:
Supongamos que durante el presente mes del año corriente, se mide el Tiempo en minutos que tardan un grupo de estudiantes para llegar a la Facultad de Medicina, Universidad de Los Andes (ULA).
Datos de Tiempo (minutos): 12, 13, 13, 14, 14, 15, 15, 20, 21, 22, 22, 22, 25, 27, 28, 29, 31, 31, 33, 34, 36, 38, 39, 40, 41, 41, 42, 44, 45, 50, 51 52.
Diagrama 1. Estudiantes de la Facultad de Medicina según Tiempo en minutos para llegar a la Facultad de Medicina. ULA, Mérida. Agosto, 2012.
Tallo | Hoja |
Frecuencia absoluta
|
1
| 2,3,3,4,4,5,5 | 7 |
2
| 0,1,2,2,2,5,7,8,9 | 9 |
3
| 1,1,3,4,6,8,9 | 7 |
4
| 0,1,1,2,4,5 | 6 |
5
| 0,1,2 | 3 |
Interpretación: a través del Diagrama 1 se puede observar que la
distribución de datos de Tiempo (minutos) es asimétrica positiva, con la
mayor concentración de datos en el segundo tallo, también se puede
determinar la moda, que en este caso es 22 minutos. Además se puede hallar la mediana, considerando
que la cantidad de datos son pares, se tiene que los elementos
centrales son 29 y 31 minutos, por lo tanto la mediana=(29+31)/2=30
minutos, es el Tiempo que divide la distribución en dos partes iguales.
Asimismo se pueden calcular los cuartiles, usando Q1=n/4 y para el Q3=3n/4, por ejemplo: Q1=32/4=8,
el valor obtenido determina la posición, la cual arroja que 20 minutos
es el Tiempo que deja el 25% de los datos por debajo y el 75% de los
datos de la distribución por encima.
Es importante tomar en cuenta que este tipo de diagramas, no es
aconsejable en informes anuales o en algún tipo de medios de difusión
para un público en general, porque se convierten en una ayuda básica
para que investigadores y tomadores de decisiones comprendan la
naturaleza de los datos.
Algunas veces, la utilización del primero o de los dos primeros dígitos
de los datos puntuales como tallos no proporcionan suficientes tallos
como para permitir detectar la forma de su distribución. Una manera de
solucionar esto es utilizar tallos dobles. Es decir, utilizar cada tallo
dos veces: una vez para trazar las hojas inferiores y otra vez para
trazar las hojas superiores.
Muchos de los procedimientos estadísticos que se desarrollan suponen que
la variable independiente estudiada posea al menos una distribución
aproximadamente normal, para la cual el diagrama de tallos y hojas tiene
forma de campana, por lo tanto, los diagramas de tallos y hojas dan una
idea de la localización de los datos y de la forma de la distribución.
Esta técnica funciona bien para los conjuntos de datos que no tienen una
dispersión muy grande.
Referencias:
Daniel, W. (2010). Bioestadística. Base para el análisis de las ciencias de la salud (4a. Ed.). México: Limusa Wiley.
Montgomery, D. y Runger, G. (2008). Probabilidad y estadística aplicada a la ingeniería (2a. Ed.). México: Limusa Wiley.
Letra Arial
Tamaño Normal.
Comentarios
Publicar un comentario