Mapa conceptual, D.F

viernes, 16 de abril de 2010

INTRODUCCIÓN.

Cuando se dispone de un gran número de datos, se recomienda o es muy conveniente ordenar y agrupar éstos, así como determinar el número de individuos pertenecientes a cada clase o categorías que estarán definidas por un límite mínimo y uno máximo de variación, mostrando en cada clase el número de elementos que contiene, o sea la frecuencia de clase. Luego una forma de organizar y presentar los datos es por medio de una tabla de frecuencias, ahora ésta puede variar un poco según que la variable sea cualitativa o cuantitativa, discreta o continúa.

TABLA DE FRECUENCIA PARA VARIABLES DISCRETAS


Algunos símbolos a utilizar son los siguientes:
N = tamaño de la población o universo
n = tamaño de la muestra
X = Variable estadística
xi = Es la identificación para cada valor observado de la variable estadística.
fi = frecuencia absoluta. Es el número de veces que se repite el valor de una variable.
Fi = frecuencia absoluta acumulada. Consiste en acumular paso a paso las frecuencias absolutas.
hi = frecuencia relativa. Es la participación que tiene cada frecuencia absoluta sobre el total de observaciones y se interpreta en forma porcentual.
Hi = frecuencia relativa acumulada. Consiste en acumular paso a paso las frecuencias relativas, y su interpretación también se realiza en forma porcentual.

Sumatoria (Σ): Es un símbolo matemático que sirve para expresar en forma condensada una serie de términos matemáticos de una variable en forma de suma. P. ej. Σ xi = x1 + x2 +...+ xn


Reglas para formar las clases


  • Determinación del rango: El rango es la diferencia del valor máximo menos el valor mínimo de todo el bloque de datos. Se puede denotar con la letra “R”

  • Determinación del intervalo de clase: Existen diferentes formas de establecer el número de intervalos de clase, veamos 2 formas:
    1. Consiste en establecer el cociente del rango entre el número de clases. El número de clases queda a criterio del investigador y se aconseja que este sea entre 6 y 11. Entre mayor sea el número de clases, es mayor la confiabilidad de los resultados.

    2. Utilizando el método de Sturges, en donde el número de intervalos es igual a 1 + 3,322 log. de n. Donde n es el tamaño de la muestra o número de registros tabulados.

  • Determinación de la amplitud: Se obtiene de dividir el Rango sobre el número de intervalos de clase. Esta debe contener tantos decimales como tengan los datos originales.

  • Determinación de los límites de clases: Arrancando de un valor cercano al mínimo se crea el límite inferior de la primera clase y luego se le suma la amplitud para obtener el límite superior de dicho clase, estableciendo así el primer intervalo de clase, para la segunda clase el límite inferior se construye partiendo del límite superior de la clase anterior y sumando nuevamente la amplitud para obtener el límite superior de la segunda clase y así sucesivamente.

  • Determinación de la frecuencia: Consiste en contar cuantos datos caen dentro de cada clase.
    Ejemplo:

Las clases así construidas tienden a crear cierta ambigüedad ya que no haber la posibilidad de que ningún dato se quede sin incluir ni que se incluya mas de una vez. Por lo consiguiente, se hace necesario a definir los límites reales de las clases. Estos se obtienen fraccionando las unidades.


Para establecer los límites reales de las clases es necesario conocer el método de redondeo empleado ya que de éste dependerán los límites.
Hay tres formas de redondeo a saber:



De esta manera, se puede ejemplificar con los datos presentados anteriormente, tres diferentes clasificaciones según el redondeo empleado.


Las frecuencias pueden ser absolutas o relativas, simples o acumuladas.

Absoluta: Es el número de elementos u observaciones de una misma clase.

Relativa: Es el porcentaje de frecuencia observado en una clase con respecto al total, este se obtiene al dividir la frecuencia absoluta correspondiente sobre la suma total de los datos.

Frecuencia acumulada: Es la suma de las frecuencias absolutas que se encuentran en cada clase. O sea, el acumulado de la segunda clase es la suma de la primera más la segunda, el acumulado de la tercera clase es la suma de la primera, más la segunda, más la tercera, y así sucesivamente.

Punto medio de la clase: viene siendo la marca de clase y se obtiene al sumar los valores de los 2 límites de la clase y dividirlos por 2, en otras palabras, es el promedio de los límites reales.


DISTRIBUCIÓN DE FRECUENCIAS

HISTOGRAMAS Y POLIGONOS DE FRECUENCIA

Son dos representaciones gráficas de las distribuciones de frecuencia.


1. Un histograma o histograma de frecuencias consiste en una serie de rectángulos que tienen
(a) Sus bases sobre un eje horizontal (el eje X) con centros en las marcas de clase y longitud igual al tamaño de los intervalos de clase.
(b) Superficies proporcionales a las frecuencias de clase.
Si los intervalos de clase tienen todos igual tamaño, las alturas de los rectángulos son proporcionales a las frecuencias de clase y se acostumbra en tal caso a tomar las alturas numéricamente iguales a las frecuencias de clase. Si los intervalos de clase no son de igual tamaño, estas alturas deberán ser calculadas.
2. Un polígono de frecuencias es un gráfico de línea trazado sobre las marcas de clase. Puede obtenerse uniendo los puntos medios de los techos de los rectángulos en el histograma.
El histograma y el polígono de frecuencias correspondiente a la
distribución de frecuencias de las alturas de los estudiantes se muestran en el mismo sistema de ejes en la Fig.1. Se acostumbra a prolongar el polígono con PQ y RS hasta las marcas de clase inferior y superior inmediatas, que corresponderían a la clase de frecuencia cero. En tal caso, la suma de las áreas de los rectángulos del histograma es igual al e área total limitada por el polígono de frecuencias y el eje X.


Tabla de frecuencia








Histograma y Polígono de Frecuencia