ESTADISTICA
Definición
La estadística es la ciencia matemática que proporciona los medios para recolectar, organizar, resumir, analizar e interpretar datos, con el fin de obtener conclusiones válidas y tomar decisiones racionales ante situaciones de incertidumbre.
Se divide principalmente en:
-
Estadística descriptiva: Su único fin es la recogida, clasificación, representación y resumen de los datos ya existentes.
-
Cálculo de Probabilidades: Proporciona herramientas conceptuales necesarias para aplicar con éxito la inferencia estadística.
-
Estadística inferencial: Su objetivo es extender las conclusiones obtenidas en una parte de la población (muestra) a toda ella (población).
Población: Es el conjunto de todos las personas, elementos o acontecimientos que cumplen ciertas propiedades o características, entre las cuales se desea estudiar un determinado fenómeno.
Ejemplo: mujeres en edad fértil de un Distrito Sanitario, que podemos llamar “N”.
En la mayoría de las ocasiones resulta imposible recoger los datos de todos y cada uno de los elementos de la población, por ello, se recurre a la selección de una muestra.
Muestra: Es un subconjunto de la población o grupo de elementos pertenecientes a la población de estudio, escogidas al azar y tomadas como representativa de la población. Nos puede permitir establecer una “estimación” de determinadas características de la población
Individuo: Se denomina individuo o unidad de investigación a cada uno de los elementos de una población. Ej.: cada mujer en edad fértil
Concepto de variable
La variable es aquello que nos interesa medir en los individuos. Por ejemplo, los niveles de estrógenos en la primera fase del ciclo ovárico sería una variable, los niveles de estrógenos en la segunda fase del ciclo sería otra variable, etc.
Las variables se dividen en 2 tipos:
-
Variables cualitativas:
Representa una cualidad y, en principio, no pueden cuantificarse, ya que no toman valores numéricos. Ejemplo: etnia de las mujeres de edad fértil de ejemplos anteriores, profesión, etc.
Las variables cualitativas se dividen en 2 tipos:
Variable ordinal: Representa relaciones de orden entre los distintos valores obtenidos Admite operadores de igualdad, desigualdad y de orden (=,≠,‹,›,≤, ≥) Ejemplo: grado de satisfacción en la atención en una consulta médica.
Variable no ordinal o nominal: Es el tipo de variable cualitativa que clasifica los datos en categorías mutuamente excluyentes, sin un orden, jerarquía o rango lógico entre ellas. Estas categorías solo sirven para etiquetar o nombrar, por lo que no es posible medir la distancia entre ellas ni realizar operaciones aritméticas. Por ejemplo: El color de las prendas de un local de ropas.
-
Variables cuantitativas:
Toman valores numéricos, y se acompañan de determinadas unidades de medida. Ejemplo: concentración de colesterol en mg/dl
Las variables cuantitativas pueden ser discretas o continuas.
Variables cuantitativas discretas: Corresponden a valores enteros. Ejemplo: nº de hijos
Variables cuantitativas continuas: Corresponden a números reales. Ejemplo: altura, peso, talla, etc.
Tablas de frecuencias de datos
Las tablas son un modo habitual de organización y presentación de los resultados. Su elaboración requiere:
-
Establecer el tipo de variable a tabular.
-
Conocer el número de observaciones (casos).
-
Saber cuántas veces se repite cada valor dentro de cada categoría.
Componentes de una tabla de frecuencia
Las tablas de frecuencias están compuestas básicamente por los siguientes elementos:
La frecuencia absoluta fi:
Consiste en el número de veces que aparece un determinado valor.
La suma de las frecuencias absolutas es igual al número total de datos (n = f1 + f2 + f3 + ... + fn).

La frecuencia relativa fr:
Es el cociente entre la frecuencia absoluta y el número total de datos, es decir: fr = fi/n.
La suma de las frecuencias relativas es igual a 1 (o a 100 en caso de trabajar con porcentajes).



La frecuencia relativa acumulada Fri:
Es el cociente entre la frecuencia acumulada de un determinado valor y el número total de datos, es decir: Fri = Fi /n
Al igual que la frecuencia relativa, se puede expresar en tantos por ciento.

Tipos de tablas de frecuencia
La naturaleza de los datos (atributos, variables), es decir, el número de valores distintos y el número de observaciones influyen en el tipo de tabla de frecuencias. Podemos considerar dos tipos de tablas de frecuencia:
-
Tablas sobre datos no agrupados
Son apropiadas para el análisis de variables cualitativas o variables cuantitativas discretas. En el caso de variable cualitativas nominales, las tablas estadísticas suelen incluir cuántos valores diferentes aparecen (su frecuencia absoluta) y qué fracción del total representan (la frecuencia relativa).
Ejemplo:


-
Tablas sobre datos agrupados en clases o intervalos:
Cuando el número de observaciones numéricas de una variable es muy elevado (variables cuantitativas discretas) o analizamos una variable cuantitativa continua es habitual agrupar el campo de variación en intervalos de clase.

Nota: Los corchete al comienzo de los intervalos indican que el primer número está incluido dentro de ese intervalo y los paréntesis al final de los intervalos indica que el limite superior Li está excluido de ese intervalo. En este caso, entonces, los intervalos son semi-abierto a la derecha pero se puede escoger hacerlos semi-abiertos a la izquierda.
Criterios del intervalo de clase:
Cálculo del Nº de intervalos:
Tenemos tres criterios para hallar el número de intervalos:
-
Regla de Nordcliffe o de la raíz cuadrada: k = √n
-
Regla de Sturges: k = 1+log2(n).
-
En la práctica, se recomienda no usar más de 10 intervalos.
Amplitud de un intervalo (rango o recorrido)
El Rango (R) es la diferencia entre el valor máximo y el valor mínimo del conjunto de datos, es decir: R = xM - xm
La amplitud a es el cociente entre el rango R y el número de intervalos k, es decir; a = R/k
Valores máximos y mínimo
-
Números reales: valores extremos que coinciden con los datos observados
-
Límites exactos: valores imaginarios que por efecto del redondeo limitan con mayor precisión el inicio el inicio y el final de cada intervalo.
Grafica
Toda información organizada en una tabla de datos puede ser representada en algún tipo de gráfico. Según las características y la cantidad de datos, conviene utilizar uno u otro gráfico:
-
Diagrama de barras
Un diagrama de barras se utiliza para de presentar datos cualitativos o datos cuantitativos de tipo discreto.
Se representan sobre unos ejes de coordenadas, en el eje de abscisas se colocan los valores de la variable, y sobre el eje de ordenadas las frecuencias absolutas
Los datos se representan mediante barras separadas, de una altura proporcional a la frecuencia.
Ejemplo:
Un estudio hecho al conjunto de los 20 alumnos de una clase para determinar su grupo sanguíneo ha dado el siguiente resultado:


-
Histograma
Un histograma es una representación gráfica de una variable en forma de barras contiguas. Se utilizan para variables discretas o continuas, con un gran número de datos, y que se han agrupado en clases. En el eje abscisas se construyen unos rectángulos que tienen por base la amplitud del intervalo, y por altura, la frecuencia absoluta de cada intervalo. La superficie de cada barra es proporcional a la frecuencia de los valores representados.
Ejemplo:
El peso de 65 personas adultas viene dado por la siguiente tabla:


-
Un polígono de frecuencias
El polígono de frecuencias es un gráfico que también se usa en variables agrupadas en clases, uniendo los puntos medios de cada clase de las partes superiores de las barras en un histograma.

-
Diagrama de torta
Este tipo de diagrama se usa generalmente para las variables mostrar las frecuencias relativas en tanto por ciento. Los datos se representan en un círculo, de modo que el ángulo de cada sector es proporcional a la frecuencia relativa correspondiente y se construye con la ayuda de un transportador.
Ejemplo:
En una clase de 30 alumnos, 12 juegan a baloncesto, 3 practican la natación, 9 juegan al fútbol y el resto no practica ningún deporte.
Primero calculamos la frecuencia relativa de cada categoría:
Baloncesto: 12.100 = 40%
30
Natación: 3.100 = 10%
30
Futbol: 9.100 = 30%
30
Ningún: 6.100 = 20%
30


Ahora para determinar el ángulo de cada categoría hacemos una regla de 3 simple:
100%________ 360º
40%________ x = 144º
100%________ 360º
10%________ x = 36º
100%________ 360º
30%________ x = 108º
100%________ 360º
20%________ x = 72º
Ejercicios
1) Indica cuáles variables son cualitativas y cuáles cuantitativas
a Comida Favorita.
b Profesión que te gusta.
c Número de goles marcados por tu equipo favorito en la última temporada.
d Número de alumnos de tu Instituto.
e El color de los ojos de tus compañeros de clase.
f Coeficiente intelectual de tus compañeros de clase.
2) De las siguientes variables indica cuáles son discretas y cuales continuas:
a Número de acciones vendidas cada día en la Bolsa.
b Temperaturas registradas cada hora en un observatorio.
c Período de duración de un automóvil.
d El diámetro de las ruedas de varios coches.
e Número de hijos de familias.
f Censo anual de los españoles.
3) Clasificar las siguientes variables en cualitativas o cuantitativas, y en discretas o continuas:
a La nacionalidad de una persona.
b Número de litros de agua contenidos en un depósito.
c Número de libros en un estante de librería.
d Suma de puntos tenidos en el lanzamiento de un par de dados.
e La profesión de una persona.
f El área de las distintas baldosas de un edificio.
4) Las puntuaciones obtenidas por un grupo en una prueba han sido:
15, 20, 15, 18, 22, 13, 13, 16, 15, 19, 18, 15, 16, 20, 16, 15, 18, 16, 14, 13.
Construir la tabla de distribución de frecuencias y dibujar el polígono de frecuencias.
5) El número de estrellas de los hoteles de una ciudad viene dado por la siguiente serie:
3, 3, 4, 3, 4, 3, 1, 3, 4, 3, 3, 3, 2, 1, 3, 3, 3, 2, 3, 2, 2, 3, 3, 3, 2, 2, 2, 2, 2, 3, 2, 1, 1, 1, 2, 2, 4, 1.
Construir la tabla de distribución de frecuencias y dibuja el diagrama de barras.
6) En un curso de 6ª año se realizó una encuesta en la que a cada alumno se le pidió que complete la siguiente planilla:

Determina:
a.- Individuo y población
b.- Clasifica las variables por su tipo
c.- Confecciona tres cuadro en el que se muestre la frecuencia absoluta ni, relativa fi, frecuencia absoluta acumulada Ni y frecuencia relativa acumulada Fi para cada rango de peso, altura, y otro para la cantidad de hermanos
