Definición de Estadística
La Estadística trata del recuento,
ordenación y clasificación de los datos obtenidos por las observaciones, para
poder hacer comparaciones y sacar conclusiones.
Un estudio estadístico consta de las
siguientes fases:
-Recogida de datos y representación de datos.
-Análisis de datos.
-Obtención de conclusiones.
Conceptos de Estadística
Una población es el conjunto de todos
los elementos a los que se somete a un estudio estadístico.
Un individuo o
unidad estadística es cada uno de los elementos que
componen la población.
Una muestra es un conjunto
representativo de la población de referencia, el número de individuos de una
muestra es menor que el de la población.
El muestreo es la reunión de datos que
se desea estudiar, obtenidos de una proporción reducida y representativa de la
población.
Un valor es cada uno de los distintos
resultados que se pueden obtener en un estudio estadístico. Si lanzamos una
moneda al aire 5 veces obtenemos dos valores: cara y cruz.
Un dato es cada uno de los valores que
se ha obtenido al realizar un estudio estadístico. Si lanzamos una moneda al
aire 5 veces obtenemos 5 datos: cara, cara, cruz, cara, cruz.
Una variable
estadística es cada una de
las
características o cualidades que poseen los
individuos de una población.
Tipos de variable estadísticas
Las variables
cualitativas se refieren a características o cualidades que
no pueden ser medidas con
números. Podemos distinguir dos
tipos:
Una variable cualitativa nominal
presenta modalidades no numéricas
que no admiten un criterio de
orden. Por ejemplo:
El estado civil, con las
siguientes modalidades: soltero, casado, separado,
divorciado y viudo.
Una variable cualitativa ordinal
presenta modalidades no numéricas, en las que existe un
orden. Por
ejemplo:
La nota en un examen: suspenso,
aprobado, notable, sobresaliente.
Puesto conseguido en una prueba
deportiva: 1º, 2º, 3º, ...
Medallas de una
prueba
deportiva: oro, plata, bronce.
Una variable cuantitativa es la que se
expresa mediante un número, por tanto se pueden
realizar operaciones aritméticas con ella.
Podemos distinguir dos
tipos:
Una variable discreta es aquella que toma
valores aislados, es decir
no admite valores intermedios entre dos
valores específicos. Por ejemplo:
El número de hermanos de 5
amigos: 2, 1, 0, 1, 3.
Una variable continua es
aquella
que puede tomar valores
comprendidos entre dos números. Por ejemplo:
La altura de los 5
amigos: 1.73, 1.82, 1.77, 1.69, 1.75.
En la práctica medimos la altura
con dos decimales, pero también se podría
dar con tres decimales.
Distribución de frecuencias
La distribución de
frecuencias o tabla de
frecuenciases una ordenaciónen
forma de
tabla de los datos
estadísticos, asignando a cada dato su
frecuencia correspondiente.
Tipos de frecuencias
Frecuencia absoluta
La frecuencia absoluta es el
número de veces que
aparece un
determinado valor en un estudio estadístico.
Se representa por fi.
La suma de las frecuencias
absolutas es igual al número total de
datos, que se representa por N.
Para indicar resumidamente estas sumas se utiliza la
letra griega Σ (sigma mayúscula) que se lee suma o
sumatoria.
Frecuencia relativa
La frecuencia relativa es el
cociente entre la frecuencia
absoluta de un
determinado valor y el número total de
datos.
Se puede expresar en tantos por ciento y
se representa por ni.
La suma de las frecuencias relativas es
igual a 1.
Frecuencia acumulada
La frecuencia
acumulada es la suma de las frecuencias
absolutas de todos los
valores inferiores o iguales al
valor considerado.
Se representa por Fi.
Frecuencia relativa acumulada
La frecuencia relativa acumulada es el
cociente entre la frecuencia
acumulada de un
determinado valor y el número
total de
datos. Se puede expresar en tantos por
ciento.
Ejemplo
Durante el mes de julio, en una ciudad
se han registrado las siguientes temperaturas máximas:
32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30,
32, 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29.
En la primera columna de la tabla colocamos
la
variable ordenada de menor
a mayor, en la segunda hacemos el recuento y en la tercera anotamos la
frecuencia absoluta.
Este tipo de
tablas de frecuencias se
utiliza con variables
discretas.
Distribución de frecuencias agrupadas
La distribución de
frecuencias agrupadas o tabla con datos
agrupados se emplea si las variables toman
un número grande de valores o la
variable es
continua.
Se agrupan los valores
en intervalos que tengan la misma
amplitud denominados
clases. A cada clase se le asigna su
frecuencia correspondiente.
Límites de la clase
Cada clase está delimitada por el
límite inferior de la clase y el
límite superior de la clase.
Amplitud de la clase
La amplitud de la clase es la
diferencia entre el límite superior e
inferior de la
clase.
Marca de clase
La marca de clase es el
punto medio de cada
intervalo y es el valor que representa
a todo el intervalo para el cálculo de
algunos parámetros.
Construcción de una tabla de datos agrupados
3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29, 25,
17, 7, 34, 36, 39, 44, 31, 26, 20, 11, 13, 22, 27, 47, 39, 37, 34, 32, 35, 28,
38, 41, 48, 15, 32, 13.
1º Se localizan los valores menor y mayor de la
distribución. En este caso son 3 y 48.
2º Se restan y se busca un número entero un poco
mayor que la diferencia y que sea divisible por el número de
intervalos queramos establecer.
Es conveniente que el número de
intervalos oscile entre 6 y 15.
En este caso, 48 - 3 = 45, incrementamos el número hasta
50 : 5 = 10 intervalos.
Se forman los intervalos teniendo presente que el
límite inferior de una clase
pertenece al intervalo, pero el límite superior no pertenece intervalo, se
cuenta en el siguiente intervalo.
Diagrama de barras
Un diagrama de
barras se utiliza para de presentar
datos cualitativos o datos
cuantitativos de tipo
discreto.
Se representan sobre unos ejes de
coordenadas, en el
eje de abscisas se
colocan los valores de la variable,
y sobre el eje de ordenadas las
frecuencias absolutas o relativas o
acumuladas.
Los datos se representan mediante
barras de una altura
proporcional a la frecuencia.
Polígonos de frecuencia
Un polígono de
frecuencias se forma
uniendo los extremos de las
barras mediante segmentos.
También se puede realizar trazando los
puntos que representan las frecuencias y uniéndolos
mediante segmentos.
Un
diagrama de
sectores se puede utilizar para todo tipo de
variables, pero se usa frecuentemente para las
variables cualitativas.
Los datos se representan en un
círculo, de modo que el
ángulo de cada
sector es proporcional a la
frecuencia
absoluta correspondiente.
El diagrama circular se construye con la ayuda de
un transportador de
ángulos.
HISTOGRAMA
Un
histograma es una representación
gráfica de una
variable en forma de
barras.
Se utilizan para variables continuas o
para variables discretas, con un
gran número de datos, y que se han agrupado
en clases.
En el eje a veces se construyen
unos rectángulos que tienen por
base la amplitud del intervalo, y
por altura, la frecuencia absoluta de cada
intervalo.
La superficie de cada
barra es proporcional a la
frecuencia de los
valores representados.
Polígono de frecuencia
Para construir el polígono de
frecuencia se toma la marca de
clase que coincide con el
punto
medio de cada
rectángulo.
Histogramas con intervalos de amplitud
diferente
Para construir un
histogramas con intervalo de
amplitud diferente tenemos que calcular
las alturas de los
rectángulos del
histograma.
hies la
altura
del intervalo.
fies la
frecuencia del intervalo.
aies la
amplitud
del intervalo.
Definición de parámetro estadístico
Un parámetro estadístico es un
número que se obtiene a partir de los
datos de una distribución
estadística.
Los parámetros estadísticos sirven para
sintetizar la información dada por una tabla o por una gráfica.
Tipos de parámetros estadísticos
Hay tres tipos parámetros estadísticos:
- De centralización.
- De posición
- De dispersión.
Medidas de centralización
Nos indican en torno a qué valor (centro) se distribuyen
los datos.
La medidas de centralización
son:
- La media es el valor
promedio de la distribución.
- La mediana es la
puntación de la escala que
separa la mitad superior de la
distribución y la inferior, es decir
divide
la serie de datos en dos
partes iguales.
- La moda es el valor que
más se repite en una distribución.
Medidas de posición
Las medidas de
posicióndividen un
conjunto de datos en grupos con
el mismo número de individuos.
Para calcular las medidas de
posición es necesario que los
datosestén ordenados de
menor a mayor.
La medidas de posición
son:
- Los cuartiles dividen la
serie de
datos en cuatro partes iguales.
- Los decilesdividen la
serie de
datos en diez partes iguales.
- Los percentiles dividen la
serie de
datos en cien partes iguales.
Medidas de dispersión
Las medidas de
dispersión nos informan sobre cuanto se
alejan
del centro los valores de la distribución. Las medidas de dispersión
son:
- El rango o recorrido es la
diferencia entre el mayor y el
menor de los
datos de una distribución
estadística.
- La desviación media es
la media aritmética de los valores
absolutos de las desviaciones
respecto a la media.
- La varianza es la media
aritmética del
cuadrado de las
desviaciones respecto a la media.
- La desviación típica es
la raíz cuadrada de la
varianza.
https://www.superprof.es/apuntes/escolar/matematicas/estadistica/descriptiva/estadistica.html
No hay comentarios:
Publicar un comentario