Probabilidad
La probabilidad es un método mediante el cual se obtiene la frecuencia de un suceso determinado mediante la realización de un experimento aleatorio, del que se conocen todos los resultados posibles, bajo condiciones suficientemente estables. La teoría de la probabilidad se usa extensamente en áreas como la estadística, la física, la matemática, las ciencias y la filosofía para sacar conclusiones sobre la probabilidad discreta de sucesos potenciales y la mecánica subyacente discreta de sistemas complejos.
Teoría
La probabilidad constituye un importante parámetro en la determinación de las diversas casualidades obtenidas tras una serie de eventos esperados dentro de un rango estadístico.Existen diversas formas como método abstracto, como la teoría Dempster-Shafer y la teoría de la relatividad numérica, esta última con un alto grado de aceptación si se toma en cuenta que disminuye considerablemente las posibilidades hasta un nivel mínimo ya que somete a todas las antiguas reglas a una simple ley de relatividad.[cita requerida]
La probabilidad de un evento se denota con la letra p y se expresa en términos de una fracción y no en porcentajes, por lo que el valor de p cae entre 0 y 1. Por otra parte, la probabilidad de que un evento "no ocurra" equivale a 1 menos el valor de p y se denota con la letra q:
Regla de la adición
La regla de la adición o regla de la suma establece que la probabilidad de ocurrencia de cualquier evento en particular es igual a la suma de las probabilidades individuales, si es que los eventos son mutuamente excluyentes, es decir, que dos no pueden ocurrir al mismo tiempo.P(A o B) = P(A) U P(B) = P(A) + P(B) si A y B son mutuamente excluyente. P(A o B) = P(A) + P(B) − P(A y B) si A y B son no excluyentes.
Siendo: P(A) = probabilidad de ocurrencia del evento A. P(B) = probabilidad de ocurrencia del evento B. P(A y B) = probabilidad de ocurrencia simultánea de los eventos A y B.
Regla de la multiplicación
La regla de la multiplicación establece que la probabilidad de ocurrencia de dos o más eventos estadísticamente independientes es igual al producto de sus probabilidades individuales.P(A y B) = P(A B) = P(A)P(B) si A y B son independientes. P(A y B) = P(A B) = P(A)P(B|A) si A y B son dependientes
Regla de Laplace
La regla de Laplace establece que:- La probabilidad de ocurrencia de un suceso imposible es 0.
- La probabilidad de ocurrencia de un suceso seguro es 1, es decir, P(A) = 1.
- La probabilidad de que ocurra un suceso se calcula así:
Esto significa que: la probabilidad del evento A es igual al cociente del número de casos favorables (los casos dónde sucede A) sobre el total de casos posibles.
Distribución binomial
La probabilidad de ocurrencia de una combinación específica de eventos independientes y mutuamente excluyentes se determina con la distribución binomial, que es aquella donde hay solo dos posibilidades, tales como masculino/femenino o si/no.- Hay dos resultados posibles mutuamente excluyentes en cada ensayo u observación.
- La serie de ensayos u observaciones constituyen eventos independientes.
- La probabilidad de éxito permanece constante de ensayo a ensayo, es decir el proceso es estacionario.
Entonces la probabilidad de que ocurran m éxitos en un experimento de n ensayos es:
P (x = m) = (nCm)(Pm)(1−P)n−m
Siendo: nCm el número total de combinaciones posibles de m elementos en un conjunto de n elementos.
En otras palabras P(x = m) = [n!/(m!(n−m)!)](pm)(1−p)n−m
Ejemplo. La probabilidad de que un alumno apruebe la asignatura Cálculo de Probabilidades es de 0,15. Si en un semestre intensivo se inscriben 15 alumnos ¿Cuál es la probabilidad de que aprueben 10 de ellos?
P(x = 10) = 15C10(0,15)10(0,85)5 = 10!/(10!(15−10)!)(0,15)10(0,85)5 = 7,68 * 10−6 Generalmente existe un interés en la probabilidad acumulada de "m o más " éxitos o "m o menos" éxitos en n ensayos. En tal caso debemos tomar en cuenta que:
P(x < m) = P(x = 0) + P(x = 1) + P(x = 2) + P(x = 3) +....+ P(x = m − 1)
P(x > m) = P(x = m+ 1) + P(x = m+ 2) + P(x = m+3) +....+ P(x = n)
P(x ≤ m) = P(x = 0) + P(x = 1) + P(x = 2) + P(x = 3) +....+ P(x = m)
P(x ≥ m) = P(x = m) + P(x = m+1) + P(x = m+2) +....+ P(x = n)
Supongamos que del ejemplo anterior se desea saber la probabilidad de que aprueben:
a.− al menos 5
b.− más de 12
a.− la probabilidad de que aprueben al menos 5 es:
P(x ≥ 5) es decir, que:
1 - P(x < 5) = 1 - [P(x = 0)+P(x = 1)+P(x = 2)+P(x = 3)+P(x = 4)] =
1 - [0,0874 + 0,2312 + 0,2856 + 0,2184 + 0,1156] = 0,0618
Nota: Al menos, a lo menos y por lo menos son locuciones adverbiales sinónimas.
Ejemplo: La entrada al cine por lo menos tendrá un costo de 10 soles (como mínimo podría costar 10 soles o más).
b.− la probabilidad de que aprueben más de 12 es P(x > 12) es decir, que:
P(x > 12) = P(x = 13)+P(x = 14)+P(x = 15)
P(x > 12) = 1,47 *10−9 +3,722 *10−11 +4,38 *10−13 = 1,507 *10−9
La esperanza matemática en una distribución binomial puede expresarse como:
E(x) = np = 15(0,15)=2,25
Y la varianza del número esperado de éxitos se puede calcular directamente:
Var(x) = np(1−p)= 15(0,15)(1-0,15)=1,9125 Estadísticas y probabilidades, con sus diferentes diagramaciones como: diagrama de barras. diagrama de línea. y diagrama de círculos que se aplican de acuerdo al tipo de estadísticas y probabilidades matemáticas.
Aplicaciones
Dos aplicaciones principales de la teoría de la probabilidad en el día a día son en el análisis de riesgo y en el comercio de los mercados de materias primas. Los gobiernos normalmente aplican métodos probabilísticos en regulación ambiental donde se les llama "análisis de vías de dispersión", y a menudo miden el bienestar usando métodos que son estocásticos por naturaleza, y escogen qué proyectos emprender basándose en análisis estadísticos de su probable efecto en la población como un conjunto. No es correcto decir que la estadística está incluida en el propio modelado, ya que típicamente los análisis de riesgo son para una única vez y por lo tanto requieren más modelos de probabilidad fundamentales, por ej. "la probabilidad de otro 11-S". Una ley de números pequeños tiende a aplicarse a todas aquellas elecciones y percepciones del efecto de estas elecciones, lo que hace de las medidas probabilísticas un tema político.Un buen ejemplo es el efecto de la probabilidad percibida de cualquier conflicto generalizado sobre los precios del petróleo en Oriente Medio - que producen un efecto dominó en la economía en conjunto. Un cálculo por un mercado de materias primas en que la guerra es más probable en contra de menos probable probablemente envía los precios hacia arriba o hacia abajo e indica a otros comerciantes esa opinión. Por consiguiente, las probabilidades no se calculan independientemente y tampoco son necesariamente muy racionales. La teoría de las finanzas conductuales surgió para describir el efecto de este pensamiento de grupo en el precio, en la política, y en la paz y en los conflictos.
Se puede decir razonablemente que el descubrimiento de métodos rigurosos para calcular y combinar los cálculos de probabilidad ha tenido un profundo efecto en la sociedad moderna. Por consiguiente, puede ser de alguna importancia para la mayoría de los ciudadanos entender cómo se calculan los pronósticos y las probabilidades, y cómo contribuyen a la reputación y a las decisiones, especialmente en una democracia.
Otra aplicación significativa de la teoría de la probabilidad en el día a día es en la fiabilidad. Muchos bienes de consumo, como los automóviles y la electrónica de consumo, utilizan la teoría de la fiabilidad en el diseño del producto para reducir la probabilidad de avería. La probabilidad de avería también está estrechamente relacionada con la garantía del producto.
Se puede decir que no existe una cosa llamada probabilidad. También se puede decir que la probabilidad es la medida de nuestro grado de incertidumbre, o esto es, el grado de nuestra ignorancia dada una situación. Por consiguiente, puede haber una probabilidad de 1 entre 52 de que la primera carta en un baraja sea la J de diamantes. Sin embargo, si uno mira la primera carta y la reemplaza, entonces la probabilidad es o bien 100% ó 0%, y la elección correcta puede ser hecha con precisión por el que ve la carta. La física moderna proporciona ejemplos importantes de situaciones determinísticas donde sólo la descripción probabilística es factible debido a información incompleta y la complejidad de un sistema así como ejemplos de fenómenos realmente aleatorios.
En un universo determinista, basado en los conceptos newtonianos, no hay probabilidad si se conocen todas las condiciones. En el caso de una ruleta, si la fuerza de la mano y el periodo de esta fuerza es conocido, entonces el número donde la bola parará será seguro. Naturalmente, esto también supone el conocimiento de la inercia y la fricción de la ruleta, el peso, lisura y redondez de la bola, las variaciones en la velocidad de la mano durante el movimiento y así sucesivamente. Una descripción probabilística puede entonces ser más práctica que la mecánica newtoniana para analizar el modelo de las salidas de lanzamientos repetidos de la ruleta. Los físicos se encuentran con la misma situación en la teoría cinética de los gases, donde el sistema determinístico en principio, es tan complejo (con el número de moléculas típicamente del orden de magnitud de la constante de Avogadro
La mecánica cuántica, debido al principio de indeterminación de Heisenberg, sólo puede ser descrita actualmente a través de distribuciones de probabilidad, lo que le da una gran importancia a las descripciones probabilísticas. Algunos científicos hablan de la expulsión del paraíso.[cita requerida] Otros no se conforman con la pérdida del determinismo. Albert Einstein comentó estupendamente en una carta a Max Born: Jedenfalls bin ich überzeugt, daß der Alte nicht würfelt. (Estoy convencido de que Dios no tira el dado). No obstante hoy en día no existe un medio mejor para describir la física cuántica si no es a través de la teoría de la probabilidad. Mucha gente hoy en día confunde el hecho de que la mecánica cuántica se describe a través de distribuciones de probabilidad con la suposición de que es por ello un proceso aleatorio, cuando la mecánica cuántica es probabilística no por el hecho de que siga procesos aleatorios sino por el hecho de no poder determinar con precisión sus parámetros fundamentales, lo que imposibilita la creación de un sistema de ecuaciones determinista.
Estadística
La estadística es una ciencia formal que estudia la recolección, análisis e interpretación de datos de una muestra representativa, ya sea para ayudar en la toma de decisiones o para explicar condiciones regulares o irregulares de algún fenómeno o estudio aplicado, de ocurrencia en forma aleatoria o condicional. Sin embargo, la estadística es más que eso, es decir, es la herramienta fundamental que permite llevar a cabo el proceso relacionado con la investigación científica.
Es transversal a una amplia variedad de disciplinas, desde la física hasta las ciencias sociales, desde las ciencias de la salud hasta el control de calidad. Se usa para la toma de decisiones en áreas de negocios o instituciones gubernamentales.
La estadística se divide en dos grandes áreas:
- La estadística descriptiva, se dedica a la descripción, visualización y resumen de datos originados a partir de los fenómenos de estudio. Los datos pueden ser resumidos numérica o gráficamente. Ejemplos básicos de parámetros estadísticos son: la media y la desviación estándar. Algunos ejemplos gráficos son: histograma, pirámide poblacional, gráfico circular, entre otros.
- La estadística inferencial, se dedica a la generación de los modelos, inferencias y predicciones asociadas a los fenómenos en cuestión teniendo en cuenta la aleatoriedad de las observaciones. Se usa para modelar patrones en los datos y extraer inferencias acerca de la población bajo estudio. Estas inferencias pueden tomar la forma de respuestas a preguntas si/no (prueba de hipótesis), estimaciones de unas características numéricas (estimación), pronósticos de futuras observaciones, descripciones de asociación (correlación) o modelamiento de relaciones entre variables (análisis de regresión). Otras técnicas de modelamiento incluyen anova, series de tiempo y minería de datos.
La estadística es una rama de las matemáticas que conjunta herramientas para recolectar, organizar, presentar y analizar datos numéricos u observacionales. Presenta números que describen una característica de una muestra. Resulta de la manipulación de datos de la muestra según ciertos procedimientos especificados.
Procedimiento:
- Obtención de datos
- Clasificación
- Presentación
- Interpretación
- Descripción
- Generalizaciones
- Comprobación de hipótesis por su aplicación.
- Toma de decisiones
Población: conjunto de todos los individuos (personas, objetos, animales, etc.) que porten información sobre el fenómeno que se estudia. Por ejemplo, si estudiamos la edad de los habitantes en una ciudad, la población será el total de los habitantes de dicha ciudad.
Muestra: Subconjunto de la población seleccionado de acuerdo con un criterio, y que sea representativo de la población. Por ejemplo, elegir 30 personas por cada colonia de la ciudad para saber sus edades, y este será representativo para la ciudad.
Individuo: cualquier elemento que porte información sobre el fenómeno que se estudia. Así, si estudiamos la altura de los niños de una clase, cada alumno es un individuo; si estudiamos la edad de cada habitante, cada habitante es un individuo.
Variable: Fenómeno que puede tomar diversos valores. Las variables pueden ser de dos tipos:
Variables cualitativas o atributos: no se pueden medir numéricamente (por ejemplo: nacionalidad, color de la piel, sexo).
Variables cuantitativas: tienen valor numérico (edad, precio de un producto, ingresos anuales
Por su parte, las variables cuantitativas se pueden clasificar en discretas y continuas:
Discretas: sólo pueden tomar valores enteros (1, 2, 8, -4, etc.). Por ejemplo: número de hermanos (puede ser 1, 2, 3....,etc, pero, por ejemplo, nunca podrá ser 3,45).
Continuas: pueden tomar cualquier valor real dentro de un intervalo. Por ejemplo, la velocidad de un vehículo puede ser 80,3 km/h, 94,57 km/h...etc.
Las variables también se pueden clasificar en:
Variables unidimensionales: sólo recogen información sobre una característica (por ejemplo: edad de los alunmos de una clase).
Variables bidimensionales: recogen información sobre dos características de la población (por ejemplo: edad y altura de los alumnos de una clase).
Variables pluridimensionales: recogen información sobre tres o más características (por ejemplo: edad, altura y peso de los alumnos de una clase).
- CONCEPTO Y CLASIFICACIÓN DE DATOS
Características o números que son recolectados por observación. No son otra cosa que el producto de las observaciones efectuadas en las personas y objetos en los cuales se produce el fenómeno que queremos estudiar
Los datos estadísticos pueden ser clasificados en cualitativos, cuantitativos, cronológicos y geográficos
Datos Cualitativos: cuando los datos son cuantitativos, la diferencia entre ellos es de clase y no de cantidad. Ejemplo: Si deseamos clasificar los estudiantes que cursan la materia de estadística I por su estado civil, observamos que pueden existir solteros, casados, divorciados, viudos.
Datos cuantitativos: cuando los valores de los datos representan diferentes magnitudes, decimos que son datos cuantitativos. Ejemplo: Se clasifican los estudiantes del Núcleo San Carlos de la UNESR de acuerdo a sus notas, observamos que los valores (nota) representan diferentes magnitudes.
Datos cronológicos: cuando los valores de los datos varían en diferentes instantes o períodos de tiempo, los datos son reconocidos como cronológicos. Ejemplo: Al registrar los promedios de notas de los Alumnos del Núcleo San Carlos de la UNESR en los diferentes semestres.
Datos geográficos: cuando los datos están referidos a una localidad geográfica se dicen que son datos geográficos. Ejemplo: El número de estudiantes de educación superior en las distintas regiones del país
- PRESENTACION DE INFORMACIÓN
Estadística Descriptiva:
Tienen por objeto fundamental describir y analizar las características de un conjunto de datos, obteniéndose de esa manera conclusiones sobre las características de dicho conjunto y sobre las relaciones existentes con otras poblaciones, a fin de compararlas. No obstante puede no solo referirse a la observación de todos los elementos de una población (observación exhaustiva) sino también a la descripción de los elementos de una muestra (observación parcial).
En relación a la estadística descriptiva, Ernesto Rivas Gonzáles dice; "Para el estudio de estas muestras, la estadística descriptiva nos provee de todos sus medidas; medidas que cuando quieran ser aplicadas al universo total, no tendrán la misma exactitud que tienen para la muestra, es decir al estimarse para el universo vendrá dada con cierto margen de error; esto significa que el valor de la medida calculada para la muestra, en el oscilará dentro de cierto límite de confianza, que casi siempre es de un 95 a 99% de los casos.
Distribución de frecuencias: muestra el número de veces que ocurre cada observación.
Ejemplo: Se elaboró una encuesta en un jardín de niños y ésta informó que las mascotas más comunes que tiene un niño son perros, gatos, peces, hámsteres y pájaros
perro | gato | perro | hamster |
pájaro | hamster | gato | perro |
hámster | gato | pájaro | gato |
perro | perro | hámster | pájaro |
perro | perro | pájaro | gato |
A continuación se muestra la distribución de frecuencias absolutas, relativas y porcentuales de las mascotas mas comunes de los niños.
Mascota | Frecuencia absoluta | Frecuencia relativa | Frecuencia acumulada |
Perro | 7 | .35 | 35 % |
Pajaro | 4 | .20 | 20 % |
Hamster | 4 | .20 | 20 % |
gato | 5 | .25 | 25 % |
Gráfica de barras
Frecuencia absoluta: se cuenta la cantidad de veces que ocurre el evento, en este caso, las mascotas.
Frecuencia relativa: se divide la frecuencia absoluta de cada evento entre el total de eventos.
Frecuencia porcentual: se multiplica la frecuencia relativa por 100.
1.2.2 CONSTRUCCION DE TABLAS ESTADÍSTICAS
Distribución agrupada de frecuencias: Distribución de frecuencias en la que los valores de la variable se han agrupado en clases. Esto se debe principalmente a la disposición de gran número de datos. Las razones por las que se elaboran este tipo de agrupación de datos es por economía, practicidad, y baja frecuencia de algunos puntajes.
Agrupación de datos: para elaborar las tablas estadísticas, se debe seguir un procedimiento preciso:
- Estos son algunos métodos para obtener datos:
Censo: Se entiende por censo aquella numeración que se efectúa a todos y cada uno de los caracteres componentes de una población. Para Levin & Rubin (1996) "Algunas veces es posible y práctico examinar a cada persona o elemento de la población que deseamos describir. A esto lo llamamos una numeración completa o censo. Utilizamos el muestre cuando no es posible contar o medir todos los elementos de la población. Si es posible listar (o enumerar) y observar cada elemento de la población, los censos se utilizan rara vez porque a menudo su compilación es bastante difícil, consume mucho tiempo por lo que resulta demasiado costoso.
Encuesta: Se entiende por encuesta las observaciones realizadas por muestreo, es decir son observaciones parciales. El diseño de encuestas es exclusivo de las ciencias sociales y parte de la premisa de que si queremos conocer algo sobre el comportamiento de las personas, lo mejor, más directo y simple es preguntárselo directamente a ellas. (Cadenas, 1974). Según Antonio Napolitano "La encuesta, es un método mediante el cual se quiere averiguar. Se efectúa a través de cuestionarios verbales o escritos que son aplicados a un gran número de personas". - Toma de datos.- es la obtención de una colección de datos por medio de encuestas, preguntas, sondeos etc. Que no han sido ordenados numéricamente y que dicha información se extrae al azar, es decir, de tal forma que cada miembro de la población tenga la misma oportunidad de ser elegida o seleccionada.
- Ordenación de datos: es una colocación de los datos numéricos tomados en orden creciente a decreciente de magnitud. La diferencia entre el mayor y el menor de los números se llama rango o recorrido de datos. *No. De clases (Regla de Sturges): 1 + 3.332 log N
*Tamaño de clase = Rango / No. De clases - Cálculo de tamaño de clase: para calcular el tamaño de clase es necesario calcular primeramente el número de clases utilizando la regla de Sturges y despés se obtiene el tamaño de clase dividiendo el rango entre el número de clases.
- Límites de clase: representan el tamaño de cada clase. El límite inferior de la primer clase toma el valor de el dato menor de la colección de datos, para obtener el límite inferior de la clase siguente, se suma al límite inferior de la case anterior el tamaño de clase.
- Límites reales de clase: se obtienen sumando al LS de la clase el Lide la clase contigua superior y dividiendo entre dos.
- Marca de clase: Es el punto medio de la clase y se obtiene sumando los LI y LS de la clase y dividiendo entre 2. La marca de clase también se llama punto medio de la clase.
Ejemplo de tablas estadísticas:
AUTOBUSES FORANEOS
1) Toma de datosLos siguientes datos corresponden a la cantidad de asientos vacíos que reportaron 50 autobuses foráneos en un domingo.
12 | 11 | 4 | 6 | 6 | 11 | 3 | 10 | 12 | 4 |
10 | 1 | 1 | 2 | 4 | 5 | 2 | 4 | 4 | 8 |
8 | 7 | 8 | 4 | 10 | 4 | 2 | 6 | 2 | 9 |
5 | 6 | 6 | 4 | 12 | 8 | 1 | 12 | 1 | 7 |
7 | 6 | 8 | 4 | 6 | 9 | 3 | 7 | 7 | 5 |
1 | 2 | 4 | 4 | 5 | 6 | 7 | 8 | 9 | 11 |
1 | 2 | 4 | 4 | 5 | 6 | 7 | 8 | 10 | 12 |
1 | 2 | 4 | 4 | 6 | 6 | 7 | 8 | 10 | 12 |
1 | 3 | 4 | 4 | 6 | 6 | 7 | 8 | 10 | 12 |
2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 11 | 12 |
3) Tamaño de clase
No de clases = 1 + 3.332log (50) = 6
Tamaño de clase = 11/6 = 2
4) Límites de clase
5) Límites reales de clase
6) Marca de clase
Clase |
Intervalo
| LRI | LRS | Frec. Absoluta | Frec. Relat | Frec. Porcentual |
X
| |
LI
|
LS
| |||||||
1 |
1
|
2.9
|
0.95
|
2.95
|
8
|
.16
|
16 %
|
1.95
|
2 |
3
|
4.9
|
2.95
|
4.95
|
11
|
.22
|
22 %
|
3.95
|
3 |
5
|
6.9
|
4.95
|
6.95
|
10
|
.20
|
20 %
|
5.95
|
4 |
7
|
8.9
|
6.95
|
8.95
|
10
|
.20
|
20 %
|
7.95
|
5 |
9
|
10.9
|
8.95
|
10.95
|
5
|
.10
|
10 %
|
9.95
|
6 |
11
|
12.9
|
10.95
|
12.95
|
6
|
.12
|
12 %
|
11.95
|
total |
50
|
1
|
100 %
|
Representación gráfica de datos.
Se tomará el ejemplo anterior para demostrar el uso de diferentes gráficas.
Histograma: forma gráfica de barras que emplea variables con escala de intervalos o de proporciones. Para realizarla, se toma en cuenta para el eje X, los Límites reales, y para el eje Y, las frecuencias absolutas.
Polígono de frecuencias: Forma gráfica que representa una distribución de frecuncias en la forma de una línea continua que traza un histograma. Para su elaboración, se consideran las marcas de clase en el eje X y las frecuencias absolutas en el eje Y.
Gráfica de barras: la gráfica de barras es una forma de gráfica que utiliza barras para indicar la frecuencia de ocurrencia de las observaciones. Para construirla se constituye el eje y por las frecuencias absolutas y el eje X por los límites inferior y superior de cada clase, dejando un espacio entre barra y barra.
Medidas de tendencia central:
La tendencia central se refiere al punto medio de una distribución. Las medidas de tendencia central se conocen como medidas de posición.
Media
La media es el punto en una distribución de medidas, alrededor del cual las desviaciones sumadas son iguales a cero. Es el valor promedio de una muestra o población. La media es muy sensible a mediciones extremas que no estén balanceadas en ambos lados. Se pueden calcular diversos tipos de media, siendo las más utilizadas:- Media aritmética: se calcula multiplicando cada valor por el número de veces que se repite. La suma de todos estos productos se divide por el total de datos de la muestra:
La media geométrica se suele utilizar en series de datos como tipos de interés anuales, inflación, etc., donde el valor de cada año tiene un efecto multiplicativo sobre el de los años anteriores. En todo caso, la media aritmética es la medida de posición central más utilizada.
Lo más positivo de la media es que en su cálculo se utilizan todos los valores de la serie, por lo que no se pierde ninguna información.
Sin embargo, presenta el problema de que su valor (tanto en el caso de la media aritmética como geométrica) se puede ver muy influido por valores extremos, que se aparten en exceso del resto de la serie. Estos valores anómalos podrían condicionar en gran medida el valor de la media, perdiendo ésta representatividad.
Mediana
Observación u observación potencial en un conjunto que divide el conjunto, de modo que el mismo número de observaciones estén en cada uno de sus lados. Para un número impar de valores, es el valor de en medio; para un número par es el promedio de los dos medios. Para un conjunto con un número par de números, la mediana será el promedio aritmético de los dos números medios.Ejemplo:
Calcule la mediana para los siguientes datos.
La edad de una muestra de cinco estudiantes es: 21, 25, 19, 20 y 22.
Al ordenar los datos de manera ascendente quedan: 19, 20, 21, 22, 25.
La mediana es 21.
La mediana de una muestra de datos organizados en una distribución de frecuencias se calcula mediante la siguiente fórmula:
Mediana = LRI + [(n/2 - FA)/f] c
donde L es el límite inferior de la clase que contiene a la mediana, FA es la frecuencia acumulada que precede a la clase de la mediana, f es la frecuencia de clase de la mediana e i es el intervalo de clase de la mediana.
MODA
La moda es el valor de la observación que aparece con más frecuencia.Ejemplo:
las calificaciones de un examen de diez estudiantes son:
81, 93, 84, 75, 68, 87, 81, 75, 81, 87.
Como la calificación 81 es la que más ocurre, la calificación modal es 81
La moda de los datos agrupados se aproxima por el punto medio de la clase que contiene la frecuencia de clase mayor.
Cuando dos valores ocurren una gran cantidad de veces, la distribución se llama bimodal, como en dicho ejemplo.
Ejemplo de cálculo de media mediana y moda. Para ejemplificar, tomaremos el ejemplo de autobuses foráneos de la pagina 6.
Clase |
Intervalo
| LRI | LRS | Frec. Absoluta | Frec. Relat | Frec. Porcentual |
X
|
fx
| |
LI
|
LS
| ||||||||
1 |
1
|
2.9
|
0.95
|
2.95
|
8
|
.16
|
16 %
|
1.95
|
15.60
|
2 |
3
|
4.9
|
2.95
|
4.95
|
11
|
.22
|
22 %
|
3.95
|
43.45
|
3 |
5
|
6.9
|
4.95
|
6.95
|
10
|
.20
|
20 %
|
5.95
|
59.50
|
4 |
7
|
8.9
|
6.95
|
8.95
|
10
|
.20
|
20 %
|
7.95
|
79.50
|
5 |
9
|
10.9
|
8.95
|
10.95
|
5
|
.10
|
10 %
|
9.95
|
49.75
|
6 |
11
|
12.9
|
10.95
|
12.95
|
6
|
.12
|
12 %
|
11.95
|
71.70
|
total |
50
|
1
|
100 %
|
319.50
|
- CÁLCULO DE VARIANZA, DESVIACIÓN ESTÁNDAR Y COEFICIENTE DE VARIACIÓN.
Varianza: Mide la distancia existente entre los valores de la serie y la media. Se calcula como sumatorio de las diferencias al cuadrado entre cada valor y la media, multiplicadas por el número de veces que se ha repetido cada valor. El sumatorio obtenido se divide por el tamaño de la muestra.
Desviación estándar: Se calcula como raíz cuadrada de la varianza.
Clase |
Intervalo
| LRI | LRS | Frec. Absoluta | Frec. Relat | Frec. Porcentual |
X
|
fx
|
f(x-x)2
| |
LI
|
LS
| |||||||||
1 |
1
|
2.9
|
0.95
|
2.95
|
8
|
.16
|
16 %
|
1.95
|
15.60
|
157.71
|
2 |
3
|
4.9
|
2.95
|
4.95
|
11
|
.22
|
22 %
|
3.95
|
43.45
|
171.63
|
3 |
5
|
6.9
|
4.95
|
6.95
|
10
|
.20
|
20 %
|
5.95
|
59.50
|
354.03
|
4 |
7
|
8.9
|
6.95
|
8.95
|
10
|
.20
|
20 %
|
7.95
|
79.50
|
632.03
|
5 |
9
|
10.9
|
8.95
|
10.95
|
5
|
.10
|
10 %
|
9.95
|
49.75
|
495.01
|
6 |
11
|
12.9
|
10.95
|
12.95
|
6
|
.12
|
12 %
|
11.95
|
71.70
|
856.82
|
total |
50
|
1
|
100 %
|
319.50
|
2667.21
|
un video donde explica la estadística y la probabilidad
https://www.youtube.com/watch?v=4AnRMRFsk3g
http://www.youtube.com/watch?v=oi0kBINQrMw
Comentarios
Publicar un comentario