EJERCICIO 1. Y x' = 1'1659 .y zx' = 0'1944 . Cuando es un número manejable de datos, usualmente 20 o menos, y hay pocos datos diferentes, se pueden tratar como no agrupados y extraer información valiosa de ellos. Datos : Y a b X a b a S S S r SX e y e' . ' n a N P n.a n.a2 [10,12) 5 11 5 8'333 55 605 [12,14) 11 13 16 26'667 143 1859 [14,16) 19 15 35 58'333 285 4275 [16,18) 21 17 56 93'333 357 6069 [18,20] 4 19 60 100'000 76 1444 60 916 14252 Media 2667'15 60 916. Sus valores concretos son : 963'1665. EJEMPLO : CAMBIO DE VARIABLE. ( )1. PROCEDIMIENTO A SEGUIR EN UN ESTUDIO ESTADÍSTICO. Haciendo uso de las propiedades de las medidas estadísticas ,podremos facilitar y simplificar los cálculos de parámetros estadísticos, realizando un cambio de variable. X b) r = 0'8825 c) y' = 4'5 8 a) Y' = 1 X' = 2 b) sY.X = sY = 0'7845 9 a) Y' = 6 - 2 . ... Examen Estadistica Resuelto con cada una de las soluciones y las respuestas hemos dejado para descargar en formato PDF y ver online aqui al … El primer test dio como media 5 con varianza 2 y, el segundo, media 38 con varianza 12. .A A A A A A A A A1 2 3 1 2 1 3 1 2∩ ∩ ∩ = ∩ TEOREMA DE BAYES : Sean n causas independientes Ai con probabilidades Pr(Ai) conocidas y sea B un suceso que puede presentarse en cada una de ellas, siendo conocidas las probabilidades Pr(B/Ai). FUNDAMENTO : Sobre el eje horizontal marcamos los distintos intervalos, dibujando sobre cada uno de ellos un rectángulo cuya área sea proporcional a la frecuencia que se esté visualizando (Si todos los intervalos tienen la misma amplitud, nos bastará con que la altura de los rectángulos sea proporcional a las frecuencias). Parámetros y estadísticos 1. De ellos repiten curso 16 de Ciencias y sólo 2 de Letras. El proceso seguido en el estudio estadístico de una cierta característica o variable, puede subdividirse en tres pasos sucesivos : A RECOGIDA DE DATOS : Planteado el test o encuesta oportuno y recogidos los datos que correspondan, el primer análisis que realizaremos es el del tipo de variable que pretendemos estudiar (Cualitativa o Cuantitativa ; Discreta o Continua). . . 2 La tabla siguiente contiene los pesos en kg. Cálculo de Moda, Media, Varianza y Desviación típica : Para el cálculo de la media y la varianza utilizamos la tabla auxiliar siguiente. final x final final s2.s C.V 0,4730 (47,30%) x2.x d) Grado de concentración de las notas de este examen. 60 70 30 40 90110100100 0 3015 Escasa relación entre la aceptación y el sexo. • f(z) y f(z') ordenadas de la curva normal, correspondientes a los valores z y z' anteriores. ' '0 8392 3 3705 1 2 8284 2 8284 82 2 a bis) Estamos en condiciones de calcular la recta de regresión de X sobre Y : r b s s b r s s a X YY X X Y = ⇒ = = = ⇒ = − = − =' . ' . ' Su conocimiento permite obtener la covarianza (cuyo cálculo tampoco resulta imprescindible) : r S S S S r S SXY X Y XY X Y= ⇒ = = =. . ' ' . ' . . ' Con estos datos calcular : a) la ecuación de la recta de regresión. El suceso B que conocemos se ha presentado es B = aprobar la prueba. ( ). Ejercicio de estadística descriptiva. Y 1 0 Asignemos los valores 0 y 1 a ambas variables y realicemos el recuento X 1 a b representado en la tabla de la izquierda. . . 26 - Estadística descriptiva (F. Álvarez) 13 a) Determine el número de hombres con edades comprendidas entre los 11 y 15 años. 500 400 5050 550 450550 450 0 798 alta relación entre las variables. . Con esto, la probabilidad pedida será : Pr . Observemos la expresión de la varianza : 21 2 2 . Creciente (pendientes b y b' positivas) próximo a -1 Variables relacionadas inversamente (cuando una aumenta la otra disminuye) Buena recta de ajuste. . ' 6 Los precios de una chaqueta en once establecimientos fueron (en pts. Con estos datos elija, calcule e interprete el coeficiente de correlación adecuado a dicho estudio. . . POLÍGONO DE FRECUENCIAS : Obtenidos enlazando los extremos superiores de las barras. Si la media es representativa de las observaciones (no existen valores extremos exageradamente distanciados de la mayoría), el coeficiente de variación permite comparar la dispersión de dos series estadísticas : mayor coeficiente indica menor homogeneidad, o lo que es lo mismo, mayor dispersión o variabilidad. X Y.∑ = 1.2.1 + 5.2.2 + 9.4.1 = 58 Utilicemos las medias y varianzas de X e Y, así como la covarianza, en los cálculos solicitados. Metodologías de investigación y Estadística 6. Las sumas TD y TP permiten obtener el índice de Gini : G TD TP = − = − = 100 133182 515 100 0 3209 ' ' Concluimos la presencia de una cierta concentración (lo cuál también se advierte con la gráfica). (-2) = -2’4 Como : y Y Y Y y Y y Y N ' ' ' ' ' ' ' '= − ⇒ = + = + = − + = − + = ∑ 2 4 900 100 2 4 9 6 6 26 La empresa de publicidad “VENDEBIEN” quiere saber si existe relación entre la duración de un anuncio en T.V. ( ) . Intervalos x Recuento n N [ e1 , e2 ) x1 /// n1 n1 [ e2 , e3 ) x2 ///// ///// / n2 n1+n2 . . 18 - Regresión y correlación (F. Álvarez) La recta de regresión es : en puntuaciones directas : Y' = -0'4 + 0'8 . El ejemplo representa las frecuencias absolutas acumuladas ( N ). ' . ' 50 250 50150 100 400 200 300 0144 Escasa relación entre consumo de drogas y comisión de delitos. OTROS COEFICIENTES DE CORRELACIÓN NO BASADOS EN EL PEARSON Coeficiente de correlación tetracórica: Puede utilizarse cuando ambas variables son continuas , pero ambas pueden dicotomizarse artificialmente. Regresión y correlación (F. Álvarez) - 33 15 En un grupo de 10 alumnos se han obtenido las calificaciones en Anatomía, separando el ejercicio teórico del práctico. . UTP del Perú SEMANA 2 Estadística Descriptiva y Probabilidades EJERCICIOS RESUELTOS 1. . Pr( ) Pr( ) Pr( )A A A1 2 3 30 90 1 3 = = = = Pr( / ) Pr( / ) Pr( / )B A B A B A1 2 3 12 30 18 30 3 30 = = = La probabilidad pedida es : Pr( / ) . ( ). 10 3. Esta relación teórica sólo se verifica en situaciones ideales y excepcionales (por ejemplo en distribuciones simétricas, donde x Mo Me= = ). Medidas y representaciones gráficas. En ella se incorpora la columna x , que contiene la marca de clase (valor central) de cada intervalo. ! 16 Para los valores 0 y 2 de la variable X se obtuvieron unos pronósticos de la variable dependiente iguales a 6’8617 y 14’0531 respectivamente. PICTOGRAMAS: Con el mismo principio seguido para la construcción de los diagramas de barras, sustituimos dichas barras por dibujos alusivos a la variable estadística estudiada. . ' .= −1 2 IMPORTANTE : Observe los diferentes significados e interpretaciones de r2. . Los gráficos se pueden modificar en la ventana del editor de gráficos. 15 pertenece al intervalo [13,16) : P k kk = + − = ⇒ =13 40 100 8 11 3 15 3833% . . Decil 3º (percentil 30) en [14,16) D P3 30 14 30 60 100 16 19 2 14 2105= = + − = . . . ' En este caso podríamos contar las distintas situaciones, si bien puede efectuarse un desarrollo previo del espacio muestral : CCCC Se obtienen 4 caras CCC+ CC+C C+CC +CCC Se obtienen 3 caras y 1 cruz CC++ C+C+ C++C +CC+ +C+C ++CC Se obtienen 2 caras y 2 cruces C+++ +C++ ++C+ +++C Se obtienen 1 cara y 3 cruces ++++ Se obtienen 4 cruces Del total de 16 situaciones posibles, en 11 de ellas se obtienen al menos dos caras. Se llama Estadística a la ciencia que se preocupa de estudiar las variables y sus comparaciones o relaciones para explicar su comportamiento actual, … Si la proporción de varianza asociada a X es del 70'42% y los valores de la variable dependiente Y son: 1 , 3 , 5 , 6 y 11 a) obtenga las ecuaciones de las dos rectas de regresión b) calcule el coeficiente de correlación c) un pronóstico tipificado 1'1868 , ¿ a qué puntuación directa de X corresponde ?. C ANÁLISIS FINAL : La obtención de muy diversas conclusiones respecto de la variable estudiada, se podrá realizar con auxilio de los diferentes parámetros estadísticos (de centralización , posición , dispersión , etc.) [Luis Rubio Andrada; Rocío … . De los 50 alumnos, una proporción de 0’6 comían en el Colegio. Dada la variable estadística bidimensional (X, Y) … Se nos pide que calculemos los percentiles 40 y 60 de la distribución de estaturas. 100 n1+n2 r1+r2 p1+p2 . Es decir, no son muy elevados ni muy pequeños, ya que una media próxima a cero o muy alta darían valores nulos o infinitos al coeficiente. ''0 977 0 63635 165 0 6364 2 656594 0 977 2 656594 6 73662 2 2 c) 1 - r2 = 1 - 0’9772 = 0’045471 (4’5471%) 20 - Regresión y correlación (F. Álvarez) 18 Las puntuaciones directas obtenidas por 5 sujetos en la escala LKS (Escala de Lucas) y las obtenidas por esos mismos sujetos en el factor C (Control Social) del PSI son las que figura en la tabla final. 2 1. ' Regresión y correlación (F. Álvarez) - 29 36 Con el fin de estudiar si existe o no relación entre las calificaciones en Matemáticas y en Filosofía de COU, seleccionamos 30 alumnos analizando la puntuación final en cada materia . Introducción a la estadística, distribuciones de frecuencias, gráficos estadísticos, medidas de tendencia central, dispersión, posición y forma, con ejemplos resueltos en Microsoft Excel ® … . Para ello se selecciona una muestra y se comprueba que 50 individuos han consumido algún tipo de droga y a la vez han estado implicados en delitos contra la propiedad. Ejercicios de estadística descriptiva resueltos. Ejercicios resueltos de variables estadísticas . Tabla de distribución de frecuencias. Ejemplos de histogramas. Problemas resueltos de variables estadísticas y frecuencias. 1) Señala en qué caso es más conveniente estudiar la población o una muestra. . ' La estadística descriptiva consiste en poner en práctica diferentes tipos de técnicas numéricas y también gráficas con las que se pueden analizar y, en consecuencia, describir un conjunto de … . b) Calcular la moda. Curva de regresión de la media de Y condicionada a X : El procedimiento consiste en sustituir todos los pares de observaciones que tienen el mismo valor de X por un único par que tiene por componentes dicho valor de X y la media de los valores de Y. ... 222 = − − = − − = ∑∑ ∑∑∑ XXN YXYXN b a Y b X Y N b X N = − = − = − =∑ ∑. b) Obtenga la recta de regresión de Y sobre X. c) Obtenga la recta de regresión de X sobre Y. d) Calcule el coeficiente de correlación lineal y el de determinación. - Altura de las personas. 22 2 2 =−=−= ∑ x N xn s iix s sx x= = = 2 2 005 1 416' ' MODA = Valor de mayor frecuencia = 3 PERCENTILES Para la determinación de medidas de posición (percentiles), podemos seguir dos procedimientos de cálculo : 1º) Basado en las frecuencias absolutas acumuladas N : Determinamos el lugar que ocupa : L = k.N / 100 El percentil será el valor cuya frecuencia N primero iguale o supere al lugar L. 2º) Basado en porcentajes acumulados P : El percentil será el valor cuyo porcentaje P primero iguale o supere al orden k del percentil. b) ¿ Cuál de los dos grupos de edades está más disperso ?. Llámanos 964244555 y conoce todos nuestros beneficios. de 20 a menos de 25 15 de 25 a menos de 35 20 de 35 a menos de 45 48 de 45 hasta 65 24 9 Ponga un ejemplo sencillo de una distribución de frecuencias simétrica. . d) Obtener el valor de la mediana, y del 8º decil. Percentil 59 en [16,18) P59 16 59 60 100 35 21 2 16 0381= + − = . ?. [18,20] 4 Coeficientes de asimetría y curtosis. . [ ei , ei+1 ) xi ///// /// ni n1+n2+ ... +ni . Elija y calcule el índice de correlación adecuado para interpretar estos datos. . Estadística Aplicada a las Ciencias Sociales-Casos y problemas resueltos Estadística Descriptiva: presentación de datos Patricio Alcaíno Martínez … . Luego el 57'32% (100 - 42'68) tienen buena comprensión lectora en el grupo A. Así : Pr = 11/16 = 0'6875 Sin proceder al desarrollo de todas las posibilidades : a) Situaciones posibles : VR2,4 = 24 = 16 b) Se obtienen cuatro caras en 1 solo caso Se obtienen tres caras en C4,3 = 4 casos Se obtienen tres caras en C4,2 = 6 casos 3 Una caja contiene seis bolas blancas, tres rojas y dos negras. El suceso B que conocemos se ha presentado es B = ser mujer. b) Resuelva lo solicitado en el apartado anterior mediante un índice que no esté basado en el concepto de correlación de Pearson a) Calcularemos el coeficiente de correlación ρ (rangos de Spearman) al presentarse dos variables ordinales (dos reordenaciones de los 8 alumnos). ϕ (con mayor rigor para valores del coeficiente tetracórico, menores o iguales a 0'5). H M Aceptan a=60 b=30 Rechazan c=40 d=70 Regresión y correlación (F. Álvarez) - 23 En puntuaciones directas En puntuaciones diferenciales ( ) ( ) S f X X Y Y N f X Y N X YXY i i i i i i i i= − − = − ∑ ∑. . ' . ' Y' = 2'7925 - 0'4607 . . 6 - Estadística descriptiva (F. Álvarez) AMPLITUD SEMI-INTERCUARTÍLICA : Q Q Q = −3 1 2 Esta medida de dispersión se basa en medidas de posición (Cuartiles),.Su empleo tendrá sentido en el supuesto de imposibilidad de cálculo de la media. Para ello se encuesta a 200 personas de las cuáles el 50% son mujeres; 40 hombres rechazan el producto mientras que 30 mujeres lo aceptan. . . b) Calculemos ahora el coeficiente de correlación biserial rb : Tomando el menor de los valores de p y q : min (p,q) = min (0'833 , 0'167) = 0'167 obtenemos el valor tabulado del cociente p q f z . ' . . Calcule su moda, media y mediana, verificando que los tres parámetros coinciden. x n 2752 36 2754 54 2756 24 2758 18 4 Una serie familias se han clasificado por su número de hijos, resultando : Nº de hijos 0 1 2 3 4 5 6 7 8 Nº de familias 11 13 20 25 14 10 4 2 1 Se pide: a) Calcular la tabla completa de frecuencias. Estadística descriptiva. . Resulta así : X = 5 +5 = 10 , Y = 10 , S = 2 , S = 3, S = 4' 8X Y XY Luego : b S S a Y b X Y XXY X = = = − = − = − → = − +2 12 10 12 10 2 2 12' . ' Al ser dicotómica la variable sexo, obtendremos el coeficiente de correlación biserial puntual : 14 - Regresión y correlación (F. Álvarez) Y Y=1 Y=0 M = 1 H = 0 n n.X n.X2 n.X1 n.X0 X 1 9 0 9 9 9 9 0 2 7 0 7 14 28 14 0 3 6 2 8 24 72 18 6 4 1 9 10 40 160 4 36 5 1 11 12 60 300 5 55 6 0 18 18 108 648 0 108 24 40 N=64 255 1217 50 205 X1 50 24 2 0833= = ' X0 205 40 5 125= = ' p = =24 64 0 375' q p= = = −40 64 0 625 1' X = =255 64 3 9844' s sX X 2 21217 64 3 9844 3 1404 3 1404 1 7721= − = ⇒ = =' ' ' ' Con esto : r X X s p qbp X = − = − = −1 0 2 0833 5 125 1 7721 0 375 0 625 0 831. . ' 100 . 24 - Regresión y correlación (F. Álvarez) ϕ= − + + + + = − = ad bc a b c d a c b d( ). 6 7 5 e) ¿ Qué proporción de varianza de Y no queda explicada por X ?. Qi = (Ti.. /T).100 Pi - Qi [0,2) 1 2 2 2 2 2 0'297 1'703 [2,4) 3 6 8 8 18 20 2'967 5'033 [4,6) 5 26 34 34 130 150 22'255 11'745 [6,8) 7 40 74 74 280 430 63'798 10'202 [8,10) 9 21 95 95 189 619 91'840 3'160 [10,12] 11 5 100 100 55 674 100 0 N =100 TP = 313 T = 674 TD =31'843 Con TD y TP obtenemos el índice de Gini : G TD TP = − = − = 100 31843 313 100 01495 ' ' Concluimos que existe una concentración muy baja (lo cuál manifestará también la gráfica de Lorenz). . Con mayor rigor, si la media es representativa de las observaciones (no existen valores extremos exageradamente distanciados de la mayoría), es el coeficiente de variación el más adecuado para medir la variabilidad relativa entre dos series estadísticas (mayor coeficiente indica menor homogeneidad; un menor valor indicará menor dispersión o variabilidad). ( ' ). ' Se ha aplicado un test de satisfacción en el trabajo a 88 empleados de una fábrica obteniéndose la tabla de datos adjunta. (B = NO recibir descarga) P(A1) = P(A) = 1/3 P(B/A1) = 1/4 P(A2) = P(B) = 1/3 P(B/A2) = 3/4 P(A3) = P(C) = 1/3 P(B/A3) = 1 P A B P A B( / ) . S f x y NXY i i i i= ∑ . . b) Si suponemos que en el Centro hay 1200 alumnos, ¿ cuáles serían las frecuencias absolutas? Clasificados por orden de puntuación resultó : Alumno 1 2 3 4 5 6 7 8 P. Científica 3º 6º 7º 1º 2º 8º 5º 4º P. Literaria 3º 5º 7º 4º 1º 8º 2º 6º Utilizando el índice adecuado establezca el grado de relación que existe entre las calificaciones de dichas áreas de conocimiento. EJERCICIOS RESUELTOS DE VARIABLE ESTADÍSTICA BIDIMENSIONAL 1. Dividimos las frecuencias según sea la amplitud del intervalo. Nos encontramos con dos distribuciones de calificaciones medidas en distintas escalas. Interv. . ϕ = 1'5 . . TEOREMA DE PROBABILIDADES TOTALES : Pr(A ∪ B) = Pr(A) + Pr(B) - Pr(A ∩ B) Generalizando : Pr( . 5 5 12 c) Calcule e interprete el coeficiente de correlación lineal. x 3º.- En puntuaciones tipificadas: zy' = r .zx zy' = 0'9861 .zx b) Proporción de varianza residual : Cuando se habla de proporción siempre se refiere al cociente entre la varianza total de Y; es decir, a la proporción de varianza de Y que representa la varianza solicitada. Generalizar este resultado y demostrar que si en una distribución de frecuencias de media m, se sustituyen los valores xi por xi + A, manteniendo las frecuencias, la media m' de la nueva distribución verifica : m'= A + m c) Utilizando la igualdad obtenida, ¿cómo podría calcularse más fácilmente la media de la distribución siguiente ? La segunda autonomía . b) Teorema de Bayes : Pr( / ) Pr( ).Pr( / ) Pr( ).Pr( / ) Pr( ).Pr( / ) Pr( ).Pr( / ) ' . ' ! válido para … . ( ) S f X X N f X N XX i i i i i i2 2 2 2= − = − ∑ ∑. ( xxn − 4'2667 21'3333 -4'2667 -388'3615 1657'0090 2'2667 24'9333 -2'2667 -128'1019 290'3644 0'2668 5'0668 -0'2668 -0'3603 0'0961 1'7333 36'4000 1'7333 109'3618 189'5604 3'7333 14'9333 3'7333 208'1375 777'0466 102'6667 -199'3244 2914'0765 Desviación media 7111'1 60 6667'102. . 10 3. . . ; .= − − = − = +1 3 1 1 33 2 3 3 Se consideran observaciones atípicas aquellas que quedan fuera del intervalo : ( Linf , Lsup ) OTRAS MEDIDAS ESTADÍSTICAS. Pr( / ) Pr( ) Pr( ) Pr( ) Pr( ).Pr( / )B A A B A A B A B A= ∩ ∩ = Generalizando : Pr( . El padecer o no una dolencia condiciona el padecer la otra. NOTA :Siendo la variable discreta, no tiene sentido dibujar el polígono de frecuencias. Siendo las dos variables dicotómicas, calculamos el coeficiente de correlación ϕ (phi) . Ejemplo 1: Segn la Asociacin de lucha contra la Bulimia y la Anorexia, las pautas culturales han determinado que la delgadez sea … . ... . 2222.2 =−−=−== rsss YXYe e) Coeficiente de determinación : Es el cuadrado del coeficiente de correlación, representando la proporción de varianza explicada por la variable X (en el ajuste de Y sobre X). X b) r = 0'8188 Elevada relación entre las variables (de tipo directo) c) R2 = r2 = 0'6704 d) Y Y'= = 4’05 sY' 2 =1'2218 4 X =4 sX 2 = 0'5714 Y =1'6508 sY 2 = 0'9257 sXY = -0'5238 a) f = 12 b) b = -0'9167 y' = -0'9167 . Clasificados por orden de puntuación final en cada materia resultó : Alumno 1 2 3 4 5 6 Matemáticas 3º 6º 4º 1º 2º 5º Filosofía 3º 5º 6º 4º 1º 2º a) Utilizando el índice adecuado, basado en el concepto de correlación de Pearson, establezca el grado de relación que existe entre las calificaciones de las dos asignaturas. . ' Estadística Descriptiva Facultad Ciencias Económicas y Empresariales Departamento de Economía Aplicada Profesor: Santiago de la Fuente Fernández 1. 38 - Estadística descriptiva (F. Álvarez) 25 x f Haciendo uso del cálculo de momentos ordinarios de órdenes 1º al 4º, determine el valor de 0 2 la media, varianza, asimetría y curtosis de la distribución de la izquierda. Teorema de Bayes. Una cuantitativa y la otra dicotómica. 10 Se somete a 10 alumnos a dos test diferentes encaminados a medir su percepción visual. 100 n1+n2+ ... +ni r1+r2+ ... +ri p1+p2+ ... +pi . ' ' . x2 (n2 . Trabajo DE ESTADISTICA DESCRIPTITIVA CON EJERCICIOS RESUELTOS Y TODA LA MATERIA DEL CUATRIMESTRE, ... Ejercicios Estadística aplicada resueltos 1ºTS. 0 977 2 646 165 0 6364 0 5454 0 6364 c) S S S S S SY e Y Y Y e 2 2 2 2 2 2 7 003 0 318297 6 684703= + → = − = − =' ' ' ' ' 17 Las puntuaciones estimadas de la variable Y para los valores 3 y 5 de la variable X son 2’4545 y 3’7272 respectivamente. 2 Aplicaremos la fórmula para el cálculo de percentiles para datos agrupados. Ejercicios de Excel para estadística resueltos. La estadística descriptiva es una disciplina que se encarga de recoger, almacenar, ordenar, realizar tablas o gráficos y calcular parámetros básicos sobre el conjunto de datos. . NOTA : Los cálculos de z y f(z) no es preciso realizarlos ya que, para cada valor de la probabilidad p (o q indistintamente), se encuentran tabulados los valores de p.q/f(z). - Numero de artefactos elctricos que existen en el hogar. ¿ En qué test obtuvo mejor calificación con relación al grupo total de alumnos ?. . . Variables estadísticas, ejemplos y ejercicios. 8 Las alturas deben ser proporcionales al área. Facultad de Ciencias del Trabajo Métodos Estadísticos Aplicados a las Auditorías Sociolaborales Francisco Álvarez González Octubre 2005 Estadística descriptiva (F. Álvarez) - 1 ESTADÍSTICA DESCRIPTIVA Métodos Estadísticos Aplicados a las Auditorías Sociolaborales Francisco Álvarez González francisco.alvarez@uca.es Bajo el término “Estadística Descriptiva” se engloban las técnicas que nos permitirán realizar un análisis elemental de las observaciones experimentales observadas. b) Sabiendo que un alumno ha aprobado, ¿ cuál es la probabilidad de que haya elegido el problema A ?. … 10 3. Qi = (Ti.. /T).100 Pi - Qi 1 4 4 20 4 4 5'195 14'805 2 3 7 35 6 10 12'987 22'013 3 3 10 50 9 19 24'675 25'325 4 2 12 60 8 27 35'065 24'935 5 3 15 75 15 42 54'545 20'455 6 2 17 85 12 54 70'130 14'870 7 1 18 90 7 61 79'221 10'779 8 2 20 100 16 77 100 0 N = 20 TP = 515 T = 77 TD =133'182 Uniendo el origen del rectángulo (0 , 0) con los sucesivos puntos (Pi , Qi) obtenemos la curva de Lorenz de la derecha. x nA NA nA.x nA.x2 nB NB nB.x nB.x2 [-0'5,6'5) 3 4 4 12 36 4 4 12 36 [6'5,13'5) 10 6 10 60 600 7 11 70 700 [13'5,20'5) 17 9 19 153 2601 9 20 153 2601 [20'5,27'5) 24 12 31 288 6912 8 28 192 4608 [27'5,34'5] 31 9 40 279 8649 2 30 62 1922 40 792 18798 30 489 9867 a) Calculemos el orden k del percentil que es igual a 19. Calcule el coeficiente de correlación elegido y comente brevemente el resultado obtenido. . . ' . ' . Su propio nombre lo indica, trata de describirLeer más Problema n° 1. Los varones presentan altas puntuaciones en ansiedad y las mujeres bajas. La primera (Tacanyuna) tiene dos habitantes cuyas rentas personales son 30 y 25 M (miles de euros). . RECUENTO Y TABLA DE FRECUENCIAS x recuento n r p N R P 0 ///// /// 8 0'1333 13'33 8 0'1333 13'33 1 ///// ///// / 11 0'1833 18'33 19 0'3167 31'67 2 ///// ///// /// 13 0'2167 21'67 32 0'5333 53'33 3 ///// ///// ///// 15 0'2500 25'00 47 0'7833 78'33 4 ///// ///// 10 0'1667 16'67 57 0'9500 95'00 5 /// 3 0'0500 5'00 60 1'0000 100'00 Totales : N = 60 1'0000 100'00 GRÁFICOS ESTADÍSTICOS APROPIADOS PARA ESTE TIPO DE VARIABLE DIAGRAMA DE BARRAS : Sobre el valor de cada variable dibujamos una barra con altura igual a la frecuencia que deseamos representar (en este caso las absolutas n ). 378 382 100 1200.40 165.100 .40 1 40 = − += − += − i i i i an NN eP 471'1695. Denominamos X e Y a las variables que proporcionan, respectivamente, las clasificaciones en la prueba científica y en la literaria . De aquí : Ml e Q Q Q ai i i i i= + − − = + − − =− − 50 6 50 22 255 63 798 22 255 2 7 33571 1 . ' Esta medida de dispersión es la más característica. Agruparemos o no las observaciones en intervalos en función de los diferentes valores observados. De igual modo puede establecerse la curva de regresión de la media de X condicionada a Y. Así, por ejemplo, la figura muestra los pares siguientes: X=1 : (1,1) , (1,3) sustituidos por el par (1,2) , al ser 2 la media de 1 y 3. 16 La puntuación estimada de la variable Y para un valor 0 de la variable X es 0’5454, siendo la varianza de esta variable 16’5. ... 222 == − − = − − = ∑∑ ∑∑∑ XXN YXYXN b a Y b X= − = − =. ' ¿Y el B ?. x = 0'8 . A mayor puntuación en la prueba Y menor nivel en X. Si las variables X , Y son independientes, la covarianza (medida de variación conjunta) es igual a cero. . Σni = N Σri = 1 Σpi = 100 EJEMPLO : x n r p N R P 2 5 0'125 12'5 5 0'125 12'5 3 10 0'250 25 15 0'375 37'5 4 16 0'400 40 31 0'775 77'5 5 6 0'150 15 37 0'925 92'5 6 3 0'075 7'5 40 1'000 100 40 1 100 GRÁFICOS ESTADÍSTICOS. '1 3 1 08 18 2 2 c) En puntuaciones diferenciales : y’ = b.x , con b r s s y x = = =. ' . ' TIPIFICACIÓN. DESVIACIÓN TÍPICA : 2 2. var x N xn ianzas ii −=== ∑σ Es la raíz cuadrada de la varianza. 1.-. . ' Pr( ).Pr( / ).Pr( / ). . ' a) Inicio x 4 5 1 5 2 3 2 1 1 3 27 x2 16 25 1 25 4 9 4 1 1 9 95 x sx= = = − = 27 10 2 7 95 10 2 7 14872' ; ' ' Ordenando valores : 1 1 1 2 2 3 3 4 5 5 Mediana = 2’5 Moda = 1 Final y 6 8 5 9 3 6 7 6 4 9 63 y2 36 64 25 81 9 36 49 36 16 81 433 y sy= = = − = 63 10 6 3 433 10 6 3 192' ; ' ' Ordenando valores : 3 4 5 6 6 6 7 8 9 9 Mediana = 6 Moda = 6 b) Mejora d 2 3 4 4 1 3 5 5 3 6 36 d2 4 9 16 16 1 9 25 25 9 36 150 d sd= = = − = 36 10 3 6 150 10 3 6 14282' ; ' ' Media de la diferencia : d y x= − = − =6 3 2 7 36' ' ' ( No es válido para dispersiones ) 28 - Estadística descriptiva (F. Álvarez) 15 a) Determine la media, desviación típica, coeficiente de variación, mediana y moda del número de suspensos. xi (ni . y Regresión y correlación (F. Álvarez) - 35 11 a) Y’ = 3’3243 + 2’2162.X b) 0’9729 c) 2’2, 2’96 d) 0’8216, 14’5384 12 rbp = 0’56 13 0’8331 (o bien el 83’31%) 14 1’9543 ; 15’5069 15 ρ = -0’8667 16 a) Y’ = 6’8617 + 3’5957 . ' . ' ( ) ' ' ' . ' COEFICIENTE DE VARIACIÓN : CV x x= σ .100 Mide la representatividad de la media. . Elija razonadamente, calcule e interprete el coeficiente de correlación adecuado, para estudiar la relación entre las puntuaciones de la prueba y la variable sexo. . Estadística 1 TRABAJO PRÁCTICO N°1: ESTADÍSTICA DESCRIPTIVA EJERCICIO 1: Las puntuaciones de una prueba de inteligencia aplicada a 75 alumnos de un curso han sido: 87 105 … ¿ Qué transformación lineal hemos de realizar con ella, para obtener una nueva variable Y que tenga por media 42 y desviación típica 10 ?. tratamientos, las variables que se medirán y cómo se entrenará al equipo de trabajo para el cumplimiento del protocolo. . ' de amplitud en los restantes casos, debemos considerar que el primer intervalo es de 145 a menos de 150 y, el último, de 180 a 185. b) Estaturas p n = p . Sabiendo que la proporción de varianza de la variable Y no asociada a la variación de X es del 17’32%, y la varianza de la variable independiente es 2’9375, calcular : a) la ecuación de la recta de regresión de Y sobre X. b) la varianza de las puntuaciones pronosticadas y la varianza residual. Vista previa parcial del texto. En consecuencia, su valor coincide con el que habríamos obtenido siguiendo el procedimiento de Pearson (r); por ello, su interpretación es la establecida para r . Siendo : X1 la media de los valores de X que se corresponden con un 1 en Y. X0 la media de los valores de X que se corresponden con un 0 en Y. sX la desviación típica de X (considerados sus valores globalmente). 106 610. 6 D DMe x= = 870 7 Se dividen por dos. b) ¿ Cuál de los dos grupos presenta mayor variabilidad ? . .6 1 2 2 − −= ∑ NN d ρ Siendo d las diferencias entre los valores de X e Y. a) Al referirse a intervalos de 5 cm. A Diagramas de barras Para variables cualitativas o cuantitativas no agrupadas en intervalos. . de los alumnos de un curso. Población y muestra 6.2. Aplicar las técnicas … . . ' El Coeficiente de Variación de Pearson es invariante ante un cambio de escala. Aplicar las técnicas estadísticas para el manejo de datos que nos permitan obtener gráficos, medidas de tendencia y calcular probabilidades. 10 3. Tradicionalmente la estadística se ha dividido en dos ramas diferentes: - la estadística descriptiva y, - la inferencia estadística. Tales coeficientes son el de asimetría de Yule y el de curtosis de Kelley. rs YY YY N YY N YY ss YXYe −= − −− = − == ∑ ∑∑∑ La raíz cuadrada de la varianza residual se denomina error típico de la predicción : s s rY X Y. c) la proporción de varianza de la variable Y no asociada a la variación de X. Datos : Y a b X a b a b r SX' . ' b) la varianza de las puntuaciones pronosticadas. . ' . 10/8/2020 EXAMEN FINAL - Estadística descriptiva y probabilidades (CGT) - Remoto Marzo 2020: ESTADISTICA DESCRIPTIVA Y PROBABI… EXAMEN FINAL - Estadística descriptiva y probabilidades (CGT) - Remoto Marzo 2020 Fecha de entrega No hay fecha de entrega Puntos 20 Preguntas 5 Disponible 8 de ago en 15:30 - 8 de ago en 16:40 casi 1 hora Límite de tiempo 70 … La clase de es: . 4 4 − − = ∑ σ N xxn K ii = - 0'620240 ligeramente aplastada (mesocúrtica) 14 a) 3’375 ; 3’0714 ; 3 b) 21% c) 1’3 y 5’1 d) 60'9707% ; 1’1905 15 a) n = 1, 0, 4, 3, 3, 6, 2, 1 N = 1, 1, 5, 8, 11, 17, 19, 20 b) 38'6364 c) 17 d) 4'333 y 5 e) a1 = 4'4 ; a2 = 22'25 ; a3 = 121'7 ; a4 = 703'0625 m1 = 0 ; m2 = 0 ; 2'89 ; m3 = -1'6320 ; m4 = 21'2737 f) A = -0'3322 ; K = -0'4529 ⊗ 16 Índice de Gini = 0'6567 Media = 2'14 ; Mediala = 8 17 Índice de Gini = 0'394 Mediala = 60'5263 ⊗ Puede que sus resultados no coincidan exactamente con los ofrecidos. TABLA DE FRECUENCIAS ABSOLUTAS. ⇒ Y' = 1'5 c) Recta de regresión de X sobre Y : b s s s a X b YXY Y Y ' ' ' . zx X' = 2'6667 - 0'4167 . [16,18) 21 Desviación media. X Mujeres Hombres 11 - 13 8 3 8 - 10 6 5 5 - 7 5 6 2 - 4 1 6 X nM nM.X nH nH.X X n n.X n.X2 2-4 3 1 3 6 18 3 7 21 63 5-7 6 5 30 6 36 6 11 66 396 8-10 9 6 54 5 45 9 11 99 891 11-13 12 8 96 3 36 12 11 132 1584 20 183 20 135 40 318 2934 X X X SM H X= = = = = = = − = 183 20 915 135 20 6 75 318 40 7 95 2934 40 7 95 31862' ; ' ; ' ; ' ' r X X S p qbp M H X = − = − =. '100 77 91 19 8 100 44 58% 100 63 21 16 3 100 48 78% luego, concluimos que el grupo B presenta una mayor variabilidad relativa (44'58 < 48'78), en contra de lo obtenido comparando varianzas. . Con ejercicios y problemas resueltos. Estadística descriptiva (F. Álvarez) - 47 ( ) 3 . VARIANZA : ( ) 2 22 22 .. x N xn N xxn s iiii −= − == ∑∑σ Es la media de los cuadrados de las desviaciones o separaciones de cada una de las observaciones, respecto a la media aritmética. Este bloque temático nos enseña a interpretarlas. Luego : AMPLITUD = 87 - 11 = 76. '0 8 3 2 12 Para x = -2 : y’ = 1’2 . Es decir, expresan con una elevada aproximación la relación matemática (lineal) existente entre las calificaciones en Matemáticas y Lengua. . a) Obtenga su media, mediana y moda. Compare los resultados obtenidos en los apartados a), b) con los de los apartados c), d). Al extraer sucesivamente dos bolas de ella, calcular la probabilidad de que sean de distinto color: a) supuesta la extracción con devolución de la bola extraída b) supuesta la extracción sin devolución de la bola extraída Las posibles situaciones que se ajustan al problema son : BR , BN , RB , RN , NB , NR a) Pr . Si estás en este campo de estudio y buscas apoyo en la resolución de ejercicios de Estadística, estás en el lugar indicado. Decreciente (pendientes b y b' negativas) CURVA DE REGRESIÓN DE LA MEDIA Este método es aplicable cuando una de las dos variables (o las dos) contiene un bajo número de valores distintos. Representa la porción de información no asociada a X. El índice de … '0 8392 2 8284 3 3705 0 7042 0 7042 4 0 7042 5 2 0 3380 La recta de regresión de X sobre Y tiene por ecuación : X' = 0'3380 + 0'7042 . . 29 Elija el coeficiente de correlación más apropiado entre las variables “puntuaciones en un test de inteligencia” (X), y “prejuicio antiprotestante” (Y), teniendo en cuenta el cuadro adjunto. PROBLEMA 7 : Los pesos de 100 animales (en kg) están comprendidos entre 10 y 38. a) En la recta de regresión de Y sobre X : Y' = a + b.X - Para X = 2 , Y' = 3'2 : 3'2 = a + 2.b - Para X = 6 , Y' = 7'2 : 7'2 = a + 6.b Resolviendo el sistema obtenemos : a = 1'2 b = 1 Y' = 1'2 + X Para el cálculo de la recta de regresión de X sobre Y no disponemos de elementos suficientes de momento. . Los resultados de la encuesta se incluyen en la siguiente tabla. Una vez calculados los parámetros estadísticos, en virtud de las propiedades descritas, obtendremos el valor final real de tales parámetros. 915 6 75 3186 20 40 20 40 0 377 Muy débil relación entre las variables, de signo directo. Y c) Coeficiente de correlación : Utilizando la expresión ( )( ) 9648'00207'2.4607'0'. Puedes contactarnos para poder brindarte ayuda en Asesor Universitario. . ' ⇒ hombres más disperso c) Tipificamos 20 en ambos grupos : Z Zbre mujerhom ' ' ' ; ' ' '= − = = − = 20 17 2 17 91 0 662 20 17 26 121824 0 785 Como 0’662 < 0’785 ⇒ Hombre más joven Edad Hombres Mujeres 22 a 25 7 3 19 a 22 9 5 16 a 19 5 6 13 a 16 11 9 10 a 13 8 2 Estadística descriptiva (F. Álvarez) - 27 14 La tabla siguiente nos muestra las calificaciones de 10 alumnos, en un test de cálculo matemático, al inicio del curso y al finalizar el mismo. X b) rM = 0'9924 c) Y’ = 1'9268 + 0'8862 . Asimetría y Curtosis xx − 3). Los cálculos de la mediala, índice de Gini y curva de Lorenz, se obtienen a partir de la siguiente tabla auxiliar: xi ni Ni = Σ ni. Sólo puede ser utilizado cuando los valores de la variable toman valores "normales". En la ecuación que permite calcular rt : • z valor de la curva normal tipificada N(0,1), que deja a su derecha un área m, igual a la menor de las cantidades (a+c)/n o (b+d)/n. Se les clasifica en una distribución de frecuencias, cuyo tamaño de clase es constante e igual a 4. TABLA COMPLETA DE FRECUENCIAS : x n r p N R P x1 n1 r1 = n1 / N p1 = r1 . . . de Madrid dispone de 8 líneas de autobuses para ir de la ciudad al campus universitario. ' ' . ' Es la ciencia que nos proporciona un conjunto de métodos y procedimientos para la recolección, clasificación, análisis e interpretación de datos en forma adecuada para la toma de decisiones cuando prevalecen condiciones de incertidumbre. Es el conjunto sobre el que estamos interesados en obtener conclusiones. 6 = -0’85 ⇒ r2 = 0’7225 (72’25%) c) Alta relación entre las dos pruebas (r=-0’85) y de signo inverso. Alumno 1 2 3 4 5 6 7 8 9 10 Inicio 4 5 1 5 2 3 2 1 1 3 Final 6 8 5 9 3 6 7 6 4 9 a) Determine la media, desviación típica, mediana y moda de las calificaciones al inicio y al final del curso. Ser de distinto palo significa que, por ejemplo, una sea de oros, otra de espadas y otra de bastos. . Y c) La recta de regresión de Y sobre X en puntuaciones típicas es : z r z z zY X Y X' '. ' Con esto : r X X s p q f zb X = − = − = −1 0 4 2 4 8 1487 0 55609 0 2244. . Dicha relación es positiva (directa); es decir, alumnos con altas calificaciones en Matemáticas se corresponden con altas calificaciones en Lengua, y a la inversa. 100 [ e2 , e3 ) x2 n2 n2 . OTROS PROCEDIMIENTOS DE CÁLCULO DEL COEFICIENTE DE CORRELACIÓN r Coeficiente de correlación ϕ (phi) : El siguiente procedimiento se puede utilizar cuando las dos variables X e Y son dicotómicas. En el grupo B : P k kk = = + − → =19 135 30 100 11 9 7 60 24' . x2).x2 N2=n1+n2 P2 = (N2 / N) . Download Free PDF. Calcule la probabilidad de dar en el centro de la diana si dispara 6 flechas. . Luis Tineo Ancajima. Construimos una tabla, con las columnas necesarias para calcular la media estadística, moda, mediana y desviación típica. El ejemplo representa las frecuencias absolutas acumuladas (N). Calculado como r s s s XY X Y = = − = − . ' ' ' . ' La relación entre las variables X , Y será de tipo lineal, cuanto más próximo sea η2 a r2. ( )( ) ( ) 96'0 2396 2308 2381476.40 238.2141331.40 . VARIABLES ESTADÍSTICAS. Hombre Mujer Seleccionado un alumno al azar, calcular la probabilidad 1º 15 25 a) de que sea mujer o estudie 2º 2º 10 30 b) de que no estudie 1º y sea hombre 3º 25 45 c) de que sea mujer sabiendo que no es de 2º a) Pr '= =110 150 0 733 b) Pr '= =35 150 0 233 c) Pr '= =70 110 0 6364 6 Al extraer simultáneamente tres cartas de la baraja española, calcular la probabilidad de que : a) todas sean de oros b) al menos dos sean figuras c) sean del mismo palo d) sean de distinto palo e) no sean del mismo palo a) Las tres de oros : 0121'0 9880 120 3 40 3 10 Pr == ⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ ⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ = b) Dos figuras o tres figuras : 2093'0 9880 2068 3 40 3 12 1 28 . ... Trabajo quimica - … . . Tema: Estadística;Investigación: Editorial: Sucasaire Pilco, Jorge 7 Si en una distribución de frecuencias duplicamos las amplitudes de los intervalos, ¿ qué sucederá, aproximadamente, con los valores de las frecuencias ?. • Valores próximos a cero implican falta de relación entre las variables (independencia). Tal valor de x se denomina marca de clase y es el valor central de cada intervalo.
Cuáles Son Los Principales Problemas Del País, Mejores Universidades Para Estudiar Periodismo En Perú, Ford Sport 2015 Precio, Consejeros Regionales Madre De Dios 2023, Importancia De Los Hábitos Saludables En El Adulto Mayor, Cardigan Harry Styles Precio, Pantalón De Corduroy Hombre, Carcinoma Ductal Infiltrante Grado 3,