También quiero una copia de las respuestas a los ejercicios extraescolares de la cuarta edición de "Estadísticas"... Jia Junping, He Xiaoqun y Jin Yongjin... Estaría muy agradecido.
Respuestas a los ejercicios del Capítulo 4
4.1 (1) Moda: M0=10; Mediana: Posición mediana=n+1/2=5.5, Me= 10; p>
(2) Posición QL=n/4=2.5, QL=4+7/2=5.5; Posición QU=3n/4=7.5, QU=12
(3)
(4) Dado que la media es menor que la mediana y la moda, las ventas de automóviles están sesgadas a la izquierda.
4.2 (1) De los datos de la tabla se puede ver que las edades más frecuentes son 19 y 23, por lo que existe una moda, a saber, M0=19 y M0=23.
Después de ordenar los datos originales, la posición para calcular la mediana es: posición mediana = n+1/2=13, el valor en la posición 13 es 23, por lo que la mediana es Me =23 p>
(2) Posición QL=n/4=6.25, QL==19; Posición QU=3n/4=18.75, QU=26.5
(3)Promedio 600/25=24 , desviación estándar
(4) Coeficiente de asimetría SK=1,08, coeficiente de curtosis K=0,77
(5) Análisis: de la moda, mediana y En promedio, la mayoría de los internautas son 23-24 años. Debido a que la desviación estándar es grande, muestra que existen grandes diferencias en las edades de los internautas. Desde la perspectiva del coeficiente de asimetría, la distribución de edades está sesgada hacia la derecha. Dado que el coeficiente de asimetría es mayor que 1, el grado de asimetría es muy grande. Dado que el coeficiente de curtosis es positivo, se trata de una distribución leptocúrtica.
4.3 (1) El diagrama de tallo y hoja es el siguiente:
Frecuencia de tallo y hoja
5
6
7 5
6 7 8
1 3 4 8 8 1
3
5
(2) 63/9=7,
(3) Dado que los números promedio de los dos métodos de cola son diferentes, se utiliza el coeficiente discreto para comparar.
El primer método de cola: v1=1.97/7.2=0.274; v2=0.714/7=0.102 Dado que v1>v2, indica que el grado de dispersión del primer método de cola es mayor que el de El segundo método de cola.
(4) Elija el método dos porque el tiempo de espera promedio del segundo método de cola es más corto y el grado de dispersión es menor que el del primer método de cola.
4.4 (1) 8223/30=274.1
Posición mediana=n+1/2=15.5, Me=272+273/2=272.5
(2) Posición QL=n/4=7,5, QL==(258+261)/2=259,5; Posición QU=3n/4=22,5, QU=(284+291)/2=287,5
(3)
4.5 (1) Costo promedio de la empresa A = costo total/producción total =
Costo promedio de la empresa B = costo total/producción total=
p>Razón: aunque los costos unitarios de las dos empresas son los mismos, los productos con costos unitarios más bajos representan una proporción mayor de la producción de la empresa B, lo que reduce el costo promedio total.
4.6 (1) (se omite la tabla en el proceso de cálculo), 51200/120=426.67
SK=0.203 K=-0.688
4.7 ( 1) Las alturas medias obtenidas por los dos investigadores deben ser aproximadamente iguales porque el tamaño de la media esencialmente no se ve afectado por el tamaño de la muestra.
(2) La desviación estándar de las alturas obtenidas por los dos investigadores debe ser casi la misma, porque el tamaño de la desviación estándar básicamente no se ve afectado por el tamaño de la muestra.
(3) Los investigadores con muestras más grandes tienen mayores posibilidades de lograr el máximo o el mínimo, porque cuanto mayor sea la muestra, mayor será el rango de variación probable.
4.8 (1) Para comparar la dispersión del peso de alumnado y alumnas se debe utilizar el coeficiente de dispersión. El coeficiente de dispersión del peso de las niñas es v mujer = 5/50 = 0,1 y el coeficiente de dispersión del peso de los niños es v hombre = 5/60 = 0,08, por lo que la diferencia de peso entre las niñas es grande.
(2) Niños: 60×2.2=132 (libras), s=5×2.2=11 (libras)
Niñas: 50×2.2=110 (libras), s =5×2.2=11 (libras)
(3) Suponiendo que el peso corporal está distribuido simétricamente, de acuerdo con la regla general, el número de datos dentro del rango de más o menos 1 desviación estándar del La media es aproximadamente 68%. Por tanto, alrededor del 68% de los niños pesan entre 55 y 65 kg.
(4) Suponiendo que el peso corporal se distribuye simétricamente, según la regla general, el número de datos dentro del rango de más o menos 2 desviaciones estándar de la media es aproximadamente el 95%. Por tanto, alrededor del 95% de los niños pesan entre 40 y 60 kg.
4.9 Determinar calculando la puntuación estándar:
La puntuación del examinado es 1 desviación estándar mayor que la puntuación media en la prueba A, pero sólo mayor que la puntuación media en la prueba B. La puntuación es 0,5 desviaciones estándar. Dado que la puntuación estándar de la prueba A es mayor que la de la prueba B, la prueba A es ideal.
4.10 se juzga por la puntuación estándar La puntuación estándar de cada día es la siguiente:
Fecha Lunes Martes Miércoles Jueves Viernes Sábado Domingo
Puntuación estándar Z. 3 -0,6 -0,2 0,4 -1,8 -2,2 0
Estuvo fuera de control el lunes y el sábado.
4.11
(1) Se debe utilizar el coeficiente discreto porque elimina la influencia de diferentes grupos de niveles de datos.
(2) El coeficiente de dispersión de la altura del grupo de adultos:
El coeficiente de dispersión de la altura del grupo de bebés:
Porque el coeficiente de dispersión de la altura del grupo de bebés es mayor que la del grupo de adultos. El coeficiente de dispersión muestra que el grado de dispersión en la altura del grupo de niños pequeños es relativamente grande.
4.12
(1) La evaluación debe realizarse desde dos aspectos: media y desviación estándar. Al comparar el grado de dispersión de varios métodos, se debe utilizar el coeficiente de dispersión.
(2) La siguiente tabla proporciona las principales estadísticas descriptivas de varios métodos.
Método A Método B Método C
Promedio 165,6
Mediana 165
Moda 164
Desviación estándar 2,13
Rango 8
Valor mínimo 162
Valor máximo 170 Valor medio 128,73
Mediana 129
Moda 128
Desviación estándar 1,75
Rango 7
Valor mínimo 125
Valor máximo 132 Promedio 125,53
p>Mediana 126
Moda 126
Desviación estándar 2,77
Rango 12
Mínimo 116
Valor máximo 128
Desde la perspectiva de la tendencia central de los tres métodos, el método A tiene el resultado promedio más alto, y la mediana y la moda también son más altas que los otros dos métodos. Desde la perspectiva de la discreción, los coeficientes discretos de los tres métodos son: , , . El método A tiene el menor grado de dispersión, por lo tanto, se debe seleccionar el método A.
4.13
(1) Utilice la varianza o la desviación estándar para evaluar el riesgo de inversión.
(2) Se puede ver en el histograma que la dispersión de la tasa de rendimiento de las acciones comerciales es menor, lo que indica que el riesgo de inversión es menor.
(3) Desde la perspectiva del riesgo de inversión, se deben elegir acciones comerciales con menos riesgo. Por supuesto, qué tipo de acciones elegir también tiene mucho que ver con el juicio subjetivo de los inversores.
Respuestas a los ejercicios del capítulo 5
5.1 (1) La puntuación promedio es una variable continua que va de 0 a 100, Ω=
(2) El número de luces verdes que se han encontrado es cualquier número natural comenzando desde 0, Ω=N
(3) No puede haber productos defectuosos o cualquier número de productos defectuosos en los productos producidos anteriormente, Ω=[10 , 11,12,13…….]
5.2 Sea A el conjunto de periódicos diarios, B el conjunto de periódicos vespertinos, A∪B el conjunto de al menos un periódico y A∪B el conjunto de dos periódicos estar suscritos al mismo tiempo El conjunto es A∩B.
P(A∩B)=P(A)+ P(B)-P(A∪B)=0.5+0.65-0.85=0.3
5.3 P(A∪ B)=1/3, P(A∩ )=1/9, P(B)= P(A∪B)- P(A∩ )=2/9
5.4 P(AB) = P(B)P(A∣B)=1/3*1/6=1/18
P( ∪ )=P( )=1- P(AB)=17/18
P( )=1- P(B)=2/3
P( )=P( )+ P( )- P( ∪ )=7/18
P( ∣ )= P( )/P( )=7/12
5.5 Sea la germinación de A el evento A y la germinación de B el evento B.
(1) Dado que hay dos lotes de semillas, los dos eventos son independientes entre sí, por lo que hay: P(AB)= P(B)P(B)=0.56
(2 )P(A∪B)=P(A)+P(B)-P(A∩B)=0.94
(3)P(A)+ P(B) = P(A) P( )+P(B)P( )=0.38
5.6 Supongamos que el producto calificado es el evento A, y el producto de primera clase entre los productos calificados es el evento B
P(AB)= P( A)P(B∣A)=0.96*0.75=0.72
5.7 Suponga que las primeras 5000 horas sin daño son el evento A, y las últimas 5000 horas sin daños es el evento B.
P(A)=1/3, P(AB)=1/2, P(B∣A)= P(AB)/ P(A)=2/3
5.8 Sea el nivel de educación del empleado de la escuela primaria el evento A, el nivel de educación del empleado de la escuela secundaria el evento B, el nivel de educación del empleado de la escuela secundaria el evento C y la edad del empleado menor de 25 años sea el evento D.
P(A)=0.1 P(B)=0.5, P(C)=0.4
P(D∣A)=0.2, P(D∣B)=0.5 , P(D∣C)=0.7
P(A∣D)=
Del mismo modo, P(B∣D)=5/11, P(C∣D)= 28/55
5.9 Supongamos que el producto defectuoso es D. Según la fórmula bayesiana:
P(A|D)= =0.249
Similarmente a P (B∣D)=0.112
5.10 De la distribución binomial: P(x=0)=0.25, P(x=1)=0.5, P(x=2)=0.25
5.11 (1) P(x=100)=0.001, P(x=10)=0.01, P(x=1)=0.2, P(x=0)=0.789
( 2)E(X)=100*0.001+10*0.01+1*0.2=0.4
5.13 Las respuestas correctas a al menos cuatro preguntas incluyen dos situaciones, cuatro son correctas, una es incorrecta y cinco son correcto .
C54 C65 =1/64
5.14 Las propiedades de la distribución de Poisson son:
P (X=1) = , P (X=2) = , podemos obtener =2
P (X=4)=2/3e
5.15
Entonces, cuando k= -1 y k= cuando P (x=k)máx.
5.16 (1) P(>2)= P(x>2)+ P(x<-2)= (0.5)+1- (2.5)=0.6977
Dado que N(3,4) es simétrica con respecto a la media 3, P(x>3)=0.5
5.17 P(120 5.18 ( 1 ) (2) Respuestas de referencia a los ejercicios del Capítulo 7 7.1 (1) Conocido=5, n=40, =25, =0.05 , =1,96 Desviación estándar muestral de la media muestral = = (2) Error de estimación (también llamado error marginal) E= =1,96*0,79=1,55 7.2 (1) Conocido =15, n=49, =120, =0.05, =1.96 (2) La desviación estándar muestral de la media muestral = = 2.14 Error estimado E= =1,96* 4,2 (3) Como se conoce la desviación estándar de la población, el intervalo de confianza del 95% de la media poblacional es: =120 1,96*2,14= 120 4.2 , es decir (115.8,124.2) 7.3 (1) Se sabe que =85414, n=100, =104560, =0.05, =1.96 Dado que la población se conoce la desviación estándar, por lo que el intervalo de confianza del 95 % de la media general es: =104560 1,96* 104560 16741,144, es decir (87818,856, 121301,144) 7,4 (1) se sabe que n=100, =81, s =12, =0.1, =1.645 Dado que n=100 es una muestra grande, el intervalo de confianza del 90% de la media poblacional es: =81 1.645* 81 1.974, es decir ( 79.026,82.974) (2) Conocido =0.05, =1.96 Dado que n=100 es una muestra grande, la El intervalo de confianza del 95% de la media general es: =81 1,96* 81 2,352, es decir (78,648,83,352) (3) Se sabe que =0,01, =2,58 Dado que n=100 es una muestra grande, el intervalo de confianza del 99 % de la media general es: =81 2,58* 81 3,096, es decir (77,94,84,096) 7.5 (1) conocido=3.5, n=60, =25, =0.05, =1.96 Dado que se conoce la desviación estándar de la población, el intervalo de confianza del 95% de la media poblacional es: =25 1.96* 25 0.89, es decir (24.11 ,25.89) (2) Se sabe que n=75, =119.6, s=23.89, =0.02 , =2,33 Dado que n=75 es una muestra grande, la media general El intervalo de confianza del 98 % es: =119,6 2,33* 119,6 6,43, es decir (113,17,126,03) (3) Conocido=3.419, s=0.974, n=32, =0.1, =1.645 Dado que n=32 es una muestra grande, el intervalo de confianza del 90% de la la media general es: =3.419 1.645* 3.419 0.283, es decir (3.136,3.702 ) 7.6 (1) Se sabe que: la población obedece a la distribución normal, =500 , n=15, =8900, =0.05, =1.96 Dado que la población obedece a la distribución normal, por lo tanto, el intervalo de confianza del 95% de la media poblacional es: =8900 1.96* 8900 253.03, es decir (8646.97,9153.03) (2) Se sabe que la población no obedece a la distribución normal, =500, n=35, =8900, =0.05, =1 . 96 Aunque la población no obedece a la distribución normal, dado que n=35 es una muestra grande, el intervalo de confianza del 95% de la media poblacional es: =8900 1.96* 8900 165.65, Es decir (8734.35,9065.65) (3) Se sabe que la población no obedece a la distribución normal, desconocida, n=35, =8900, s=500, =0.1, =1.645 Aunque la población no obedece a la distribución normal, al ser n=35 una muestra grande, el intervalo de confianza del 90% de la media poblacional es: =8900 1.645* 8900 139.03 , es decir, (8760.97,9039.03) (4) Se sabe que la población no obedece a la distribución normal, desconocida, n=35, =8900, s=500, =0.01, =2.58 Aunque la población no obedece a la distribución normal, pero dado que n=35 es una muestra grande, el intervalo de confianza del 99% de la media general es: =8900 2,58* 8900 218.05, es decir (8681.95,9118.05) 7.7 Conocido: n=36, cuando =0.1, 0.05, 0.01, el correspondiente =1.645, =1.96, =2.58 Calculado basado en los datos de la muestra: =3,32, s=1,61 Dado que n=36 es una muestra grande, el intervalo de confianza del 90% del tiempo promedio de Internet es: =3,32 1,645 * 3,32 0,44, es decir, (2,88,3,76) Tiempo promedio en Internet El intervalo de confianza del 95% del tiempo es: =3,32 1,96* 3,32 0,53, es decir (2,79 ,3.85) El intervalo de confianza del 99% del tiempo promedio en línea es: =3.32 2.58* 3.32 0.69, es decir (2.63, 4.01) 7.8 Se sabe que la población obedece a la distribución normal, pero se desconoce, n=8 es una muestra pequeña, =0.05, =2.365 Calculado con base en datos de muestra: =10, s=3.46 El intervalo de confianza del 95% de la media general es: =10 2.365* 10 2.89, es decir (7.11 ,12.89) 7.9 Se sabe que la población obedece a la distribución normal, pero se desconoce n=16 es una muestra pequeña, =0.05, =2.131 Calculada con base en los datos de la muestra: =9.375 , s=4.113
=9.375 2.131* 9.375 2.191, es decir (7.18, 11.57)
7.10 (1) Conocido : n=36, =149.5, =0.05, =1.96
Dado que n=36 es una muestra grande, el intervalo de confianza del 95% de la longitud promedio de la pieza es:
p>
=149,5 1,96* 149,5 0,63, es decir (148,87,150,13)
(2) En la estimación anterior, se utiliza el teorema del límite central en estadística. Este teorema muestra que: de una población con media y varianza, se extrae una muestra aleatoria con capacidad n. Cuando n es lo suficientemente grande (generalmente requerido), la distribución muestral de la media muestral obedece aproximadamente a la distribución normal con media y varianza.
7.12 (1) Conocida: La población obedece a la distribución normal, pero se desconoce n=25 es una muestra pequeña, =0.01, =2.797
Calculada en base a la muestra. datos: =16.128 , s=0.871
El intervalo de confianza del 99% de la media general es:
=16.128 2.797* 16.128 0.487, es decir (15.64,16.62)
7.13 ha Conocido: La población obedece a la distribución normal, pero se desconoce n=18 es una muestra pequeña, =0.1, =1.74
Calculado en base a los datos de la muestra: =13.56, s=7.8
Red El intervalo de confianza del 90% del promedio de horas extras semanales de los empleados de la empresa es:
=13.56 1.74* 13.56 3.2, es decir (10.36,16.76) p>
7.14 (1) Conocido: n =44, p=0.51, =0.01, =2.58
El intervalo de confianza del 99% de la proporción general es:
= 0,51 2,58 =0,51 0,19, es decir, (0,32,0,7)
(2) Conocido: n=300, p=0,82, =0,05, =1,96
El 95% de confianza El intervalo de la proporción general es:
= 0,82 1,96 =0,82 0,04, es decir (0,78,0,86)
(3) Conocido: n=1150, p=0,48, =0,1 ,, =1,645
90 de la proporción global El intervalo de confianza del % es:
=0,48 1,645 =0,48 0,02, es decir (0,46, 0,5)
7.15 Conocido: n=200, p=0.23, cuando es 0.1 y 0.05, el correspondiente =1.645, =1.96
El intervalo de confianza del 90% de la proporción general es: