Diferencia entre desviación estándar y error estándar

Introducción

Estándar Daviación (SD) y Sestándar mierror (SE) parecen ser términos similares; sin embargo, son tan diferentes conceptualmente que se usan casi indistintamente en la literatura estadística. Ambos términos suelen estar precedidos por un símbolo más-menos (+/-), lo que indica que definen un valor simétrico o representan un rango de valores. Por lo general, ambos términos vienen con un promedio (media) de un conjunto de valores medidos.

Curiosamente, SE no tiene nada que ver con estándares, errores o comunicación de datos científicos.

Una mirada detallada al origen y la explicación de SD y SE revelará por qué tanto los estadísticos profesionales como aquellos que lo usan casualmente se equivocan.

Desviación estándar (DE)

SD es un descriptivo una estadística que describe la dispersión de una distribución. Como métrica, es útil cuando los datos se distribuyen normalmente. Sin embargo, es menos útil cuando los datos son muy sesgados o bimodales porque no describen muy bien la forma de la distribución. Normalmente, usamos SD cuando informamos las características de la muestra, porque tenemos la intención de Suelte cuánto varían los datos alrededor de la media. Otras estadísticas útiles para describir la dispersión de los datos son el rango intercuartílico, los percentiles 25 y 75 y el rango de los datos.

Figura 1. SD es una medida de la dispersión de los datos. Cuando los datos son una muestra de una distribución distribuida normalmente, se espera que dos tercios de los datos estén dentro de 1 desviación estándar de la media.

Hay una variedad que descriptivo también una estadística, y se define como el cuadrado de la desviación estándar. Por lo general, no se informa al describir los resultados, pero es una fórmula más manejable matemáticamente (como la suma ciega de cuadrados) y juega un papel en los cálculos estadísticos.

Por ejemplo, si tenemos dos estadísticas pags & C con varianza conocida variable(PAGS) & variable(Q)entonces el cambio en la suma P + Q igual a la suma de las varianzas: variable(P)+variable(Q). Ahora está claro por qué a los estadísticos les gusta hablar de varianza.

Pero las desviaciones estándar tienen un significado importante cuando se trata de dispersión, especialmente cuando los datos se distribuyen normalmente: La media del intervalo +/- 1 DE Es posible esperar capturar 2/3 de la muestra, y el intervalo promedio +- 2 SD espera captar el 95% de la muestra.

SD da una indicación de hasta qué punto las respuestas individuales a una pregunta varían o se «desvían» de la media. SD le dice al investigador qué tan dispersas están las respuestas: ¿están centradas en la media o están dispersas a lo largo y ancho? ¿Todos los encuestados calificaron su producto en la mitad de su escala, o algunos lo aprobaron y otros lo desaprobaron?

Considere un experimento en el que se pide a los encuestados que califiquen un producto en una serie de atributos en una escala de 5 puntos. La media para un grupo de diez encuestados (etiquetados de la ‘A’ a la ‘J’ a continuación) para «buena relación calidad-precio» fue de 3,2 con una SD de 0,4 y la media para «confiabilidad del producto» fue de 3,4 con una SD de 2,1.

A primera vista (mirando solo los recursos) parece que la confiabilidad fue calificada más alta que el valor. Pero la SD de confiabilidad más alta podría indicar (como se muestra en la distribución a continuación) que las respuestas estaban muy polarizadas, donde la mayoría de los encuestados no tenían problemas de confiabilidad (calificaron el atributo con un «5»), pero hubo un segmento pequeño pero importante de encuestados. . problema de confiabilidad y calificación de atributo «1». Mirar el promedio solo cuenta una parte de la historia, sin embargo, la mayoría de las veces, esto es en lo que se enfocan los investigadores. Es importante tener en cuenta la distribución de las respuestas y el FS proporciona una valiosa medida de información al respecto.

Descubre también la:  Diferencia entre Cruz Azul y Escudo Azul
DemandadoBuen valor para el dineroConfiabilidad del producto
A31
b31
C31
D31
mi45
F45
GRAMO35
H35
yo35
j35
Significar3.23.4
estándar desarrollo0.42.1

Primera encuesta: los encuestados calificaron un producto en una escala de 5 puntos

Dos distribuciones de respuestas muy diferentes en una escala de calificación de 5 puntos pueden dar como resultado la misma media. Considere el siguiente ejemplo que muestra valores de respuesta para dos calificaciones diferentes.

En el primer ejemplo (Calificado como «A»), SD es cero porque TODAS las respuestas fueron exactamente el valor medio. Las respuestas individuales no se desviaron en absoluto del promedio.

En una Calificación “B”, aunque la media del grupo es la misma (3.0) que la primera distribución, la Desviación Estándar es mayor. Una Desviación Estándar de 1.15 indica que las respuestas individuales estuvieron, en promedio*, a poco más de un punto de la media.

Demandado«Una calificacióncalificación «B»
A31
b32
C32
D33
mi33
F33
GRAMO33
H34
yo34
j35
Significar3.03.0
estándar desarrollo0.001.15

Segunda encuesta: los encuestados calificaron un producto en una escala de 5 puntos

Otra forma de ver SD es trazar la distribución como un histograma de respuesta. Una distribución con una SD baja se mostraría como una forma alta y estrecha, y una SD grande se indicaría con una forma más ancha.

SD generalmente no indica «correcto o incorrecto» o «mejor o peor»; una SD más baja no es necesariamente más deseable. Se utiliza únicamente como una estadística descriptiva. Describe la distribución en comparación con la media.

Tdescargo de responsabilidad mecánico relacionado con SD

Pensar en SD como «desviación media» es una excelente manera de comprender su significado conceptualmente. Sin embargo, en realidad no se calcula como una media (si lo fuera, lo llamaríamos «desviación media»). En cambio, es un método «estándar» para calcular el valor usando la suma de cuadrados.

A efectos prácticos, el cálculo no es importante. La mayoría de los programas de tabulación, hojas de cálculo u otras herramientas de gestión de datos calcularán la DE por usted. Es más importante entender lo que indican las estadísticas.

Error estándar

es un error estándar conclusión una estadística utilizada cuando se comparan medias muestrales (medias) entre poblaciones. es una medida de eso precisión del medio de la muestra. La media muestral es una estadística derivada de datos con una distribución subyacente. No podemos imaginarlo de la misma manera que los datos, ya que hemos hecho un experimento y solo tenemos un valor. La teoría estadística nos dice que la distribución de la media muestral (para una muestra grande «suficiente y bajo alguna condición de regularidad) es aproximadamente La desviación estándar de esta distribución normal es lo que llamamos el error estándar.

Figura 2. La distribución por el representante inferiorse envía la distribución de los datos, pero la distribución en la parte superior es la distribución teórica de la media muestral. La SD de 20 es una medida de la dispersión de los datos, mientras que la SE de 5 es una medida de la incertidumbre sobre la media de la muestra.

Cuando queremos comparar las medias de los resultados de un experimento de dos muestras del Tratamiento A frente al Tratamiento B, necesitamos estimar con qué precisión hemos medido las medias.

En realidad, lo que nos interesa es la precisión con la que hemos medido la diferencia entre las dos medias. Llamamos a esta medida el error estándar de la diferencia. Puede que no le sorprenda saber que el error estándar de la diferencia en las medias muestrales es una función de los errores estándar de las medias:

Ahora que comprende que el error estándar de la media (SE) y la desviación estándar de la distribución (SD) son dos bestias diferentes, es posible que se pregunte cómo se confundieron en primer lugar. Aunque conceptualmente diferentes, tienen una relación matemática simple:

donde n es el número de puntos de datos.

Descubre también la:  Diferencia entre abstinencia y recuperación

Tenga en cuenta que el error estándar depende de dos componentes: la desviación estándar de la muestra y el tamaño de la muestra. norte. Esto tiene sentido intuitivo: cuanto mayor sea la desviación estándar de la muestra, menos precisos podemos ser acerca de nuestra estimación de la media verdadera.

Además, cuanto mayor sea el tamaño de la muestra, más información tendremos sobre la población y con mayor precisión podremos estimar la media.

SE es una indicación de la fiabilidad del medio. Un SE pequeño es una indicación de que la media de la muestra es una representación más precisa de la media de la población real. Un tamaño de muestra más grande generalmente resultará en un SE más pequeño (aunque el tamaño de muestra no afecta directamente a SD).

La mayoría de las investigaciones de encuestas implican extraer una muestra de una población. Luego hacemos inferencias sobre la población a partir de los resultados obtenidos de esa muestra. Si se extrajo una segunda muestra, es probable que los resultados no coincidan exactamente con la primera muestra. Si el valor del atributo de calificación promedio para una muestra es 3,2, podría ser 3,4 para otra muestra del mismo tamaño. Si tuviéramos que sacar un número infinito de muestras (de igual tamaño) de nuestra población, podríamos mostrar las medias observadas como una distribución. Entonces podríamos calcular un promedio de todas nuestras medias muestrales. Esta media sería igual a la verdadera media de la población. También podemos calcular la DE de la distribución de medias muestrales. La SD de esta distribución de medias muestrales es la SE de cada media muestral individual.

Entonces, tenemos la observación más significativa: SE es la DE de la media poblacional.

Un ejemploSignificar
3.2
2do3.4
3ro3.3
4to3.2
5to3.1
….….
….….
….….
….….
….….
Significar3.3
estándar desarrollo0. 13

Una tabla que muestra la relación entre SD y SE

Ahora está claro que si la SD de esta distribución nos ayuda a comprender qué tan lejos está la media de una muestra de la media real de la población, entonces podemos usar esto para comprender qué tan precisa es cualquier media de la muestra en comparación con la media real. Esa es la esencia de SE.

En realidad, solo hemos extraído una muestra de nuestra población, pero podemos usar este resultado para proporcionar una estimación de la confiabilidad de nuestra media muestral observada.

De hecho, SE nos dice que podemos estar 95% seguros de que nuestra media muestral observada es más o menos aproximadamente 2 (en realidad 1,96) errores estándar de la media poblacional.

La siguiente tabla muestra la distribución de las respuestas de nuestra primera (y única) muestra utilizada para nuestra investigación. Como el SE de 0,13 es bastante pequeño, nos dice que nuestra media está bastante cerca de la media de toda nuestra población. El margen de error (al 95 % de confianza) para nuestra media es (aproximadamente) el doble de ese valor (+/- 0,26), lo que nos dice que es más probable que la verdadera media esté entre 2,94 y 3,46.

DemandadoClasificación
A3
b3
C3
D3
mi4
F4
GRAMO3
H3
yo3
j3
Significar3.2
estándar Error0. 13

Resumen

Muchos investigadores no entienden la distinción entre Desviación estándar y Error estándar, aunque comúnmente se consideran en el análisis de datos. Aunque los cálculos reales para la desviación estándar y el error estándar parecen muy similares, representan dos medidas muy diferentes pero complementarias. SD nos dice la forma de nuestra distribución, qué tan cerca están los valores de los datos individuales del valor medio. SE nos dice qué tan cerca está la media de nuestra muestra de la media de la población total. Juntos, ayudan a brindar una imagen más completa de lo que el promedio por sí solo puede brindarnos.

Wlip.es

Somos entusiastas de la tecnología, la ciencia y sus avances. Nuestra curiosidad nunca se sacia y por eso intentamos investigar y conocer cada día más cosas. Te traemos las diferencias más curiosas sobre conceptos, cosas y mucho más.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *