Advertisement
Advertisement
Advertisement
Advertisement
Uno de los principales objetivos de la investigación y los estudios médicos es aprender qué asociaciones o resultados no son producto del azar. Según el diseño del estudio y los datos que proporciona, se puede aceptar o rechazar una hipótesis, lo que permite determinar la correlación. Las pruebas estadísticas son herramientas utilizadas por los investigadores para obtener información y significado de conjuntos de datos variables. Estas pruebas se presentan en varias formas, incluyendo, por ejemplo, las pruebas de chi-cuadrado y exacta de Fisher, y se eligen en función de las necesidades de los investigadores y de las características de las variables analizadas. Los resultados del estudio pueden considerarse estadísticamente significativos en función de los valores p calculados y los niveles de significancia predeterminados (conocidos como nivel α). Los intervalos de confianza son otra forma de expresar la importancia de un resultado estadístico sin utilizar un valor p.
Última actualización: Ago 1, 2022
Advertisement
Advertisement
Advertisement
Advertisement
Advertisement
Advertisement
Advertisement
Advertisement
La comprobación de hipótesis se utiliza para evaluar la admisibilidad de una hipótesis mediante el análisis de los datos del estudio.
Por ejemplo, una empresa crea un nuevo medicamento X destinado a tratar la hipertensión. La empresa quiere saber si el medicamento X funciona realmente para reducir la presión arterial, por lo que tiene que hacer comprobación de hipótesis.
Pasos para comprobar una hipótesis:
Una hipótesis es una respuesta preliminar a una pregunta de investigación (i.e., una “suposición” sobre cuáles serán los resultados). Hay 2 tipos de hipótesis: la hipótesis nula y la hipótesis alternativa.
Ejemplo 1: rechazar la hipótesis nula
En el ejemplo anterior, si los resultados del ensayo muestran que el medicamento X reduce significativamente la presión arterial (es decir, hay suficientes pruebas estadísticas que lo apoyan), se rechaza la hipótesis nula (que postula que no hay diferencias entre los grupos) con una probabilidad determinada. Obsérvese que estos resultados no pueden confirmar la hipótesis alternativa, sino que solo la apoyan con una probabilidad dada, determinada por la distribución del muestreo en la población estudiada.
Ejemplo 2: no rechazar la hipótesis nula
En el ejemplo anterior, si los resultados del ensayo muestran que el medicamento X no redujo significativamente la presión arterial, el estudio no rechazó la hipótesis nula. Una vez más, hay que tener en cuenta que los resultados no pueden confirmar la hipótesis nula, sino que solo la apoyan con una probabilidad dada, determinada por la distribución del muestreo en la población estudiada
La significancia estadística es la idea de que es muy poco probable que todos los resultados de las pruebas se produzcan simplemente por azar. Para determinar la significancia estadística, es necesario establecer un valor α y calcular un valor p.
Se puede crear un gráfico en el que los posibles resultados del estudio se representen en el eje de las abscisas (x) y la probabilidad de observar cada resultado se represente en el eje de las ordenadas (y). El área bajo la curva representa el valor p.
Mnemotecnia:
“Si la p es baja, la (hipótesis) nula no encaja”.
La elección de la prueba se basa en:
Siempre hay que cuestionar la razonabilidad del modelo. Si el modelo es erróneo, también lo es todo lo demás.
Tenga cuidado con las variables que no son realmente independientes.
Las 3 categorías principales de pruebas estadísticas son:
Nombre de la prueba | Qué es lo que se comprueba en la prueba | Tipos de variables/datos | Ejemplo |
---|---|---|---|
Pruebas de regresión | |||
Regresión lineal simple | Cómo afecta un cambio en la variable de predicción/entrada a la variable de resultado |
|
¿Cómo afecta el peso (predictor) a la esperanza de vida (resultado)? |
Regresión lineal múltiple | Cómo los cambios en las combinaciones de ≥ 2 variables predictoras pueden predecir los cambios en el resultado |
|
¿Cómo afectan el peso y el nivel socioeconómico (predictores) a la esperanza de vida (resultado)? |
Regresión logística | Cómo ≥ 1 variables predictoras pueden afectar a un resultado binario |
|
¿Cuál es el efecto del peso (predictor) sobre la supervivencia (resultado binario: vivo o muerto)? |
Pruebas de comparación | |||
Prueba t pareada | Compara las medias de 2 grupos de la misma población |
|
Comparar el peso de los bebés (resultado) antes y después de la alimentación (predictor). |
Prueba t independiente | Compara las medias de 2 grupos de poblaciones diferentes |
|
¿Cuál es la diferencia de altura media (resultado) entre 2 equipos de baloncesto diferentes (predictor)? |
Análisis de la varianza | Compara las medias de > 2 grupos |
|
¿Cuál es la diferencia en los niveles de glucosa en sangre (resultado) 1, 2 y 3 horas después de una comida (predictores)? |
Pruebas de correlación | |||
Prueba chi-cuadrado | Prueba la fuerza de la asociación entre 2 variables categóricas con un tamaño de muestra mayor |
|
Comparar si la aceptación en la facultad de medicina (variable 1) es más probable si el solicitante ha nacido en el Reino Unido (variable 2). |
Prueba exacta de Fisher | Prueba la fuerza de la asociación entre 2 variables categóricas con un tamaño de muestra menor |
|
Igual que el chi-cuadrado, pero con tamaños de muestra más pequeños |
Prueba r de Pearson | Prueba la fuerza de la asociación entre 2 variables continuas |
|
Comparar cómo el nivel de HbA1c en plasma (variable 1) está relacionado con los niveles de triglicéridos en plasma (variable 2) en pacientes diabéticos. |
Las pruebas de chi-cuadrado se utilizan habitualmente para analizar datos categóricos y determinar si 2 variables categóricas están relacionadas.
Para realizar una prueba de chi-cuadrado, se necesitan 2 datos: los grados de libertad (número de categorías menos 1) y el nivel α (que elige el investigador y suele fijarse en 0,05). Además, los datos deben organizarse en una tabla.
Ejemplo: si se quiere ver si los malabaristas tienen más probabilidades de nacer durante una estación determinada, los datos podrían registrarse en la siguiente tabla:
Categoría (i): temporada de nacimiento | Frecuencia observada de malabaristas en cada estación de nacimiento |
---|---|
Primavera | 66 |
Verano | 82 |
Otoño | 74 |
Invierno | 78 |
Para empezar, hay que determinar las frecuencias esperadas para cada celda de la tabla anterior utilizando la ecuación:
$$ Frecuencia\ esperada = np_{0i} $$donde n = el tamaño de la muestra y p0i es la proporción hipotética en cada categoría i.
En el ejemplo anterior, n = 300 y p0i es ¼, por lo que la frecuencia de celdas esperada es de 300 * 0,25 = 75 en cada celda.
La comprobación estadística se calcula entonces mediante la fórmula estándar de chi-cuadrado:
$$ \chi ^{2} = \sum _{all\ cells} \frac{(observada-esperada)^{2}}{esperada} $$donde 𝝌2 es la prueba estadística que se calcula. para cada “celda” o categoría, la frecuencia esperada se resta de la frecuencia observada; este valor se eleva al cuadrado y luego se divide por la frecuencia esperada. Una vez calculada esta cifra para cada categoría, se suman los números.
Ejemplo de cálculo de 𝝌2: utilizando el ejemplo anterior, la frecuencia esperada en cada celda es 75, por lo que el 𝝌2 puede calcularse como sigue:
Categoría (i): temporada de nacimiento | Frecuencia observada de malabaristas con cada estación de nacimiento | (Observado – esperado)2/esperado |
---|---|---|
Primavera | 66 | (66 ‒ 75)2 / 75 = 1,08 |
Verano | 82 | (82 ‒ 75)2 / 75 = 0,653 |
Otoño | 74 | (74 ‒ 75)2 / 75 = 0,013 |
Invierno | 78 | (78 ‒ 75)2 / 75 = 0,12 |
𝝌2= 1,08 + 0,653 + 0,013 + 0,12 = 1,866
Determinar si la prueba estadística es estadísticamente significativa o no:
Para determinar si esta prueba estadística es estadísticamente significativa, se utiliza la tabla de chi-cuadrado para obtener el número crítico de chi-cuadrado.
Ejemplo de prueba 𝝌2: ¿Tienen los malabaristas más probabilidades de nacer en una determinada estación del año a un nivel de significancia de 0,05?
Categoría (i): temporada de nacimiento | Frecuencia observada de malabaristas con cada estación de nacimiento | (Observado – esperado)2/esperado |
---|---|---|
Primavera | 66 | (66 ‒ 75)2 / 75 = 1,08 |
Verano | 82 | (82 ‒ 75)2 / 75 = 0,653 |
Otoño | 74 | (74 ‒ 75)2 / 75 = 0,013 |
Invierno | 78 | (78 ‒ 75)2 / 75 = 0,12 |
𝝌2= 1,08 + 0,653 + 0,013 + 0,12 = 1,866
Como 1,866 es < 7,81 (nuestro valor crítico), tenemos que no rechazar (i.e., aceptar) la hipótesis nula y concluir que la estación de nacimiento no está asociada con el nacimiento de malabaristas.
Errores comunes:
Similar a la prueba 𝝌2, la prueba exacta de Fisher es una prueba estadística utilizada para determinar si existen asociaciones no aleatorias entre 2 variables categóricas.
Una tabla de contingencia 2 × 2 se establece así:
Y | Z | Total de filas | |
---|---|---|---|
W | A | B | A + B |
X | C | D | C + D |
Total de la columna | A + C | B + D | A + B + C + D (= n) |
El resultado de la prueba estadística, p, se calcula a partir de esta tabla mediante la siguiente fórmula:
$$ p = \frac{(\frac{a+b}{a})(\frac{c+d}{c})}{(\frac{n}{a+c})} = \frac{(\frac{a+b}{b})(\frac{c+d}{d})}{(\frac{n}{b+d})} = \frac{(a+b)! (c+d)! (a+c)! (b+d)!}{a! b! c! d! n!} $$donde p = valor p; A, B, C y D son números de las celdas de una tabla de contingencia básica de 2 × 2; y n = total de A + B + C + D.
Antes de realizar cualquier cálculo, los datos deben presentarse en un formato gráfico sencillo (e.g., gráfico de barras, diagrama de dispersión, histograma).
Tablas de contingencia:
Diagramas de dispersión:
Gráficos de cuadros:
Curvas de supervivencia de Kaplan-Meier
Tablas (una tabla de frecuencias es 1 ejemplo):
Histogramas:
Gráficos de polígonos de frecuencia:
Las tablas de frecuencia, los gráficos de barras/histogramas y los gráficos circulares son tres de las formas más comunes de presentar datos categóricos.
Tablas de frecuencia:
Color del semáforo | Frecuencia |
---|---|
Rojo | 65 |
Amarillo | 5 |
Verde | 30 |
Gráfico de barras:
Gráficos circulares: