¿Para qué sirve la estadística?
La estadística hace dos cosas: describir tus datos (resumirlos) y contrastar (decidir si una diferencia es real o fruto del azar). No es magia: es sentido común con números.
No necesitas dominar las fórmulas. Necesitas entender qué prueba usar, qué significan los resultados y qué errores evitar. Eso es lo que verás aquí, con el mínimo de tecnicismos.
Conoce tus variables
Antes de elegir una prueba, identifica qué tipo de variable tienes. Es el paso que más errores evita.
- Continua: números en una escala (edad, tensión, glucemia).
- Categórica nominal: categorías sin orden (sexo, grupo sanguíneo).
- Categórica ordinal: categorías con orden (estadio I-IV, leve/moderado/grave).
- Binaria: dos categorías (sí/no, vivo/fallecido).
Para las continuas hay otra pregunta clave: ¿se distribuyen de forma normal (forma de campana) o no? De ello depende usar pruebas paramétricas (media) o no paramétricas (mediana).
Estadística descriptiva
Antes de comparar nada, describe. La descriptiva es la «foto» de tu muestra y suele ser la Tabla 1 del artículo.
- Continua y normal: media ± DE.
- Continua no normal: mediana [Q1–Q3] (rango intercuartílico).
- Categórica/binaria: n (%).
El valor p, sin misterio
El valor p es probablemente el concepto peor entendido de toda la estadística médica.
El valor p es la probabilidad de observar tu resultado (o uno más extremo) si en realidad no hubiera ningún efecto (la «hipótesis nula»). Si p < 0,05, por convención se considera «estadísticamente significativo».
Lo que el p NO es
- No es la probabilidad de que tu hipótesis sea cierta.
- No mide el tamaño ni la importancia del efecto.
- Un p muy pequeño con una muestra enorme puede corresponder a una diferencia clínicamente irrelevante.
Tamaño del efecto e intervalo de confianza
Más importante que «si hay diferencia» es «cuánta diferencia y con qué precisión». Esto es el tamaño del efecto y su intervalo de confianza.
- Diferencia de medias o de proporciones: cuánto cambia el desenlace.
- Riesgo relativo (RR) u odds ratio (OR): para desenlaces binarios.
- Hazard ratio (HR): para tiempo hasta un evento.
- Cohen's d: para el tamaño de una diferencia entre dos grupos.
- IC95%: el rango plausible del efecto real. Si incluye el 0 (en diferencias) o el 1 (en RR/OR/HR), el resultado no es significativo.
¿Qué prueba estadística uso?
La prueba se elige por el tipo de variable, el número de grupos y la distribución. Esta tabla resuelve la mayoría de casos:
| Qué comparas | Paramétrica | No paramétrica |
|---|---|---|
| 2 grupos independientes · continua | t de Student / Welch | U de Mann-Whitney |
| Mismos sujetos antes/después | t pareada | Wilcoxon |
| 3+ grupos · continua | ANOVA | Kruskal-Wallis |
| Dos variables categóricas | Chi-cuadrado | Test de Fisher (muestras pequeñas) |
| Relación entre 2 continuas | Correlación de Pearson | Spearman |
| Predecir un desenlace binario | Regresión logística | — |
| Tiempo hasta un evento | Kaplan-Meier / Cox | — |
Confusores y análisis multivariante
En estudios observacionales rara vez basta con comparar dos grupos: hay factores de confusión que distorsionan la relación.
Un confusor es una variable asociada tanto a la exposición como al desenlace. Por ejemplo, la edad puede explicar una asociación aparente entre una enfermedad y la mortalidad. La solución habitual es el análisis multivariante (regresión logística, lineal o de Cox), que estima el efecto de tu variable «ajustando» por los demás factores.
Errores que hunden un artículo
- p-hacking: probar muchos análisis hasta que alguno sale p < 0,05.
- Comparaciones múltiples sin corregir (Bonferroni, FDR): a más pruebas, más falsos positivos.
- Muestra sin potencia: pocos pacientes para detectar el efecto buscado.
- Usar la prueba equivocada para el tipo de variable o ignorar la no normalidad.
- Confundir correlación con causalidad.
- Reportar solo el p y olvidar el tamaño del efecto y el IC.
Cómo presentar los resultados estadísticos
Calcular bien no basta: hay que reportar de forma estándar para que cualquier lector (y revisor) lo interprete sin esfuerzo.
- Da el tamaño del efecto con su IC95% y, después, el valor p. No solo el p.
- Redondea con sensatez: 2-3 cifras significativas suelen bastar. Evita «p=0,0000»; escribe «p<0,001».
- Indica siempre el n de cada grupo y los datos perdidos.
- Usa el mismo número de decimales para la misma variable en todo el artículo.
Glosario exprés
| Término | Qué significa |
|---|---|
| p (valor p) | Probabilidad de ver este resultado si no hubiera efecto. p<0,05 = «significativo» por convención. |
| IC95% | Rango plausible del efecto real. Si cruza 0 (diferencias) o 1 (RR/OR/HR), no es significativo. |
| DE | Desviación estándar: dispersión de los datos alrededor de la media. |
| IQR [Q1–Q3] | Rango intercuartílico: dispersión alrededor de la mediana. |
| RR | Riesgo relativo: cuántas veces más probable es el desenlace en un grupo frente a otro. |
| OR | Odds ratio: razón de odds; habitual en caso-control y regresión logística. |
| HR | Hazard ratio: razón de riesgos instantáneos en análisis de supervivencia. |
| Potencia | Probabilidad de detectar un efecto si existe (habitual: 80-90%). |
| α (alfa) | Umbral de error tipo I aceptado, normalmente 0,05. |