Ni poco ni demasiado
El tamaño muestral es cuántos participantes necesitas para que tu estudio pueda detectar el efecto que buscas. No es un número que se inventa al final: se calcula al diseñar, y condiciona todo lo demás.
- Con muy pocos participantes, el estudio no tiene potencia: aunque el efecto exista, no lo verás (y habrás expuesto a personas para nada).
- Con demasiados, gastas recursos de más y expones a participantes innecesariamente.
Lo que entra en el cálculo
Casi cualquier cálculo de tamaño muestral combina estos cuatro elementos:
- Nivel de significación (alfa): el riesgo que aceptas de un falso positivo. Habitualmente 0,05.
- Potencia (1 − beta): la probabilidad de detectar el efecto si existe. Habitualmente 80% o 90%.
- Tamaño del efecto: la diferencia mínima que te interesa detectar (clínicamente relevante).
- Variabilidad: cuánto se dispersan los datos (la desviación estándar) en variables continuas.
Los dos errores que evitas
El alfa y la potencia controlan los dos errores posibles al concluir:
| Hay efecto real | No hay efecto | |
|---|---|---|
| Concluyes que hay efecto | Acierto | Error tipo I (alfa) |
| Concluyes que no hay efecto | Error tipo II (beta) | Acierto |
El error tipo I es afirmar un efecto que no existe (falso positivo); lo limitas con alfa (0,05). El error tipo II es no ver un efecto que sí existe (falso negativo); lo limitas con la potencia (80-90%).
Dos situaciones típicas
Comparar dos medias
Quieres ver si un fármaco baja la tensión arterial frente a placebo. Necesitas: la diferencia mínima relevante (p. ej. 5 mmHg), la desviación estándar esperada (p. ej. 10 mmHg), alfa 0,05 y potencia 80%. Con esos datos, una calculadora te da el n por grupo.
Comparar dos proporciones
Quieres ver si una intervención reduce la mortalidad del 20% al 15%. Necesitas: las dos proporciones (0,20 y 0,15), alfa y potencia. A menor diferencia entre proporciones, mucho mayor muestra.
Lo que casi siempre olvidan
- Pérdidas de seguimiento: si esperas perder un 15%, infla la muestra para compensarlo.
- Comparaciones múltiples: si pruebas muchas hipótesis, hay que corregir el alfa (y sube la muestra).
- Diseño: los diseños por conglomerados o medidas repetidas cambian el cálculo.
- Análisis de subgrupos: requieren mucha más muestra de la que la gente cree.
Software y cuándo pedir ayuda
No tienes que hacerlo a mano. Herramientas habituales:
- G*Power — gratuito y muy usado para los casos frecuentes.
- Paquetes de R (pwr) o módulos de SPSS/Stata.
- Calculadoras online para casos sencillos (dos medias, dos proporciones).