Glosario Estadístico: Aprende los Términos Clave en Nuestros Cursos y Tutoriales
Saludos a todos nuestros lectores. En esta ocasión, queremos compartir con ustedes un glosario estadístico que hemos creado especialmente para aquellos que participan en nuestros cursos, tutoriales y capacitaciones relacionados con la estadística. Esta guía te ayudará a comprender y dominar los términos clave utilizados en el fascinante mundo de la estadística.
- Evidencia anecdótica (anectodal evidence): Evidencia, a menudo personal, recopilada de manera informal en lugar de un estudio bien diseñado.
- Población (population): Grupo que nos interesa estudiar. El término “población” se utiliza generalmente para referirse a un grupo de personas, pero también se aplica a otros sujetos.
- Estudio transversal (cross-sectional study): Estudio que recopila datos sobre una población en un punto particular en el tiempo.
- Ciclo (cycle): En un estudio transversal repetido, cada repetición del estudio se denomina ciclo.
- Estudio longitudinal (longitudinal study): Estudio que sigue a una población a lo largo del tiempo, recopilando datos del mismo grupo repetidamente.
- Registro (record): En un conjunto de datos, una colección de información sobre una sola persona u otro sujeto.
- Respondente (respondent): Una persona que responde a una encuesta.
- Muestra (sample): El subconjunto de una población utilizado para recopilar datos.
- Representativo (representative): Una muestra es representativa si cada miembro de la población tiene la misma probabilidad de ser seleccionado en la muestra.
- Sobremuestreo (oversampling): Técnica utilizada para aumentar la representación de una subpoblación con el fin de evitar errores debido a tamaños de muestra pequeños.
- Datos sin procesar (raw data): Valores recopilados y registrados con poca o ninguna verificación, cálculo o interpretación.
- Recodificación (recode): Un valor que se genera mediante cálculos y lógica aplicada a los datos sin procesar.
- Limpieza de datos (data cleaning): Procesos que incluyen la validación de datos, identificación de errores, traducción entre tipos y representaciones de datos, etc.
- Distribución (distribution): Los valores que aparecen en una muestra y la frecuencia de cada uno.
- Histograma (histogram): Una representación gráfica que muestra la frecuencia de los valores en una distribución.
- Frecuencia (frequency): El número de veces que aparece un valor en una muestra.
- Moda (mode): El valor más frecuente en una muestra, o uno de los valores más frecuentes.
- Distribución normal (normal distribution): Una idealización de una distribución en forma de campana; también conocida como distribución Gaussiana.
- Distribución uniforme (uniform distribution): Una distribución en la cual todos los valores tienen la misma frecuencia.
- Cola (tail): La parte de una distribución en los extremos altos y bajos.
- Tendencia central (central tendency): Una característica de una muestra o población que representa un valor promedio o típico.
- Valor atípico (outlier): Un valor que se encuentra lejos de la tendencia central.
- Dispersión (spread): Una medida de qué tan dispersos están los valores en una distribución.
- Estadística resumen (summary statistic): Una estadística que cuantifica algún aspecto de una distribución, como la tendencia central o la dispersión.
- Varianza (variance): Una estadística resumen que se utiliza a menudo para cuantificar la dispersión.
- Desviación estándar (standard deviation): La raíz cuadrada de la varianza, también se utiliza como medida de dispersión.
- Tamaño del efecto (effect size): Una estadística resumen que pretende cuantificar el tamaño de un efecto, como una diferencia entre grupos.
- Clínicamente significativo (clinically significant): Un resultado, como una diferencia entre grupos, que es relevante en la práctica.
- Función de masa de probabilidad (probability mass function - PMF): Representación de una distribución como una función que asigna valores a probabilidades.
- Probabilidad (probability): Una frecuencia expresada como una fracción del tamaño de la muestra.
- Normalización (normalization): El proceso de dividir una frecuencia por el tamaño de la muestra para obtener una probabilidad.
- Percentile rank: El porcentaje de valores en una distribución que son menores o iguales a un valor dado.
- Percentil (percentile): El valor asociado con un determinado percentil rank.
- Función de distribución acumulativa (cumulative distribution function - CDF): Una función que asigna valores a sus probabilidades acumuladas. CDF(x) es la fracción de la muestra que es menor o igual a x.
- CDF inversa (inverse CDF): Una función que asigna una probabilidad acumulada, p, al valor correspondiente.
- Mediana (median): El percentil 50, a menudo utilizado como medida de tendencia central.
- Rango intercuartílico (interquartile range): La diferencia entre el percentil 75 y el percentil 25, utilizado como medida de dispersión.
- Cuartil (quantile): Una secuencia de valores que corresponden a percentiles igualmente espaciados; por ejemplo, los cuartiles de una distribución son los percentiles 25, 50 y 75.
- Reemplazo (replacement): Una propiedad de un proceso de muestreo. “Con reemplazo” significa que un mismo valor puede ser elegido más de una vez; “sin reemplazo” significa que una vez que un valor es elegido, se elimina de la población.
- Distribución empírica (empirical distribution): La distribución de valores en una muestra.
- Distribución analítica (analytic distribution): Una distribución cuya función de distribución acumulativa (CDF) es una función analítica.
- Modelo (model): Una simplificación útil. Las distribuciones analíticas suelen ser buenos modelos de distribuciones empíricas más complejas.
- Tiempo entre llegadas (interarrival time): El tiempo transcurrido entre dos eventos.
- Función de distribución acumulativa complementaria (complementary CDF): Una función que asigna un valor, x, a la fracción de valores que superan a x, que es 1 − CDF(x).
- Distribución normal estándar (standard normal distribution): La distribución normal con media 0 y desviación estándar 1.
- Gráfico de probabilidad normal (normal probability plot): Un gráfico que muestra los valores en una muestra frente a valores aleatorios de una distribución normal estándar.
- Función de densidad de probabilidad (probability density function - PDF): La derivada de una función de distribución acumulativa continua (CDF), una función que asigna un valor a su densidad de probabilidad.
- Densidad de probabilidad (probability density): Una cantidad que se puede integrar sobre un rango de valores para obtener una probabilidad. Si los valores están en unidades de cm, por ejemplo, la densidad de probabilidad está en unidades de probabilidad por cm.
- Estimación de densidad de kernel (kernel density estimation - KDE): Un algoritmo que estima una PDF basándose en una muestra.
- Discretizar (discretize): Aproximar una función o distribución continua con una función discreta. Lo opuesto al suavizado (smoothing).
- Momento crudo (raw moment): Una estadística basada en la suma de datos elevados a una potencia.
- Momento central (central moment): Una estadística basada en la desviación de la media elevada a una potencia.
- Momento estandarizado (standardized moment): Una proporción de momentos que no tiene unidades.
- Asimetría (skewness): Una medida de cuán asimétrica es una distribución.
- Asimetría de la muestra (sample skewness): Una estadística basada en momentos que pretende cuantificar la asimetría de una distribución.
- Coeficiente de asimetría mediana de Pearson (pearson’s median skewness coefficient): Una estadística que pretende cuantificar la asimetría de una distribución basándose en la mediana, la media y la desviación estándar.
- Robusto (robust): Una estadística es robusta si es relativamente inmune al efecto de los valores atípicos.
Bibliografía
[1] Think Stats V2.2. Exploratory Data Analysis in Python
Estos son solo algunos de los términos clave que encontrarás en nuestros cursos y tutoriales. Esperamos que este glosario te sea de utilidad para comprender mejor los conceptos estadísticos y aprovechar al máximo nuestros materiales de aprendizaje.
¡Recuerda que la estadística es una herramienta poderosa en diversas áreas, desde la ciencia y la investigación hasta los negocios y la toma de decisiones! ¡Sigue explorando y aprendiendo con EÓN!
Si tienes alguna pregunta o necesitas más información sobre alguno de estos términos, no dudes en contactarnos. Estamos aquí para ayudarte en tu camino hacia el dominio de la estadística.
¡Hasta la próxima!