Saltar al contenido principal

kolmogorovSmirnovTest

Introducido en: v23.4.0 Aplica la prueba de Kolmogorov-Smirnov a muestras de dos poblaciones. Los valores de ambas muestras están en la columna sample_data. Si sample_index es igual a 0, el valor de esa fila pertenece a la muestra de la primera población. En caso contrario, pertenece a la muestra de la segunda población. Las muestras deben pertenecer a distribuciones de probabilidad continuas y unidimensionales. Sintaxis
kolmogorovSmirnovTest([alternative, computation_method])(sample_data, sample_index)
Parámetros
  • alternative — Hipótesis alternativa. (Opcional, valor predeterminado: ‘two-sided’.) Sean F(x) and G(x) las CDF de la primera y la segunda distribución, respectivamente. ‘two-sided’: la hipótesis nula es que las muestras provienen de la misma distribución, p. ej., F(x) = G(x) para todo x. La alternativa es que las distribuciones no son idénticas. ‘greater’: la hipótesis nula es que los valores de la primera muestra son estocásticamente menores que los de la segunda, p. ej., la CDF de la primera distribución está por encima y, por tanto, a la izquierda de la de la segunda. Esto significa, de hecho, que F(x) >= G(x) para todo x. La alternativa en este caso es que F(x) < G(x) para al menos un valor de x. ‘less’: la hipótesis nula es que los valores de la primera muestra son estocásticamente mayores que los de la segunda, p. ej., la CDF de la primera distribución está por debajo y, por tanto, a la derecha de la de la segunda. Esto significa, de hecho, que F(x) <= G(x) para todo x. La alternativa en este caso es que F(x) > G(x) para al menos un valor de x. String
  • computation_method — Método utilizado para calcular el valor p. (Opcional, valor predeterminado: ‘auto’.) ‘exact’: el cálculo se realiza usando la distribución de probabilidad exacta de los estadísticos de prueba. Es intensivo en cómputo y poco eficiente salvo para muestras pequeñas. ‘asymp’ (‘asymptotic’): el cálculo se realiza mediante una aproximación. Para tamaños de muestra grandes, los valores p exactos y asintóticos son muy similares. ‘auto’: el método ‘exact’ se utiliza cuando el tamaño máximo de las muestras es inferior a 10’000. String
Argumentos Valor devuelto Devuelve una tupla con dos elementos: un estadístico calculado y un valor p calculado. Tuple(Float64, Float64) Ejemplos Prueba de la misma distribución
Query
SELECT kolmogorovSmirnovTest('less', 'exact')(value, num)
FROM
(
    SELECT
        randNormal(0, 10) AS value,
        0 AS num
    FROM numbers(10000)
    UNION ALL
    SELECT
        randNormal(0, 10) AS value,
        1 AS num
    FROM numbers(10000)
)
Response
┌─kolmogorovSmirnovTest('less', 'exact')(value, num)─┐
│ (0.009899999999999996,0.37528595205132287)         │
└────────────────────────────────────────────────────┘
Prueba de distribuciones diferentes
Query
SELECT kolmogorovSmirnovTest('two-sided', 'exact')(value, num)
FROM
(
    SELECT
        randStudentT(10) AS value,
        0 AS num
    FROM numbers(100)
    UNION ALL
    SELECT
        randNormal(0, 10) AS value,
        1 AS num
    FROM numbers(100)
)
Response
┌─kolmogorovSmirnovTest('two-sided', 'exact')(value, num)─┐
│ (0.4100000000000002,6.61735760482795e-8)                │
└─────────────────────────────────────────────────────────┘
Véase también
Última modificación el 10 de junio de 2026