Gaussian Process module

`gp`

Gaussian Process utilities for primordial feature analysis.

This module provides core GP functionality for modeling smooth variations in the primordial power spectrum and testing for localized features.

Key capabilities:

Covariance matrix computation with proper kernel design
Log-marginal likelihood landscape visualization
Hyperparameter optimization and validation
Bin resolution constraints for finite data

Physical interpretation:

Length scale \(\ell\): Characteristic scale of smooth variations in log(k) space
Signal variance \(\sigma^2\): Amplitude of deviations from power-law
Noise variance \(\sigma_n^2\): Uncorrelated measurement/cosmic variance uncertainty

`build_kernel(config)`

Build sklearn kernel from configuration.

This is the single source of truth for kernel construction, ensuring consistency across the codebase.

PARAMETER	DESCRIPTION
`config`	Kernel configuration specifying kernel type, \(\sigma\), \(\ell\), and parameters. TYPE: `KernelConfig`

RETURNS	DESCRIPTION
`Kernel`	sklearn Kernel object (without noise component).

RAISES	DESCRIPTION
`ValueError`	If kernel type is unknown or params are invalid.

Examples:

>>> config = KernelConfig(KernelType.RBF, sigma=0.1, length_scale=0.5)
>>> kernel = build_kernel(config)
>>> K = kernel(log_k)  # Evaluate covariance matrix

Source code in src/primefeat/gp.py

def build_kernel(config: KernelConfig) -> Kernel:
    """
    Build sklearn kernel from configuration.

    This is the single source of truth for kernel construction,
    ensuring consistency across the codebase.

    Args:
        config: Kernel configuration specifying kernel type, $\\sigma$, $\\ell$, and parameters.

    Returns:
        sklearn Kernel object (without noise component).

    Raises:
        ValueError: If kernel type is unknown or params are invalid.

    Examples:
        >>> config = KernelConfig(KernelType.RBF, sigma=0.1, length_scale=0.5)
        >>> kernel = build_kernel(config)
        >>> K = kernel(log_k)  # Evaluate covariance matrix
    """
    if config.kernel_type == KernelType.RBF:
        signal_kernel = RBF(
            length_scale=config.length_scale, length_scale_bounds="fixed"
        )

    elif config.kernel_type == KernelType.MATERN:
        nu = config.params.get("nu", 1.5)
        signal_kernel = Matern(
            length_scale=config.length_scale,
            nu=nu,
            length_scale_bounds="fixed",
        )

    elif config.kernel_type == KernelType.RATIONAL_QUADRATIC:
        alpha = config.params["alpha"]
        signal_kernel = RationalQuadratic(
            length_scale=config.length_scale,
            alpha=alpha,
            length_scale_bounds="fixed",
            alpha_bounds="fixed",
        )

    elif config.kernel_type == KernelType.PERIODIC:
        period = config.params["period"]
        # sklearn's ExpSineSquared is the periodic kernel
        signal_kernel = ExpSineSquared(
            length_scale=config.length_scale,
            periodicity=period,
            length_scale_bounds="fixed",
            periodicity_bounds="fixed",
        )

    elif config.kernel_type == KernelType.LOCALLY_PERIODIC:
        # Product of RBF and Periodic
        period = config.params["period"]
        length_scale_rbf = config.params["length_scale_rbf"]

        rbf_kernel = RBF(length_scale=length_scale_rbf, length_scale_bounds="fixed")

        periodic_kernel = ExpSineSquared(
            length_scale=config.length_scale,
            periodicity=period,
            length_scale_bounds="fixed",
            periodicity_bounds="fixed",
        )

        signal_kernel = rbf_kernel * periodic_kernel

    else:
        raise ValueError(f"Unknown kernel type: {config.kernel_type}")

    # Apply signal amplitude: $\\sigma^2$ * kernel
    full_kernel = (
        ConstantKernel(config.sigma**2, constant_value_bounds="fixed") * signal_kernel
    )

    return full_kernel

`build_noise_covariance(n, noise_level=None, noise_cov=None)`

Build noise covariance matrix.

Supports two modes:

Diagonal noise (simple): \(\sigma_n^2 I\)
Full posterior covariance (recommended for MCMC): \(\Sigma_{\mathrm{post}}\)

PARAMETER	DESCRIPTION
`n`	Number of data points. TYPE: `int`
`noise_level`	Diagonal noise standard deviation \(\sigma_n\) (used if noise_cov=None). TYPE: `Optional[float]` DEFAULT: `None`
`noise_cov`	Full N×N posterior covariance matrix \(\Sigma_{\mathrm{post}}\). TYPE: `Optional[ndarray]` DEFAULT: `None`

RETURNS	DESCRIPTION
`ndarray`	Noise covariance matrix of shape (n, n).

RAISES	DESCRIPTION
`ValueError`	If neither noise_level nor noise_cov provided, or shape mismatch.

Source code in src/primefeat/gp.py

def build_noise_covariance(
    n: int,
    noise_level: Optional[float] = None,
    noise_cov: Optional[np.ndarray] = None,
) -> np.ndarray:
    """
    Build noise covariance matrix.

    Supports two modes:

    1. Diagonal noise (simple): $\\sigma_n^2 I$
    2. Full posterior covariance (recommended for MCMC): $\\Sigma_{\\mathrm{post}}$

    Args:
        n: Number of data points.
        noise_level: Diagonal noise standard deviation $\\sigma_n$ (used if noise_cov=None).
        noise_cov: Full N×N posterior covariance matrix $\\Sigma_{\\mathrm{post}}$.

    Returns:
        Noise covariance matrix of shape (n, n).

    Raises:
        ValueError: If neither noise_level nor noise_cov provided, or shape mismatch.
    """
    if noise_cov is not None:
        if noise_cov.shape != (n, n):
            raise ValueError(
                f"noise_cov must be shape ({n}, {n}), got {noise_cov.shape}"
            )
        return noise_cov
    elif noise_level is not None:
        return noise_level**2 * np.eye(n)
    else:
        raise ValueError("Either noise_level or noise_cov must be provided")

`compute_kernel_matrix(log_k, kernel_config)`

Compute kernel covariance matrix (signal only, no noise).

Useful for visualizing kernel structure and comparing kernels.

PARAMETER	DESCRIPTION
`log_k`	\(\log(k)\) values, shape (n,) or (n, 1). TYPE: `ndarray`
`kernel_config`	Kernel configuration specifying type and hyperparameters. TYPE: `KernelConfig`

RETURNS	DESCRIPTION
`ndarray`	Signal covariance matrix \(K_{\mathrm{signal}}\) of shape (n, n).

Source code in src/primefeat/gp.py

def compute_kernel_matrix(
    log_k: np.ndarray,
    kernel_config: KernelConfig,
) -> np.ndarray:
    """
    Compute kernel covariance matrix (signal only, no noise).

    Useful for visualizing kernel structure and comparing kernels.

    Args:
        log_k: $\\log(k)$ values, shape (n,) or (n, 1).
        kernel_config: Kernel configuration specifying type and hyperparameters.

    Returns:
        Signal covariance matrix $K_{\\mathrm{signal}}$ of shape (n, n).
    """
    log_k = np.asarray(log_k).reshape(-1, 1)
    kernel = build_kernel(kernel_config)
    return kernel(log_k)

`compare_kernels(log_k, configs)`

Compute kernel matrices for multiple configurations.

Useful for comparing how different kernels represent correlation structure.

PARAMETER	DESCRIPTION
`log_k`	\(\log(k)\) values, shape (n,) or (n, 1). TYPE: `ndarray`
`configs`	Dictionary mapping names to KernelConfig objects. TYPE: `Dict[str, KernelConfig]`

RETURNS	DESCRIPTION
`Dict[str, ndarray]`	Dictionary mapping names to kernel matrices.

Examples:

>>> log_k = np.linspace(-7, -1.5, 20)
>>> configs = {
...     'RBF': KernelConfig(KernelType.RBF, 0.1, 0.5),
...     'RQ_low_alpha': KernelConfig(KernelType.RATIONAL_QUADRATIC, 0.1, 0.5, {'alpha': 0.5}),
...     'RQ_high_alpha': KernelConfig(KernelType.RATIONAL_QUADRATIC, 0.1, 0.5, {'alpha': 10.0}),
... }
>>> matrices = compare_kernels(log_k, configs)

Source code in src/primefeat/gp.py

def compare_kernels(
    log_k: np.ndarray,
    configs: Dict[str, KernelConfig],
) -> Dict[str, np.ndarray]:
    """
    Compute kernel matrices for multiple configurations.

    Useful for comparing how different kernels represent correlation structure.

    Args:
        log_k: $\\log(k)$ values, shape (n,) or (n, 1).
        configs: Dictionary mapping names to KernelConfig objects.

    Returns:
        Dictionary mapping names to kernel matrices.

    Examples:
        >>> log_k = np.linspace(-7, -1.5, 20)
        >>> configs = {
        ...     'RBF': KernelConfig(KernelType.RBF, 0.1, 0.5),
        ...     'RQ_low_alpha': KernelConfig(KernelType.RATIONAL_QUADRATIC, 0.1, 0.5, {'alpha': 0.5}),
        ...     'RQ_high_alpha': KernelConfig(KernelType.RATIONAL_QUADRATIC, 0.1, 0.5, {'alpha': 10.0}),
        ... }
        >>> matrices = compare_kernels(log_k, configs)
    """
    log_k = np.asarray(log_k).reshape(-1, 1)
    return {name: build_kernel(config)(log_k) for name, config in configs.items()}

`compute_bin_resolution(nbins, k_start, k_end)`

Compute resolution limits imposed by finite binning.

With finite bins over a finite \(k\)-range, we cannot resolve arbitrarily small correlation lengths. This function computes the minimum resolvable length scale and warns if requested parameters are below this limit.

PARAMETER	DESCRIPTION
`nbins`	Number of bins. TYPE: `int`
`k_start`	Start of \(k\)-range in \(\mathrm{Mpc}^{-1}\). TYPE: `float`
`k_end`	End of \(k\)-range in \(\mathrm{Mpc}^{-1}\). TYPE: `float`

RETURNS	DESCRIPTION
`Dict[str, Any]`	Dictionary with: - delta_log_k: Bin spacing in \(\log(k)\) space - log_k_range: Total range in \(\log(k)\) space - min_resolvable_length: Minimum length scale we can constrain (~2 bins) - max_sensible_length: Maximum useful length scale (~half range)

Examples:

>>> res = compute_bin_resolution(20, 0.001, 0.23)
>>> print(f"Min length scale: {res['min_resolvable_length']:.3f}")
>>> print(f"Max length scale: {res['max_sensible_length']:.3f}")

Source code in src/primefeat/gp.py

def compute_bin_resolution(nbins: int, k_start: float, k_end: float) -> Dict[str, Any]:
    """
    Compute resolution limits imposed by finite binning.

    With finite bins over a finite $k$-range, we cannot resolve arbitrarily
    small correlation lengths. This function computes the minimum resolvable
    length scale and warns if requested parameters are below this limit.

    Args:
        nbins: Number of bins.
        k_start: Start of $k$-range in $\\mathrm{Mpc}^{-1}$.
        k_end: End of $k$-range in $\\mathrm{Mpc}^{-1}$.

    Returns:
        Dictionary with:
            - delta_log_k: Bin spacing in $\\log(k)$ space
            - log_k_range: Total range in $\\log(k)$ space
            - min_resolvable_length: Minimum length scale we can constrain (~2 bins)
            - max_sensible_length: Maximum useful length scale (~half range)

    Examples:
        >>> res = compute_bin_resolution(20, 0.001, 0.23)
        >>> print(f"Min length scale: {res['min_resolvable_length']:.3f}")
        >>> print(f"Max length scale: {res['max_sensible_length']:.3f}")
    """
    log_k_range = np.log(k_end) - np.log(k_start)
    delta_log_k = log_k_range / nbins

    # Nyquist-like limit: need at least ~2 bins to resolve a feature
    min_resolvable_length = 2 * delta_log_k

    # Features spanning > half the range are not well-constrained
    max_sensible_length = log_k_range / 2

    return {
        "delta_log_k": delta_log_k,
        "log_k_range": log_k_range,
        "min_resolvable_length": min_resolvable_length,
        "max_sensible_length": max_sensible_length,
        "recommended_length_range": (min_resolvable_length, max_sensible_length),
    }

`validate_hyperparameters(sigma, length_scale, nbins, k_start, k_end, warn=True)`

Validate GP hyperparameters against bin resolution limits.

PARAMETER	DESCRIPTION
`sigma`	Signal standard deviation \(\sigma\). TYPE: `float`
`length_scale`	RBF kernel length scale \(\ell\) in \(\log(k)\) space. TYPE: `float`
`nbins`	Number of bins. TYPE: `int`
`k_start`	Start of \(k\)-range in \(\mathrm{Mpc}^{-1}\). TYPE: `float`
`k_end`	End of \(k\)-range in \(\mathrm{Mpc}^{-1}\). TYPE: `float`
`warn`	Whether to print warnings. TYPE: `bool` DEFAULT: `True`

RETURNS	DESCRIPTION
`bool`	True if parameters are within reasonable bounds, False otherwise.

Source code in src/primefeat/gp.py

def validate_hyperparameters(
    sigma: float,
    length_scale: float,
    nbins: int,
    k_start: float,
    k_end: float,
    warn: bool = True,
) -> bool:
    """
    Validate GP hyperparameters against bin resolution limits.

    Args:
        sigma: Signal standard deviation $\\sigma$.
        length_scale: RBF kernel length scale $\\ell$ in $\\log(k)$ space.
        nbins: Number of bins.
        k_start: Start of $k$-range in $\\mathrm{Mpc}^{-1}$.
        k_end: End of $k$-range in $\\mathrm{Mpc}^{-1}$.
        warn: Whether to print warnings.

    Returns:
        True if parameters are within reasonable bounds, False otherwise.
    """
    res = compute_bin_resolution(nbins, k_start, k_end)

    is_valid = True

    # Check length scale
    if length_scale < res["min_resolvable_length"]:
        if warn:
            warnings.warn(
                f"Length scale $\\ell$={length_scale:.3f} is below minimum resolvable "
                f"scale {res['min_resolvable_length']:.3f}. "
                f"With {nbins} bins, features narrower than ~2 bins cannot be distinguished "
                f"from noise. Consider using $\\ell$ >= {res['min_resolvable_length']:.3f}."
            )
        is_valid = False

    if length_scale > res["max_sensible_length"]:
        if warn:
            warnings.warn(
                f"Length scale $\\ell$={length_scale:.3f} is larger than half the $k$-range "
                f"({res['max_sensible_length']:.3f}). Such broad features are poorly "
                f"constrained by the data. Consider using $\\ell$ <= {res['max_sensible_length']:.3f}."
            )
        is_valid = False

    # Check sigma
    if sigma < 0:
        raise ValueError(f"Signal variance $\\sigma$ must be non-negative, got {sigma}")

    if sigma > 1.0:
        if warn:
            warnings.warn(
                f"Signal amplitude $\\sigma$={sigma:.3f} is very large (>1.0). "
                f"This implies order-unity deviations from the power-law, "
                f"which may not be physically motivated."
            )

    return is_valid

`build_gp_covariance(log_k, length_scale=None, sigma=None, noise_level=0.01, noise_cov=None, return_cholesky=False, kernel_config=None, backend=None)`

Build GP covariance matrix for given kernel configuration.

\[K = K_{\mathrm{signal}}(\mathrm{config}) + \Sigma_{\mathrm{noise}}\]

Supports multiple kernel types through KernelConfig:

- RBF (Squared Exponential): default, infinitely smooth
- Rational Quadratic: multi-scale structure
- Periodic: exactly repeating patterns
- Locally Periodic: periodic with varying amplitude

PARAMETER	DESCRIPTION
`log_k`	\(\log(k)\) values, shape (n, 1) or (n,). TYPE: `ndarray`
`noise_level`	Diagonal noise standard deviation \(\sigma_n\) (used if noise_cov=None). TYPE: `Optional[float]` DEFAULT: `0.01`
`noise_cov`	Full N×N posterior covariance matrix \(\Sigma_{\mathrm{post}}\) (RECOMMENDED for MCMC bins). If provided, this accounts for bin-bin correlations. Extract from MCMC: np.cov(delta_samples.T) TYPE: `Optional[ndarray]` DEFAULT: `None`
`return_cholesky`	If True, return Cholesky factor instead of K. TYPE: `bool` DEFAULT: `False`
`kernel_config`	KernelConfig object specifying kernel type and parameters (NEW). TYPE: `Optional[KernelConfig]` DEFAULT: `None`
`length_scale`	(Backward compatibility) RBF kernel length scale \(\ell\) in \(\log(k)\) space. TYPE: `Optional[float]` DEFAULT: `None`
`sigma`	(Backward compatibility) Signal standard deviation \(\sigma\) (GP amplitude). TYPE: `Optional[float]` DEFAULT: `None`
`backend`	Backend to use ('numpy', 'jax', or None for default). If None, uses current implementation (numpy). TYPE: `Optional[str]` DEFAULT: `None`

RETURNS	DESCRIPTION
`ndarray`	Covariance matrix K of shape (n, n), or lower Cholesky factor L if return_cholesky=True.

Examples:

Rational Quadratic kernel:

>>> config = KernelConfig(
...     KernelType.RATIONAL_QUADRATIC,
...     sigma=0.1,
...     length_scale=0.5,
...     params={'alpha': 2.0}
... )
>>> K = build_gp_covariance(log_k, kernel_config=config, noise_level=0.01)

Periodic kernel:

>>> config = KernelConfig(
...     KernelType.PERIODIC,
...     sigma=0.1,
...     length_scale=0.3,
...     params={'period': 1.5}
... )
>>> K = build_gp_covariance(log_k, kernel_config=config, noise_level=0.01)

Backward compatible RBF (old API):

>>> K = build_gp_covariance(log_k, length_scale=0.5, sigma=0.1, noise_level=0.01)

Full posterior covariance (MCMC bins):

>>> delta_samples = np.array([chain[f'delta_{i}'] for i in range(1, 21)]).T
>>> posterior_cov = np.cov(delta_samples.T)
>>> K = build_gp_covariance(log_k, kernel_config=config, noise_cov=posterior_cov)

Use JAX backend:

>>> K = build_gp_covariance(log_k, kernel_config=config, backend='jax')

Source code in src/primefeat/gp.py

def build_gp_covariance(
    log_k: np.ndarray,
    length_scale: Optional[float] = None,
    sigma: Optional[float] = None,
    noise_level: Optional[float] = 0.01,
    noise_cov: Optional[np.ndarray] = None,
    return_cholesky: bool = False,
    kernel_config: Optional[KernelConfig] = None,
    backend: Optional[str] = None,
) -> np.ndarray:
    """
    Build GP covariance matrix for given kernel configuration.

    $$K = K_{\\mathrm{signal}}(\\mathrm{config}) + \\Sigma_{\\mathrm{noise}}$$

    Supports multiple kernel types through KernelConfig:

        - RBF (Squared Exponential): default, infinitely smooth
        - Rational Quadratic: multi-scale structure
        - Periodic: exactly repeating patterns
        - Locally Periodic: periodic with varying amplitude

    Args:
        log_k: $\\log(k)$ values, shape (n, 1) or (n,).
        noise_level: Diagonal noise standard deviation $\\sigma_n$ (used if noise_cov=None).
        noise_cov: Full N×N posterior covariance matrix $\\Sigma_{\\mathrm{post}}$ (RECOMMENDED for MCMC bins).
                   If provided, this accounts for bin-bin correlations.
                   Extract from MCMC: np.cov(delta_samples.T)
        return_cholesky: If True, return Cholesky factor instead of K.
        kernel_config: KernelConfig object specifying kernel type and parameters (NEW).
        length_scale: (Backward compatibility) RBF kernel length scale $\\ell$ in $\\log(k)$ space.
        sigma: (Backward compatibility) Signal standard deviation $\\sigma$ (GP amplitude).
        backend: Backend to use ('numpy', 'jax', or None for default). If None, uses
                 current implementation (numpy).

    Returns:
        Covariance matrix K of shape (n, n), or lower Cholesky factor L if return_cholesky=True.

    Examples:
        Rational Quadratic kernel:

        >>> config = KernelConfig(
        ...     KernelType.RATIONAL_QUADRATIC,
        ...     sigma=0.1,
        ...     length_scale=0.5,
        ...     params={'alpha': 2.0}
        ... )
        >>> K = build_gp_covariance(log_k, kernel_config=config, noise_level=0.01)

        Periodic kernel:

        >>> config = KernelConfig(
        ...     KernelType.PERIODIC,
        ...     sigma=0.1,
        ...     length_scale=0.3,
        ...     params={'period': 1.5}
        ... )
        >>> K = build_gp_covariance(log_k, kernel_config=config, noise_level=0.01)

        Backward compatible RBF (old API):

        >>> K = build_gp_covariance(log_k, length_scale=0.5, sigma=0.1, noise_level=0.01)

        Full posterior covariance (MCMC bins):

        >>> delta_samples = np.array([chain[f'delta_{i}'] for i in range(1, 21)]).T
        >>> posterior_cov = np.cov(delta_samples.T)
        >>> K = build_gp_covariance(log_k, kernel_config=config, noise_cov=posterior_cov)

        Use JAX backend:

        >>> K = build_gp_covariance(log_k, kernel_config=config, backend='jax')
    """
    log_k = np.asarray(log_k).reshape(-1, 1)
    n = len(log_k)

    # === BACKWARD COMPATIBILITY ===
    # If old API used (length_scale, sigma), create RBF kernel config
    if kernel_config is None:
        if length_scale is None or sigma is None:
            raise ValueError(
                "Either provide kernel_config, or both length_scale and sigma "
                "for backward compatibility with RBF kernel"
            )
        kernel_config = KernelConfig(
            kernel_type=KernelType.RBF, sigma=sigma, length_scale=length_scale
        )

    # === BACKEND DISPATCH ===
    # Try to use backend if available and requested
    if BACKENDS_AVAILABLE and backend is not None:
        # Get backend instance
        if backend == "numpy":
            from .backends.numpy.gp import get_numpy_backend

            backend_impl = get_numpy_backend()
        elif backend == "jax":
            from .backends.jax.gp_jax import get_jax_backend

            backend_impl = get_jax_backend()
        else:
            raise ValueError(f"Unknown backend: {backend}. Use 'numpy' or 'jax'.")

        # Use backend's build_gp_covariance method
        # Note: backends don't support return_cholesky, so handle it here
        K = backend_impl.build_gp_covariance(
            log_k,
            mean=None,  # Not used by backends currently
            cov=noise_cov,
            sigma=kernel_config.sigma,
            length_scale=kernel_config.length_scale,
            kernel_config=kernel_config,
            noise_level=noise_level,
        )

        if return_cholesky:
            L, lower = _safe_cholesky(K)
            return L
        return K

    # === FALLBACK TO NUMPY IMPLEMENTATION ===
    # BUILD SIGNAL KERNEL
    signal_kernel = build_kernel(kernel_config)
    K_signal = signal_kernel(log_k)

    # BUILD NOISE COVARIANCE
    K_noise = build_noise_covariance(n, noise_level, noise_cov)

    # TOTAL COVARIANCE
    K = K_signal + K_noise

    if return_cholesky:
        L, lower = _safe_cholesky(K)
        return L

    return K

`compute_log_marginal_likelihood(delta_values, log_k, length_scale=None, sigma=None, noise_level=0.01, noise_cov=None, kernel_config=None, backend=None)`

Compute log-marginal likelihood for given GP hyperparameters.

\[\log p(\delta | \theta) = -\frac{1}{2} \delta^T K^{-1} \delta - \frac{1}{2} \log|K| - \frac{n}{2} \log(2\pi)\]

where \(K = K_{\mathrm{signal}}(\theta) + \Sigma_{\mathrm{noise}}\)

This is the probability of observing the data \(\delta\) under the GP model with hyperparameters \(\theta\). Higher values indicate better fit.

Components:

Data fit term: \(-\frac{1}{2} \delta^T K^{-1} \delta\) (reward fitting the data)
Complexity penalty: \(-\frac{1}{2} \log|K|\) (penalize overly flexible models)
Normalization: \(-\frac{n}{2} \log(2\pi)\)

PARAMETER	DESCRIPTION
`delta_values`	Observed \(\delta(k)\) values, shape (n,). TYPE: `ndarray`
`log_k`	\(\log(k)\) values, shape (n, 1) or (n,). TYPE: `ndarray`
`noise_level`	Diagonal noise standard deviation \(\sigma_n\) (used if noise_cov=None). TYPE: `Optional[float]` DEFAULT: `0.01`
`noise_cov`	Full N×N posterior covariance matrix \(\Sigma_{\mathrm{post}}\) (RECOMMENDED for MCMC bins). TYPE: `Optional[ndarray]` DEFAULT: `None`
`kernel_config`	KernelConfig object specifying kernel (NEW - preferred). TYPE: `Optional[KernelConfig]` DEFAULT: `None`
`length_scale`	(Backward compatibility) RBF kernel length scale \(\ell\). TYPE: `Optional[float]` DEFAULT: `None`
`sigma`	(Backward compatibility) Signal standard deviation \(\sigma\). TYPE: `Optional[float]` DEFAULT: `None`
`backend`	Backend to use ('numpy', 'jax', or None for default). TYPE: `Optional[str]` DEFAULT: `None`

RETURNS	DESCRIPTION
`float`	Log-marginal likelihood value.

Examples:

With kernel configuration (recommended):

>>> config = KernelConfig(
...     KernelType.PERIODIC,
...     sigma=0.1,
...     length_scale=0.3,
...     params={'period': 1.5}
... )
>>> lml = compute_log_marginal_likelihood(delta, log_k, kernel_config=config)

Backward compatible RBF (old API):

>>> lml = compute_log_marginal_likelihood(delta, log_k, 0.5, 0.1)

With JAX backend:

>>> lml = compute_log_marginal_likelihood(delta, log_k, kernel_config=config, backend='jax')

Source code in src/primefeat/gp.py

def compute_log_marginal_likelihood(
    delta_values: np.ndarray,
    log_k: np.ndarray,
    length_scale: Optional[float] = None,
    sigma: Optional[float] = None,
    noise_level: Optional[float] = 0.01,
    noise_cov: Optional[np.ndarray] = None,
    kernel_config: Optional[KernelConfig] = None,
    backend: Optional[str] = None,
) -> float:
    """
    Compute log-marginal likelihood for given GP hyperparameters.

    $$\\log p(\\delta | \\theta) = -\\frac{1}{2} \\delta^T K^{-1} \\delta - \\frac{1}{2} \\log|K| - \\frac{n}{2} \\log(2\\pi)$$

    where $K = K_{\\mathrm{signal}}(\\theta) + \\Sigma_{\\mathrm{noise}}$

    This is the probability of observing the data $\\delta$ under the GP model
    with hyperparameters $\\theta$. Higher values indicate better fit.

    Components:

    - Data fit term: $-\\frac{1}{2} \\delta^T K^{-1} \\delta$ (reward fitting the data)
    - Complexity penalty: $-\\frac{1}{2} \\log|K|$ (penalize overly flexible models)
    - Normalization: $-\\frac{n}{2} \\log(2\\pi)$

    Args:
        delta_values: Observed $\\delta(k)$ values, shape (n,).
        log_k: $\\log(k)$ values, shape (n, 1) or (n,).
        noise_level: Diagonal noise standard deviation $\\sigma_n$ (used if noise_cov=None).
        noise_cov: Full N×N posterior covariance matrix $\\Sigma_{\\mathrm{post}}$ (RECOMMENDED for MCMC bins).
        kernel_config: KernelConfig object specifying kernel (NEW - preferred).
        length_scale: (Backward compatibility) RBF kernel length scale $\\ell$.
        sigma: (Backward compatibility) Signal standard deviation $\\sigma$.
        backend: Backend to use ('numpy', 'jax', or None for default).

    Returns:
        Log-marginal likelihood value.

    Examples:
        With kernel configuration (recommended):

        >>> config = KernelConfig(
        ...     KernelType.PERIODIC,
        ...     sigma=0.1,
        ...     length_scale=0.3,
        ...     params={'period': 1.5}
        ... )
        >>> lml = compute_log_marginal_likelihood(delta, log_k, kernel_config=config)

        Backward compatible RBF (old API):

        >>> lml = compute_log_marginal_likelihood(delta, log_k, 0.5, 0.1)

        With JAX backend:

        >>> lml = compute_log_marginal_likelihood(delta, log_k, kernel_config=config, backend='jax')
    """
    log_k = np.asarray(log_k).reshape(-1, 1)
    delta_values = np.asarray(delta_values).ravel()
    n = len(delta_values)

    # Build covariance matrix (handles backward compatibility and backend dispatch)
    K = build_gp_covariance(
        log_k,
        length_scale=length_scale,
        sigma=sigma,
        noise_level=noise_level,
        noise_cov=noise_cov,
        kernel_config=kernel_config,
        backend=backend,
    )

    # Cholesky factorization for numerical stability
    try:
        L, lower = cho_factor(K, lower=True)
    except np.linalg.LinAlgError:
        # Singular matrix - return very low likelihood
        return -np.inf

    # log|K| = log|LL^T| = 2 log|L| = 2 * sum(log(diag(L)))
    log_det_K = 2 * np.sum(np.log(np.diag(L)))

    # Compute delta^T K^{-1} delta using Cholesky solve
    K_inv_delta = cho_solve((L, lower), delta_values)
    quad_form = delta_values @ K_inv_delta

    # Log-marginal likelihood
    lml = -0.5 * quad_form - 0.5 * log_det_K - 0.5 * n * np.log(2 * np.pi)

    return lml

`estimate_sigma_range_from_data(delta_values, noise_level, lower_bound_factor=0.1, upper_bound_factor=3.0, min_sigma=0.0001)`

Estimate appropriate sigma range from empirical data characteristics.

Strategy:

Lower bound: \(\max(\mathrm{noise\_level} \times \mathrm{lower\_bound\_factor}, \mathrm{min\_sigma})\)
Should be above noise floor to ensure signal is detectable
Allows exploring "weak signal" regime
Upper bound: \(\mathrm{empirical\_std} \times \mathrm{upper\_bound\_factor}\)
Covers "strong signal" regime where deviations are large
Factor of 3 ensures we explore well beyond typical variations

This ensures the search space adapts to data scale while maintaining physical interpretability (\(\sigma \ll \mathrm{noise}\) is undetectable, \(\sigma \gg \sigma_\mathrm{data}\) implies implausibly large deviations).

PARAMETER	DESCRIPTION
`delta_values`	Observed \(\delta(k)\) values, shape (n,). TYPE: `ndarray`
`noise_level`	Fixed noise standard deviation \(\sigma_n\). TYPE: `float`
`lower_bound_factor`	Multiplier for noise level to set lower bound. TYPE: `float` DEFAULT: `0.1`
`upper_bound_factor`	Multiplier for empirical std to set upper bound. TYPE: `float` DEFAULT: `3.0`
`min_sigma`	Absolute minimum \(\sigma\) to consider (prevents degeneracy). TYPE: `float` DEFAULT: `0.0001`

RETURNS	DESCRIPTION
`Tuple[float, float]`	Tuple of (sigma_min, sigma_max) representing the recommended \(\sigma\) range.

Examples:

>>> delta = np.random.randn(20) * 0.05 + 0.02  # Small signal
>>> sigma_range = estimate_sigma_range_from_data(delta, noise_level=0.01)
>>> print(f"Auto sigma range: [{sigma_range[0]:.4f}, {sigma_range[1]:.4f}]")

Source code in src/primefeat/gp.py

def estimate_sigma_range_from_data(
    delta_values: np.ndarray,
    noise_level: float,
    lower_bound_factor: float = 0.1,
    upper_bound_factor: float = 3.0,
    min_sigma: float = 1e-4,
) -> Tuple[float, float]:
    """
    Estimate appropriate sigma range from empirical data characteristics.

    Strategy:

    1. Lower bound: $\\max(\\mathrm{noise\\_level} \\times \\mathrm{lower\\_bound\\_factor}, \\mathrm{min\\_sigma})$
       - Should be above noise floor to ensure signal is detectable
       - Allows exploring "weak signal" regime

    2. Upper bound: $\\mathrm{empirical\\_std} \\times \\mathrm{upper\\_bound\\_factor}$
       - Covers "strong signal" regime where deviations are large
       - Factor of 3 ensures we explore well beyond typical variations

    This ensures the search space adapts to data scale while maintaining
    physical interpretability ($\\sigma \\ll \\mathrm{noise}$ is undetectable, $\\sigma \\gg \\sigma_\\mathrm{data}$
    implies implausibly large deviations).

    Args:
        delta_values: Observed $\\delta(k)$ values, shape (n,).
        noise_level: Fixed noise standard deviation $\\sigma_n$.
        lower_bound_factor: Multiplier for noise level to set lower bound.
        upper_bound_factor: Multiplier for empirical std to set upper bound.
        min_sigma: Absolute minimum $\\sigma$ to consider (prevents degeneracy).

    Returns:
        Tuple of (sigma_min, sigma_max) representing the recommended $\\sigma$ range.

    Examples:
        >>> delta = np.random.randn(20) * 0.05 + 0.02  # Small signal
        >>> sigma_range = estimate_sigma_range_from_data(delta, noise_level=0.01)
        >>> print(f"Auto sigma range: [{sigma_range[0]:.4f}, {sigma_range[1]:.4f}]")
    """
    delta_values = np.asarray(delta_values).ravel()

    # Empirical statistics
    empirical_std = np.std(delta_values, ddof=1)

    # Handle edge case: all zeros or constant data
    if empirical_std < min_sigma:
        warnings.warn(
            f"Data has very small variance (std={empirical_std:.2e}). "
            f"Using fallback sigma range based on noise level."
        )
        empirical_std = noise_level * 2

    # Lower bound: slightly above noise level
    # Rationale: $\\sigma \\ll \\sigma_n$ means signal is undetectable
    sigma_min = max(noise_level * lower_bound_factor, min_sigma)

    # Upper bound: multiple of empirical std
    # Rationale: $\\sigma \\gg \\sigma_{\\mathrm{data}}$ implies stronger signal than observed
    # Factor of 3 allows exploration of "strong signal" hypothesis
    sigma_max = empirical_std * upper_bound_factor

    # Sanity check: upper should be meaningfully larger than lower
    if sigma_max < 2 * sigma_min:
        sigma_max = sigma_min * 10
        warnings.warn(
            f"Auto-determined sigma range is narrow. Expanding to [{sigma_min:.4f}, {sigma_max:.4f}]"
        )

    return (float(sigma_min), float(sigma_max))

`estimate_noise_level_from_chain(chain, nbins=20, param_pattern='delta_{i}')`

Estimate noise level directly from MCMC chain posterior uncertainties.

This is the PREFERRED method when you have access to the full MCMC chain, as it uses the actual posterior standard deviations rather than empirical variance of the posterior mean.

PARAMETER	DESCRIPTION
`chain`	MCMC chain object (dict-like with \(\delta_i\) parameters). TYPE: `Dict[str, ndarray]`
`nbins`	Number of bins. TYPE: `int` DEFAULT: `20`
`param_pattern`	Parameter name pattern (use {i} for bin index). TYPE: `str` DEFAULT: `'delta_{i}'`

RETURNS	DESCRIPTION
`float`	Mean posterior standard deviation \(\sigma_n\) across bins.

Examples:

>>> # With full chain
>>> noise = estimate_noise_level_from_chain(chain, nbins=20)
>>> landscape = compute_lml_landscape(delta_mean, log_k, noise_level=noise, ...)

Source code in src/primefeat/gp.py

def estimate_noise_level_from_chain(
    chain: Dict[str, np.ndarray],
    nbins: int = 20,
    param_pattern: str = "delta_{i}",
) -> float:
    """
    Estimate noise level directly from MCMC chain posterior uncertainties.

    This is the PREFERRED method when you have access to the full MCMC chain,
    as it uses the actual posterior standard deviations rather than empirical
    variance of the posterior mean.

    Args:
        chain: MCMC chain object (dict-like with $\\delta_i$ parameters).
        nbins: Number of bins.
        param_pattern: Parameter name pattern (use {i} for bin index).

    Returns:
        Mean posterior standard deviation $\\sigma_n$ across bins.

    Examples:
        >>> # With full chain
        >>> noise = estimate_noise_level_from_chain(chain, nbins=20)
        >>> landscape = compute_lml_landscape(delta_mean, log_k, noise_level=noise, ...)
    """
    stds = []
    for i in range(1, nbins + 1):
        param_name = param_pattern.format(i=i)
        if param_name in chain:
            stds.append(np.std(chain[param_name], ddof=1))

    if len(stds) == 0:
        raise ValueError(f"No parameters found matching pattern '{param_pattern}'")

    # Return mean of posterior standard deviations
    return float(np.mean(stds))

`estimate_noise_level_from_data(delta_values, fraction_of_std=0.5, min_noise=0.001)`

Estimate appropriate noise level from data characteristics.

For a single realization (posterior mean), we estimate the noise level as a fraction of the empirical standard deviation. This represents the typical uncertainty/scatter in the data.

This is a FALLBACK method. If you have access to the full MCMC chain, prefer using estimate_noise_level_from_chain() instead.

PARAMETER	DESCRIPTION
`delta_values`	Observed \(\delta(k)\) values, shape (n,). TYPE: `ndarray`
`fraction_of_std`	What fraction of std to use (default: 0.5 = half the variation). TYPE: `float` DEFAULT: `0.5`
`min_noise`	Minimum noise level to avoid numerical issues. TYPE: `float` DEFAULT: `0.001`

RETURNS	DESCRIPTION
`float`	Estimated noise standard deviation \(\sigma_n\).

Examples:

>>> delta = np.random.randn(20) * 0.05
>>> noise = estimate_noise_level_from_data(delta)
>>> print(f"Estimated noise: {noise:.4f}")

Note

If you have access to the full MCMC chain, prefer using:

>>> from primefeat.gp import estimate_noise_level_from_chain
>>> noise_level = estimate_noise_level_from_chain(chain, nbins=20)

This gives a more accurate estimate of bin-wise uncertainties.

Source code in src/primefeat/gp.py

def estimate_noise_level_from_data(
    delta_values: np.ndarray,
    fraction_of_std: float = 0.5,
    min_noise: float = 1e-3,
) -> float:
    """
    Estimate appropriate noise level from data characteristics.

    For a single realization (posterior mean), we estimate the noise level
    as a fraction of the empirical standard deviation. This represents the
    typical uncertainty/scatter in the data.

    This is a FALLBACK method. If you have access to the full MCMC chain,
    prefer using estimate_noise_level_from_chain() instead.

    Args:
        delta_values: Observed $\\delta(k)$ values, shape (n,).
        fraction_of_std: What fraction of std to use (default: 0.5 = half the variation).
        min_noise: Minimum noise level to avoid numerical issues.

    Returns:
        Estimated noise standard deviation $\\sigma_n$.

    Examples:
        >>> delta = np.random.randn(20) * 0.05
        >>> noise = estimate_noise_level_from_data(delta)
        >>> print(f"Estimated noise: {noise:.4f}")

    Note:
        If you have access to the full MCMC chain, prefer using:

            >>> from primefeat.gp import estimate_noise_level_from_chain
            >>> noise_level = estimate_noise_level_from_chain(chain, nbins=20)

        This gives a more accurate estimate of bin-wise uncertainties.
    """
    delta_values = np.asarray(delta_values).ravel()
    empirical_std = np.std(delta_values, ddof=1)

    # Estimate noise as fraction of empirical variation
    return float(max(empirical_std * fraction_of_std, min_noise))

`estimate_length_scale_from_autocorrelation(delta_values, log_k, min_correlation=0.1, fallback_quantile=0.3)`

Estimate correlation length scale from empirical autocorrelation structure.

This function is simpler than significance.estimate_correlation_length() because we're working with a single realization (delta_values) rather than posterior samples.

Strategy:

Compute pairwise distances in \(\log(k)\) space
Compute \(\delta\)-\(\delta\) correlations via \((\delta_i - \mathrm{mean})(\delta_j - \mathrm{mean}) / \mathrm{var}\)
Fit exponential decay: \(\mathrm{corr}(d) \sim \exp(-d / \ell)\)
Return characteristic length scale \(\ell\)

If insufficient correlation structure is present, falls back to a quantile of the log_k range (e.g., 30% of range).

PARAMETER	DESCRIPTION
`delta_values`	Observed \(\delta(k)\) values, shape (n,). TYPE: `ndarray`
`log_k`	\(\log(k)\) values, shape (n, 1) or (n,). TYPE: `ndarray`
`min_correlation`	Minimum correlation threshold for fitting. TYPE: `float` DEFAULT: `0.1`
`fallback_quantile`	Fraction of log_k range to use if fit fails. TYPE: `float` DEFAULT: `0.3`

RETURNS	DESCRIPTION
`float`	Estimated correlation length \(\ell\) in \(\log(k)\) units.

Examples:

>>> log_k = np.linspace(-7, -1.5, 20)
>>> delta = np.sin(log_k) * 0.1 + np.random.randn(20) * 0.02
>>> ell = estimate_length_scale_from_autocorrelation(delta, log_k)
>>> print(f"Estimated length scale: {ell:.3f}")

Source code in src/primefeat/gp.py

def estimate_length_scale_from_autocorrelation(
    delta_values: np.ndarray,
    log_k: np.ndarray,
    min_correlation: float = 0.1,
    fallback_quantile: float = 0.3,
) -> float:
    """
    Estimate correlation length scale from empirical autocorrelation structure.

    This function is simpler than significance.estimate_correlation_length() because
    we're working with a single realization (delta_values) rather than posterior samples.

    Strategy:

    1. Compute pairwise distances in $\\log(k)$ space
    2. Compute $\\delta$-$\\delta$ correlations via $(\\delta_i - \\mathrm{mean})(\\delta_j - \\mathrm{mean}) / \\mathrm{var}$
    3. Fit exponential decay: $\\mathrm{corr}(d) \\sim \\exp(-d / \\ell)$
    4. Return characteristic length scale $\\ell$

    If insufficient correlation structure is present, falls back to a quantile
    of the log_k range (e.g., 30% of range).

    Args:
        delta_values: Observed $\\delta(k)$ values, shape (n,).
        log_k: $\\log(k)$ values, shape (n, 1) or (n,).
        min_correlation: Minimum correlation threshold for fitting.
        fallback_quantile: Fraction of log_k range to use if fit fails.

    Returns:
        Estimated correlation length $\\ell$ in $\\log(k)$ units.

    Examples:
        >>> log_k = np.linspace(-7, -1.5, 20)
        >>> delta = np.sin(log_k) * 0.1 + np.random.randn(20) * 0.02
        >>> ell = estimate_length_scale_from_autocorrelation(delta, log_k)
        >>> print(f"Estimated length scale: {ell:.3f}")
    """
    delta_values = np.asarray(delta_values).ravel()
    log_k = np.asarray(log_k).ravel()
    n = len(delta_values)

    if n < 3:
        # Cannot estimate correlation with < 3 points
        log_k_range = np.ptp(log_k) if n > 1 else 1.0
        return fallback_quantile * log_k_range

    # Center the data
    delta_centered = delta_values - np.mean(delta_values)
    variance = np.var(delta_values, ddof=1)

    if variance < 1e-10:
        # No variance → no correlation structure
        log_k_range = np.ptp(log_k)
        return fallback_quantile * log_k_range

    # Compute pairwise distances and correlations
    distances = []
    correlations = []

    for i in range(n):
        for j in range(i + 1, n):
            dist = abs(log_k[j] - log_k[i])
            # Empirical correlation: <(delta_i - mean)(delta_j - mean)> / var
            corr = (delta_centered[i] * delta_centered[j]) / variance

            if corr > min_correlation:
                distances.append(dist)
                correlations.append(corr)

    if len(distances) < 3:
        # Insufficient correlation structure for fitting
        log_k_range = np.ptp(log_k)
        fallback_length = fallback_quantile * log_k_range
        return fallback_length

    distances = np.array(distances)
    correlations = np.array(correlations)

    # Fit exponential decay: corr = exp(-dist / l)
    # Taking log: log(corr) = -dist / l
    # So: l = -mean(dist) / mean(log(corr))

    log_corr = np.log(correlations)
    length_scale = -np.mean(distances) / np.mean(log_corr)

    # Sanity check: length scale $\\ell$ should be positive and reasonable
    log_k_range = np.ptp(log_k)
    if length_scale <= 0 or length_scale > 2 * log_k_range:
        # Fit failed or unreasonable → use fallback
        length_scale = fallback_quantile * log_k_range

    return float(length_scale)

`validate_hyperparameter_ranges(sigma_range, length_scale_range, noise_level, empirical_std, resolution_info=None, warn=True)`

Validate user-provided hyperparameter ranges for reasonableness.

This function warns users if their specified ranges are likely to produce poor results due to:

\(\sigma\) too close to noise level (undetectable signal)
\(\sigma \gg\) empirical variation (implausibly large deviations)
Length scale below resolution limit (aliasing)
Length scale \(>\) half the domain (poorly constrained)

PARAMETER	DESCRIPTION
`sigma_range`	(min, max) for signal standard deviation \(\sigma\). TYPE: `Tuple[float, float]`
`length_scale_range`	(min, max) for length scale \(\ell\). TYPE: `Tuple[float, float]`
`noise_level`	Fixed noise standard deviation \(\sigma_n\). TYPE: `Optional[float]`
`empirical_std`	Standard deviation of \(\delta(k)\) values. TYPE: `float`
`resolution_info`	Output from compute_bin_resolution() (optional). TYPE: `Optional[Dict]` DEFAULT: `None`
`warn`	Whether to print warnings. TYPE: `bool` DEFAULT: `True`

RETURNS	DESCRIPTION
`bool`	True if ranges pass all checks, False otherwise.

Source code in src/primefeat/gp.py

def validate_hyperparameter_ranges(
    sigma_range: Tuple[float, float],
    length_scale_range: Tuple[float, float],
    noise_level: Optional[float],
    empirical_std: float,
    resolution_info: Optional[Dict] = None,
    warn: bool = True,
) -> bool:
    """
    Validate user-provided hyperparameter ranges for reasonableness.

    This function warns users if their specified ranges are likely to produce
    poor results due to:

    - $\\sigma$ too close to noise level (undetectable signal)
    - $\\sigma \\gg$ empirical variation (implausibly large deviations)
    - Length scale below resolution limit (aliasing)
    - Length scale $>$ half the domain (poorly constrained)

    Args:
        sigma_range: (min, max) for signal standard deviation $\\sigma$.
        length_scale_range: (min, max) for length scale $\\ell$.
        noise_level: Fixed noise standard deviation $\\sigma_n$.
        empirical_std: Standard deviation of $\\delta(k)$ values.
        resolution_info: Output from compute_bin_resolution() (optional).
        warn: Whether to print warnings.

    Returns:
        True if ranges pass all checks, False otherwise.
    """
    is_valid = True

    sigma_min, sigma_max = sigma_range
    ell_min, ell_max = length_scale_range

    # Check sigma range (only if noise_level is provided)
    if noise_level is not None and sigma_max < noise_level:
        if warn:
            warnings.warn(
                f"$\\sigma$ upper bound ({sigma_max:.4f}) is below noise level ({noise_level:.4f}). "
                f"Signal will be completely dominated by noise. Consider increasing sigma_range."
            )
        is_valid = False

    if sigma_min > empirical_std * 2:
        if warn:
            warnings.warn(
                f"$\\sigma$ lower bound ({sigma_min:.4f}) is much larger than empirical std ({empirical_std:.4f}). "
                f"You may be searching in an implausibly large signal regime. Consider lowering sigma_range."
            )
        is_valid = False

    if sigma_max > empirical_std * 10:
        if warn:
            warnings.warn(
                f"$\\sigma$ upper bound ({sigma_max:.4f}) is >> empirical std ({empirical_std:.4f}). "
                f"This implies order-unity deviations from power-law, which may not be physically motivated."
            )
        is_valid = False

    # Check length scale range against resolution limits
    if resolution_info is not None:
        min_resolvable = resolution_info["min_resolvable_length"]
        max_sensible = resolution_info["max_sensible_length"]

        if ell_min < min_resolvable:
            if warn:
                warnings.warn(
                    f"Length scale lower bound ({ell_min:.3f}) is below minimum resolvable "
                    f"scale ({min_resolvable:.3f}). Features this narrow cannot be distinguished "
                    f"from noise with current binning. Consider using $\\ell$_min >= {min_resolvable:.3f}."
                )
            is_valid = False

        if ell_max > max_sensible:
            if warn:
                warnings.warn(
                    f"Length scale upper bound ({ell_max:.3f}) exceeds half the domain "
                    f"({max_sensible:.3f}). Such broad features are poorly constrained. "
                    f"Consider using $\\ell$_max <= {max_sensible:.3f}."
                )
            is_valid = False

    return is_valid

`compute_lml_landscape(delta_values, log_k, sigma_range=None, length_scale_range=None, n_sigma=50, n_length=50, noise_level=None, posterior_cov=None, nbins=None, k_start=None, k_end=None, auto_sigma_factor=3.0, auto_length_fallback=0.3, validate_ranges=True, kernel_type=KernelType.RBF, kernel_params=None)`

Compute log-marginal likelihood landscape in \((\sigma, \ell)\) hyperparameter space.

This visualizes how well different GP models explain the data, allowing us to:

Test whether signal variance \(\sigma\) is significantly non-zero (evidence for features)
Infer characteristic length scale \(\ell\) of features (sharp vs smooth)
Assess parameter uncertainty and degeneracies (ridge structures)
Compute Bayes factors for model comparison (signal vs noise)

Supports multiple kernel types: - RBF (default): Infinitely smooth, single length scale - RATIONAL_QUADRATIC: Multi-scale structure (set kernel_params={'alpha': value}) - PERIODIC: Exactly repeating patterns (set kernel_params={'period': value}) - LOCALLY_PERIODIC: Periodic with decay (set kernel_params={'period': p, 'length_scale_rbf': l})

Intelligent automatic hyperparameter range selection! - If sigma_range=None, estimates appropriate bounds from empirical data variance - If length_scale_range=None, combines bin resolution + empirical autocorrelation - Validates user-provided ranges and warns about unreasonable choices - Transparently reports what ranges were selected and why

Mathematical Framework:

The log-marginal likelihood is:

\[\log p(\delta | \theta) = -\frac{1}{2} \delta^T K^{-1} \delta - \frac{1}{2} \log|K| - \frac{n}{2} \log(2\pi)\]

where \(K(\theta) = K_{\mathrm{signal}}(\sigma, \ell, \mathrm{kernel\_params}) + \Sigma_{\mathrm{noise}}\)

Interpretation of Landscape Features:

Peak at \(\sigma \approx 0\): Data consistent with noise (null hypothesis)
Peak at \(\sigma > 0\): Evidence for signal beyond noise
Small \(\ell\) at maximum: Sharp, localized features (e.g., resonances)
Large \(\ell\) at maximum: Smooth, broad features (e.g., running)
Narrow peak: Well-constrained hyperparameters
Ridge structure: \(\sigma\)-\(\ell\) degeneracy (multiple models fit equally well)

Bayes Factor Interpretation:

\(\mathrm{BF} = \exp(\mathrm{LML}_{\mathrm{signal}} - \mathrm{LML}_{\mathrm{noise}})\) compares signal vs noise models:

BF > 10: Strong evidence for features
BF > 3: Moderate evidence
BF < 3: Weak/no evidence

Bin Resolution Constraints:

With nbins bins over finite \(k\)-range, we cannot resolve arbitrarily small \(\ell\).

Minimum resolvable: \(\ell_{\mathrm{min}} \approx 2 \Delta\log(k) \approx 2 \times \log{k_\mathrm{range}} / \mathrm{nbins}\)
Maximum sensible: \(\ell_{\mathrm{max}} \approx \log{k_\mathrm{range}} / 2\)

Automatic Range Selection Strategy:

Sigma range (if None):

Lower: \(\max(\mathrm{noise\_level} \times 0.1, 10^{-4})\) - slightly above noise floor
Upper: \(\mathrm{empirical\_std} \times \mathrm{auto\_sigma\_factor}\) - covers strong signal regime
Adapts to data scale while maintaining physical interpretability

Length scale range (if None):

Lower: \(0.8 \times \ell_{\mathrm{min}}\) (from bin resolution)
Upper: \(1.2 \times \ell_{\mathrm{max}}\) (from bin resolution)
Optionally refined by empirical autocorrelation if available

PARAMETER	DESCRIPTION
`delta_values`	Observed \(\delta(k)\) values (single sample or posterior mean), shape (n,). TYPE: `ndarray`
`log_k`	\(\log(k)\) values, shape (n, 1) or (n,). TYPE: `ndarray`
`sigma_range`	(min, max) for signal std \(\sigma\) (None = auto-determine from data). TYPE: `Optional[Tuple[float, float]]` DEFAULT: `None`
`length_scale_range`	(min, max) for length scale \(\ell\) (None = auto from resolution). TYPE: `Optional[Tuple[float, float]]` DEFAULT: `None`
`n_sigma`	Number of \(\sigma\) grid points. TYPE: `int` DEFAULT: `50`
`n_length`	Number of length scale \(\ell\) grid points. TYPE: `int` DEFAULT: `50`
`noise_level`	Fixed diagonal noise \(\sigma_n^2\) (used if posterior_cov=None). DEPRECATED: Use posterior_cov instead for proper statistics. TYPE: `Optional[float]` DEFAULT: `None`
`posterior_cov`	Full posterior covariance matrix \(\Sigma_{\mathrm{post}}\) (RECOMMENDED, nbins x nbins). If provided, uses full covariance instead of diagonal noise. Extract from MCMC: np.cov(delta_samples.T) TYPE: `Optional[ndarray]` DEFAULT: `None`
`nbins`	Number of bins for automatic length scale range (recommended). TYPE: `Optional[int]` DEFAULT: `None`
`k_start`	Start of \(k\)-range in \(\mathrm{Mpc}^{-1}\) for automatic length scale range. TYPE: `Optional[float]` DEFAULT: `None`
`k_end`	End of \(k\)-range in \(\mathrm{Mpc}^{-1}\) for automatic length scale range. TYPE: `Optional[float]` DEFAULT: `None`
`auto_sigma_factor`	Multiplier for empirical_std when auto-determining sigma_max. TYPE: `float` DEFAULT: `3.0`
`auto_length_fallback`	Fraction of log_k range for length scale estimation fallback. TYPE: `float` DEFAULT: `0.3`
`validate_ranges`	If True, validate user-provided ranges and warn if unreasonable. TYPE: `bool` DEFAULT: `True`
`kernel_type`	Type of kernel to use (default: KernelType.RBF). TYPE: `KernelType` DEFAULT: `RBF`
`kernel_params`	Fixed kernel-specific parameters (not explored in landscape). RQ: {'alpha': float} - mixture parameter. Periodic: {'period': float} - oscillation period. LocallyPeriodic: {'period': float, 'length_scale_rbf': float} TYPE: `Optional[Dict[str, Any]]` DEFAULT: `None`

RETURNS DESCRIPTION

Dict

Dictionary containing: - sigma_grid: 1D array of \(\sigma\) values - length_scale_grid: 1D array of \(\ell\) values - lml_grid: 2D array of log-marginal likelihoods (n_sigma, n_length) - optimal_sigma: ML estimate of \(\sigma\) - optimal_length_scale: ML estimate of \(\ell\) - max_lml: Maximum log-marginal likelihood - null_lml: LML at \(\sigma \approx 0\) (null hypothesis) - bayes_factor: exp(max_lml - null_lml) - resolution_info: Bin resolution diagnostics - auto_selected_ranges: Dict with 'sigma_range', 'length_scale_range', 'method'

Examples:

Automatic range selection:

>>> from primefeat.compute import get_bin_centers
>>> bin_centers = get_bin_centers(0.001, 0.23, 20)
>>> log_k = np.log(bin_centers).reshape(-1, 1)
>>> delta_mean = np.array([chain[f'delta_{i}'].mean() for i in range(1, 21)])
>>> # Let function auto-determine ranges
>>> landscape = compute_lml_landscape(
...     delta_mean, log_k,
...     nbins=20, k_start=0.001, k_end=0.23
... )
>>> print(f"Auto-selected sigma: {landscape['auto_selected_ranges']['sigma_range']}")
>>> if landscape['bayes_factor'] > 10:
...     print(f"Strong evidence! ell = {landscape['optimal_length_scale']:.3f}")

Manual ranges with validation:

>>> # Provide your own ranges - function will validate them
>>> landscape = compute_lml_landscape(
...     delta_mean, log_k,
...     sigma_range=(0.001, 0.2),
...     length_scale_range=(0.1, 1.5),
...     nbins=20, k_start=0.001, k_end=0.23
... )

Source code in src/primefeat/gp.py

def compute_lml_landscape(
    delta_values: np.ndarray,
    log_k: np.ndarray,
    sigma_range: Optional[Tuple[float, float]] = None,
    length_scale_range: Optional[Tuple[float, float]] = None,
    n_sigma: int = 50,
    n_length: int = 50,
    noise_level: Optional[float] = None,
    posterior_cov: Optional[np.ndarray] = None,
    nbins: Optional[int] = None,
    k_start: Optional[float] = None,
    k_end: Optional[float] = None,
    auto_sigma_factor: float = 3.0,
    auto_length_fallback: float = 0.3,
    validate_ranges: bool = True,
    kernel_type: KernelType = KernelType.RBF,
    kernel_params: Optional[Dict[str, Any]] = None,
) -> Dict:
    """
    Compute log-marginal likelihood landscape in $(\\sigma, \\ell)$ hyperparameter space.

    This visualizes how well different GP models explain the data, allowing us to:

    1. Test whether signal variance $\\sigma$ is significantly non-zero (evidence for features)
    2. Infer characteristic length scale $\\ell$ of features (sharp vs smooth)
    3. Assess parameter uncertainty and degeneracies (ridge structures)
    4. Compute Bayes factors for model comparison (signal vs noise)

    Supports multiple kernel types:
    - RBF (default): Infinitely smooth, single length scale
    - RATIONAL_QUADRATIC: Multi-scale structure (set kernel_params={'alpha': value})
    - PERIODIC: Exactly repeating patterns (set kernel_params={'period': value})
    - LOCALLY_PERIODIC: Periodic with decay (set kernel_params={'period': p, 'length_scale_rbf': l})

    Intelligent automatic hyperparameter range selection!
    - If sigma_range=None, estimates appropriate bounds from empirical data variance
    - If length_scale_range=None, combines bin resolution + empirical autocorrelation
    - Validates user-provided ranges and warns about unreasonable choices
    - Transparently reports what ranges were selected and why

    Mathematical Framework:
    ----------------------
    The log-marginal likelihood is:

    $$\\log p(\\delta | \\theta) = -\\frac{1}{2} \\delta^T K^{-1} \\delta - \\frac{1}{2} \\log|K| - \\frac{n}{2} \\log(2\\pi)$$

    where $K(\\theta) = K_{\\mathrm{signal}}(\\sigma, \\ell, \\mathrm{kernel\\_params}) + \\Sigma_{\\mathrm{noise}}$

    Interpretation of Landscape Features:
    -------------------------------------

    - **Peak at** $\\sigma \\approx 0$: Data consistent with noise (null hypothesis)
    - **Peak at** $\\sigma > 0$: Evidence for signal beyond noise
    - **Small** $\\ell$ **at maximum**: Sharp, localized features (e.g., resonances)
    - **Large** $\\ell$ **at maximum**: Smooth, broad features (e.g., running)
    - **Narrow peak**: Well-constrained hyperparameters
    - **Ridge structure**: $\\sigma$-$\\ell$ degeneracy (multiple models fit equally well)

    Bayes Factor Interpretation:
    ----------------------------
    $\\mathrm{BF} = \\exp(\\mathrm{LML}_{\\mathrm{signal}} - \\mathrm{LML}_{\\mathrm{noise}})$ compares signal vs noise models:

    - BF > 10: Strong evidence for features
    - BF > 3: Moderate evidence
    - BF < 3: Weak/no evidence

    Bin Resolution Constraints:
    ---------------------------
    With nbins bins over finite $k$-range, we cannot resolve arbitrarily small $\\ell$.

    - Minimum resolvable: $\\ell_{\\mathrm{min}} \\approx 2 \\Delta\\log(k) \\approx 2 \\times \\log{k_\\mathrm{range}} / \\mathrm{nbins}$
    - Maximum sensible: $\\ell_{\\mathrm{max}} \\approx \\log{k_\\mathrm{range}} / 2$

    Automatic Range Selection Strategy:
    ------------------------------------
    **Sigma range** (if None):

    - Lower: $\\max(\\mathrm{noise\\_level} \\times 0.1, 10^{-4})$ - slightly above noise floor
    - Upper: $\\mathrm{empirical\\_std} \\times \\mathrm{auto\\_sigma\\_factor}$ - covers strong signal regime
    - Adapts to data scale while maintaining physical interpretability

    **Length scale range** (if None):

    - Lower: $0.8 \\times \\ell_{\\mathrm{min}}$ (from bin resolution)
    - Upper: $1.2 \\times \\ell_{\\mathrm{max}}$ (from bin resolution)
    - Optionally refined by empirical autocorrelation if available

    Args:
        delta_values: Observed $\\delta(k)$ values (single sample or posterior mean), shape (n,).
        log_k: $\\log(k)$ values, shape (n, 1) or (n,).
        sigma_range: (min, max) for signal std $\\sigma$ (None = auto-determine from data).
        length_scale_range: (min, max) for length scale $\\ell$ (None = auto from resolution).
        n_sigma: Number of $\\sigma$ grid points.
        n_length: Number of length scale $\\ell$ grid points.
        noise_level: Fixed diagonal noise $\\sigma_n^2$ (used if posterior_cov=None).
                     DEPRECATED: Use posterior_cov instead for proper statistics.
        posterior_cov: Full posterior covariance matrix $\\Sigma_{\\mathrm{post}}$ (RECOMMENDED, nbins x nbins).
                      If provided, uses full covariance instead of diagonal noise.
                      Extract from MCMC: np.cov(delta_samples.T)
        nbins: Number of bins for automatic length scale range (recommended).
        k_start: Start of $k$-range in $\\mathrm{Mpc}^{-1}$ for automatic length scale range.
        k_end: End of $k$-range in $\\mathrm{Mpc}^{-1}$ for automatic length scale range.
        auto_sigma_factor: Multiplier for empirical_std when auto-determining sigma_max.
        auto_length_fallback: Fraction of log_k range for length scale estimation fallback.
        validate_ranges: If True, validate user-provided ranges and warn if unreasonable.
        kernel_type: Type of kernel to use (default: KernelType.RBF).
        kernel_params: Fixed kernel-specific parameters (not explored in landscape).
                       RQ: {'alpha': float} - mixture parameter.
                       Periodic: {'period': float} - oscillation period.
                       LocallyPeriodic: {'period': float, 'length_scale_rbf': float}

    Returns:
        Dictionary containing:
            - sigma_grid: 1D array of $\\sigma$ values
            - length_scale_grid: 1D array of $\\ell$ values
            - lml_grid: 2D array of log-marginal likelihoods (n_sigma, n_length)
            - optimal_sigma: ML estimate of $\\sigma$
            - optimal_length_scale: ML estimate of $\\ell$
            - max_lml: Maximum log-marginal likelihood
            - null_lml: LML at $\\sigma \\approx 0$ (null hypothesis)
            - bayes_factor: exp(max_lml - null_lml)
            - resolution_info: Bin resolution diagnostics
            - auto_selected_ranges: Dict with 'sigma_range', 'length_scale_range', 'method'

    Examples:
        Automatic range selection:

        >>> from primefeat.compute import get_bin_centers
        >>> bin_centers = get_bin_centers(0.001, 0.23, 20)
        >>> log_k = np.log(bin_centers).reshape(-1, 1)
        >>> delta_mean = np.array([chain[f'delta_{i}'].mean() for i in range(1, 21)])
        >>> # Let function auto-determine ranges
        >>> landscape = compute_lml_landscape(
        ...     delta_mean, log_k,
        ...     nbins=20, k_start=0.001, k_end=0.23
        ... )
        >>> print(f"Auto-selected sigma: {landscape['auto_selected_ranges']['sigma_range']}")
        >>> if landscape['bayes_factor'] > 10:
        ...     print(f"Strong evidence! ell = {landscape['optimal_length_scale']:.3f}")

        Manual ranges with validation:

        >>> # Provide your own ranges - function will validate them
        >>> landscape = compute_lml_landscape(
        ...     delta_mean, log_k,
        ...     sigma_range=(0.001, 0.2),
        ...     length_scale_range=(0.1, 1.5),
        ...     nbins=20, k_start=0.001, k_end=0.23
        ... )
    """
    # === PREPROCESSING ===
    log_k = np.asarray(log_k).reshape(-1, 1)
    delta_values = np.asarray(delta_values).ravel()
    n = len(delta_values)

    # Compute empirical statistics for range estimation
    empirical_std = np.std(delta_values, ddof=1)
    empirical_mean = np.abs(np.mean(delta_values))

    # === DETERMINE NOISE MODEL ===
    use_full_cov = posterior_cov is not None
    if use_full_cov:
        noise_method = "full posterior covariance (RECOMMENDED)"
        noise_scale = np.sqrt(np.mean(np.diag(posterior_cov)))
    else:
        if noise_level is None:
            noise_level = estimate_noise_level_from_data(
                delta_values, fraction_of_std=0.5
            )
            noise_method = "diagonal noise (auto, 0.5 × empirical_std)"
        else:
            noise_method = "diagonal noise (user-provided)"
        noise_scale = noise_level

    # === DISPLAY DATA CHARACTERISTICS ===
    print("=" * 70)
    print("HYPERPARAMETER RANGE SELECTION")
    print("=" * 70)
    print(f"Data characteristics:")
    print(f"  N bins: {n}")
    print(f"  Empirical mean: {empirical_mean:.4f}")
    print(f"  Empirical std: {empirical_std:.4f}")
    print(f"  Noise model: {noise_method}")
    if use_full_cov:
        print(f"  Noise scale (√diag): {noise_scale:.4f}")
    else:
        print(f"  Noise level (diagonal): {noise_scale:.4f}")

    # === DETERMINE HYPERPARAMETER RANGES (using extracted helpers) ===
    sigma_range, sigma_method = _determine_sigma_range(
        delta_values, noise_level, sigma_range, auto_sigma_factor, verbose=True
    )

    # Compute bin resolution info
    resolution_info = None
    if nbins is not None and k_start is not None and k_end is not None:
        resolution_info = compute_bin_resolution(nbins, k_start, k_end)

    length_scale_range, length_method = _determine_length_scale_range(
        delta_values,
        log_k,
        length_scale_range,
        resolution_info,
        auto_length_fallback,
        nbins,
        verbose=True,
    )

    # Track auto-selection info
    auto_selected_ranges = {
        "sigma_range": sigma_range,
        "length_scale_range": length_scale_range,
        "sigma_method": sigma_method,
        "length_method": length_method,
    }

    # === VALIDATION ===
    if validate_ranges:
        print(f"\nValidating hyperparameter ranges...")
        is_valid = validate_hyperparameter_ranges(
            sigma_range,
            length_scale_range,
            noise_level,
            empirical_std,
            resolution_info,
            warn=True,
        )
        if is_valid:
            print("  ✓ All ranges pass validation checks")
        else:
            print("  ⚠ Some validation warnings above - review carefully")

    print("=" * 70 + "\n")

    # === CREATE GRIDS ===
    sigma_grid = np.linspace(sigma_range[0], sigma_range[1], n_sigma)
    length_scale_grid = np.linspace(
        length_scale_range[0], length_scale_range[1], n_length
    )

    # Ensure kernel_params is a dict
    if kernel_params is None:
        kernel_params = {}

    # === DISPLAY GRID INFO ===
    print(f"\nComputing log-marginal likelihood on {n_sigma} × {n_length} grid...")
    print(f"  Kernel: {kernel_type.value}")
    if kernel_params:
        print(f"  Kernel params: {kernel_params}")
    print(f"  σ range: [{sigma_range[0]:.4f}, {sigma_range[1]:.4f}]")
    print(f"  ℓ range: [{length_scale_range[0]:.3f}, {length_scale_range[1]:.3f}]")

    # === PRE-COMPUTE KERNELS (using extracted helper) ===
    base_kernels = _precompute_kernel_matrices(
        log_k, length_scale_grid, kernel_type, kernel_params, verbose=True
    )

    # Compute noise covariance
    if use_full_cov:
        K_noise = posterior_cov
    else:
        K_noise = noise_level**2 * np.eye(n)

    # === COMPUTE LML GRID (using extracted helper) ===
    lml_grid = _compute_lml_grid(
        delta_values, sigma_grid, length_scale_grid, base_kernels, K_noise, verbose=True
    )

    # === FIND OPTIMAL HYPERPARAMETERS (using extracted helper) ===
    opt_results = _find_optimal_hyperparams(lml_grid, sigma_grid, length_scale_grid)

    # === DISPLAY RESULTS (using extracted helper) ===
    _display_landscape_results(
        opt_results, kernel_type, kernel_params, sigma_grid, resolution_info
    )

    # === RETURN RESULTS ===
    return {
        "sigma_grid": sigma_grid,
        "length_scale_grid": length_scale_grid,
        "lml_grid": lml_grid,
        "optimal_sigma": opt_results["optimal_sigma"],
        "optimal_length_scale": opt_results["optimal_length_scale"],
        "max_lml": opt_results["max_lml"],
        "null_lml": opt_results["null_lml"],
        "bayes_factor": opt_results["bayes_factor"],
        "delta_values": delta_values,
        "log_k": log_k,
        "resolution_info": resolution_info,
        "noise_level": noise_level,
        "auto_selected_ranges": auto_selected_ranges,
        "kernel_type": kernel_type,
        "kernel_params": kernel_params,
    }

`compare_kernel_likelihoods(delta_values, log_k, kernel_configs, noise_level=None, noise_cov=None)`

Compare log-marginal likelihoods for different kernel configurations.

This function computes the LML for each provided kernel configuration, allowing direct comparison of how well different kernels explain the data.

PARAMETER	DESCRIPTION
`delta_values`	Observed \(\delta(k)\) values, shape (n,). TYPE: `ndarray`
`log_k`	\(\log(k)\) values, shape (n,) or (n, 1). TYPE: `ndarray`
`kernel_configs`	Dictionary mapping names to KernelConfig objects. TYPE: `Dict[str, KernelConfig]`
`noise_level`	Diagonal noise standard deviation \(\sigma_n\) (if noise_cov not provided). TYPE: `Optional[float]` DEFAULT: `None`
`noise_cov`	Full posterior covariance matrix \(\Sigma_{\mathrm{post}}\) (recommended). TYPE: `Optional[ndarray]` DEFAULT: `None`

RETURNS	DESCRIPTION
`Dict[str, Dict]`	Dictionary with: - 'results': Dict mapping kernel name to {lml, config} - 'best_kernel': Name of kernel with highest LML - 'best_lml': Highest log-marginal likelihood - 'bayes_factors': Dict of Bayes factors relative to worst model

Examples:

>>> configs = {
...     'RBF': KernelConfig(KernelType.RBF, sigma=0.1, length_scale=0.5),
...     'RQ': KernelConfig(
...         KernelType.RATIONAL_QUADRATIC,
...         sigma=0.1,
...         length_scale=0.5,
...         params={'alpha': 2.0}
...     ),
...     'Periodic': KernelConfig(
...         KernelType.PERIODIC,
...         sigma=0.1,
...         length_scale=0.3,
...         params={'period': 1.5}
...     ),
... }
>>> comparison = compare_kernel_likelihoods(delta, log_k, configs, noise_level=0.01)
>>> print(f"Best kernel: {comparison['best_kernel']}")
>>> print(f"Bayes factors: {comparison['bayes_factors']}")

Source code in src/primefeat/gp.py

def compare_kernel_likelihoods(
    delta_values: np.ndarray,
    log_k: np.ndarray,
    kernel_configs: Dict[str, KernelConfig],
    noise_level: Optional[float] = None,
    noise_cov: Optional[np.ndarray] = None,
) -> Dict[str, Dict]:
    """
    Compare log-marginal likelihoods for different kernel configurations.

    This function computes the LML for each provided kernel configuration,
    allowing direct comparison of how well different kernels explain the data.

    Args:
        delta_values: Observed $\\delta(k)$ values, shape (n,).
        log_k: $\\log(k)$ values, shape (n,) or (n, 1).
        kernel_configs: Dictionary mapping names to KernelConfig objects.
        noise_level: Diagonal noise standard deviation $\\sigma_n$ (if noise_cov not provided).
        noise_cov: Full posterior covariance matrix $\\Sigma_{\\mathrm{post}}$ (recommended).

    Returns:
        Dictionary with:
            - 'results': Dict mapping kernel name to {lml, config}
            - 'best_kernel': Name of kernel with highest LML
            - 'best_lml': Highest log-marginal likelihood
            - 'bayes_factors': Dict of Bayes factors relative to worst model

    Examples:
        >>> configs = {
        ...     'RBF': KernelConfig(KernelType.RBF, sigma=0.1, length_scale=0.5),
        ...     'RQ': KernelConfig(
        ...         KernelType.RATIONAL_QUADRATIC,
        ...         sigma=0.1,
        ...         length_scale=0.5,
        ...         params={'alpha': 2.0}
        ...     ),
        ...     'Periodic': KernelConfig(
        ...         KernelType.PERIODIC,
        ...         sigma=0.1,
        ...         length_scale=0.3,
        ...         params={'period': 1.5}
        ...     ),
        ... }
        >>> comparison = compare_kernel_likelihoods(delta, log_k, configs, noise_level=0.01)
        >>> print(f"Best kernel: {comparison['best_kernel']}")
        >>> print(f"Bayes factors: {comparison['bayes_factors']}")
    """
    log_k = np.asarray(log_k).reshape(-1, 1)
    delta_values = np.asarray(delta_values).ravel()

    results = {}
    lmls = {}

    print("=" * 60)
    print("KERNEL COMPARISON")
    print("=" * 60)

    for name, config in kernel_configs.items():
        lml = compute_log_marginal_likelihood(
            delta_values,
            log_k,
            kernel_config=config,
            noise_level=noise_level,
            noise_cov=noise_cov,
        )
        results[name] = {
            "lml": lml,
            "config": config,
            "description": config.describe(),
        }
        lmls[name] = lml
        print(f"  {name}: LML = {lml:.2f}")
        print(f"    {config.describe()}")

    # Find best and worst
    best_name = max(lmls.keys(), key=lambda k: lmls[k])
    best_lml = lmls[best_name]
    worst_lml = min(lmls.values())

    # Compute Bayes factors relative to worst model
    bayes_factors = {name: np.exp(lml - worst_lml) for name, lml in lmls.items()}

    print(f"\nBest kernel: {best_name} (LML = {best_lml:.2f})")
    print("\nBayes factors (relative to worst):")
    for name, bf in sorted(bayes_factors.items(), key=lambda x: -x[1]):
        print(f"  {name}: {bf:.2e}")
    print("=" * 60)

    return {
        "results": results,
        "best_kernel": best_name,
        "best_lml": best_lml,
        "bayes_factors": bayes_factors,
    }