Source code for src.rumboost.torch_functions

import numpy as np
import sys

try:
    import torch

    torch_installed = True
    if sys.version_info > (3, 11):
        compile_decorator = lambda func: func
        Warning(
            "RuntimeError: Torch.compile is not supported in python 3.12. Running functions without compilation."
        )
    else:
        compile_decorator = torch.compile
except ImportError:
    torch_installed = False
    compile_decorator = lambda func: func


def _predict_torch(
    raw_preds,
    shared_ensembles=None,
    num_obs=None,
    num_classes=None,
    device=None,
    shared_start_idx=None,
    functional_effects=False,
    nests=None,
    mu=None,
    alphas=None,
    utilities=False,
):
    """
    Predict function for RUMBoost class, with torch tensors.
    """
    if not torch_installed:
        raise ImportError(
            "Pytorch is not installed. Please install it to run rumboost on torch tensors."
        )

    # if shared ensembles, get the shared predictions out and reorder them for easier addition later
    if shared_ensembles:
        raw_shared_preds = torch.zeros(
            size=(num_obs, num_classes), dtype=torch.float64, device=device
        )
        for i, arr in enumerate(raw_preds[shared_start_idx:]):
            raw_shared_preds[:, shared_ensembles[i + shared_start_idx]] = (
                raw_shared_preds[:, shared_ensembles[i + shared_start_idx]].add(
                    arr.view(-1, num_obs).T
                )
            )
        if shared_start_idx == 0:
            raw_preds = torch.zeros(
                size=(num_obs, num_classes), dtype=torch.float64, device=device
            )
        else:
            raw_preds = torch.stack(raw_preds[:shared_start_idx]).T
    else:
        raw_preds = torch.stack(raw_preds).T

    # if functional effect, sum the two ensembles (of attributes and socio-economic characteristics) of each alternative
    if functional_effects:
        raw_preds = raw_preds.view(-1, num_classes, 2).sum(dim=2)

    # if shared ensembles, add the shared ensembles to the individual specific ensembles
    if shared_ensembles:
        raw_preds.add_(raw_shared_preds)

    # compute nested probabilities. pred_i_m is predictions of choosing i knowing m, pred_m is prediction of choosing nest m and preds is pred_i_m * pred_m
    if nests:
        preds, pred_i_m, pred_m = _nest_probs_torch(
            raw_preds, mu=mu, nests=nests, device=device
        )

        return preds, pred_i_m, pred_m

    # compute cross-nested probabilities. pred_i_m is predictions of choosing i knowing m, pred_m is prediction of choosing nest m and preds is pred_i_m * pred_m
    if alphas is not None:
        preds, pred_i_m, pred_m = _cross_nested_probs_torch(
            raw_preds, mu=mu, alphas=alphas, device=device
        )

        return preds, pred_i_m, pred_m

    # softmax
    if not utilities:
        preds = torch.nn.functional.softmax(raw_preds, dim=1)
        return preds, None, None

    return raw_preds, None, None


@compile_decorator
def _predict_torch_compiled(
    raw_preds,
    shared_ensembles=None,
    num_obs=None,
    num_classes=None,
    device=None,
    shared_start_idx=None,
    functional_effects=False,
    nests=None,
    mu=None,
    alphas=None,
    utilities=False,
):
    """
    Compiled predict function for RUMBoost with torch tensors.
    """
    if not torch_installed:
        raise ImportError(
            "Pytorch is not installed. Please install it to run rumboost on torch tensors."
        )

    # if shared ensembles, get the shared predictions out and reorder them for easier addition later
    if shared_ensembles:
        raw_shared_preds = torch.zeros(
            size=(num_obs, num_classes), dtype=torch.float64, device=device
        )
        for i, arr in enumerate(raw_preds[shared_start_idx:]):
            raw_shared_preds[:, shared_ensembles[i + shared_start_idx]] = (
                raw_shared_preds[:, shared_ensembles[i + shared_start_idx]].add(
                    arr.view(-1, num_obs).T
                )
            )
        if shared_start_idx == 0:
            raw_preds = torch.zeros(
                size=(num_obs, num_classes), dtype=torch.float64, device=device
            )
        else:
            raw_preds = torch.stack(raw_preds[:shared_start_idx]).T
    else:
        raw_preds = torch.stack(raw_preds).T

    # if functional effect, sum the two ensembles (of attributes and socio-economic characteristics) of each alternative
    if functional_effects:
        raw_preds = raw_preds.view(-1, num_classes, 2).sum(dim=2)

    # if shared ensembles, add the shared ensembles to the individual specific ensembles
    if shared_ensembles:
        raw_preds.add_(raw_shared_preds)

    # compute nested probabilities. pred_i_m is predictions of choosing i knowing m, pred_m is prediction of choosing nest m and preds is pred_i_m * pred_m
    if nests:
        preds, pred_i_m, pred_m = _nest_probs_torch(
            raw_preds, mu=mu, nests=nests, device=device
        )

        return preds, pred_i_m, pred_m

    # compute cross-nested probabilities. pred_i_m is predictions of choosing i knowing m, pred_m is prediction of choosing nest m and preds is pred_i_m * pred_m
    if alphas is not None:
        preds, pred_i_m, pred_m = _cross_nested_probs_torch(
            raw_preds, mu=mu, alphas=alphas, device=device
        )

        return preds, pred_i_m, pred_m

    # softmax
    if not utilities:
        preds = torch.nn.functional.softmax(raw_preds, dim=1)
        return preds, None, None

    return raw_preds, None, None


def _inner_predict_torch(
    raw_preds,
    device=None,
    nests=None,
    mu=None,
    alphas=None,
    utilities=False,
    num_classes=None,
    ord_model=None,
    thresholds=None,
):
    """
    Inner predict function for RUMBoost with torch tensors.
    """
    if not torch_installed:
        raise ImportError(
            "Pytorch is not installed. Please install it to run rumboost on torch tensors."
        )

    # regression
    if num_classes == 1 and not ord_model:
        return raw_preds, None, None

    if not utilities:

        # compute nested probabilities. pred_i_m is predictions of choosing i knowing m, pred_m is prediction of choosing nest m and preds is pred_i_m * pred_m
        if nests:
            preds, pred_i_m, pred_m = _nest_probs_torch(
                raw_preds, mu=mu, nests=nests, device=device
            )

            return preds, pred_i_m, pred_m

        # compute cross-nested probabilities. pred_i_m is predictions of choosing i knowing m, pred_m is prediction of choosing nest m and preds is pred_i_m * pred_m
        if alphas is not None:
            preds, pred_i_m, pred_m = _cross_nested_probs_torch(
                raw_preds, mu=mu, alphas=alphas, device=device
            )

            return preds, pred_i_m, pred_m

        # ordinal preds
        if thresholds is not None:
            if ord_model in ["proportional_odds", "coral"]:
                preds = _threshold_preds_torch(raw_preds, thresholds)

            return preds, None, None

        if num_classes == 2:  # binary classification
            preds = torch.sigmoid(raw_preds)

            return preds, None, None

        # softmax
        preds = torch.nn.functional.softmax(raw_preds, dim=1)
        return preds, None, None

    return raw_preds, None, None


@compile_decorator
def _inner_predict_torch_compiled(
    raw_preds,
    device=None,
    nests=None,
    mu=None,
    alphas=None,
    utilities=False,
    num_classes=None,
    ord_model=None,
    thresholds=None,
):
    """
    Inner compiled predict function for RUMBoost with torch tensors.
    """
    if not torch_installed:
        raise ImportError(
            "Pytorch is not installed. Please install it to run rumboost on torch tensors."
        )

    # regression
    if num_classes == 1 and not ord_model:
        return raw_preds, None, None

    if not utilities:

        # compute nested probabilities. pred_i_m is predictions of choosing i knowing m, pred_m is prediction of choosing nest m and preds is pred_i_m * pred_m
        if nests:
            preds, pred_i_m, pred_m = _nest_probs_torch_compiled(
                raw_preds, mu=mu, nests=nests, device=device
            )

            return preds, pred_i_m, pred_m

        # compute cross-nested probabilities. pred_i_m is predictions of choosing i knowing m, pred_m is prediction of choosing nest m and preds is pred_i_m * pred_m
        if alphas is not None:
            preds, pred_i_m, pred_m = _cross_nested_probs_torch_compiled(
                raw_preds, mu=mu, alphas=alphas, device=device
            )

            return preds, pred_i_m, pred_m

        # ordinal preds
        if thresholds is not None:
            if ord_model in ["proportional_odds", "coral"]:
                preds = _threshold_preds_torch_compiled(raw_preds, thresholds)

            return preds, None, None

        if num_classes == 2:  # binary classification
            preds = torch.sigmoid(raw_preds)

            return preds, None, None

        # softmax
        preds = torch.nn.functional.softmax(raw_preds, dim=1)
        return preds, None, None

    return raw_preds, None, None


def _nest_probs_torch(raw_preds, mu, nests, device):
    """compute nested predictions.

    Parameters
    ----------
    raw_preds :
        The raw predictions from the booster
    mu :
        The list of mu values for each nest.
        The first value correspond to the first nest and so on.
    nests :
        The dictionary keys are the nest numbers and its values are the
        list of alternatives in the nest.
        By example, {0:[0,2], 1:[1]} means that the nest 0 contains the
        alternatives 0 and 2 and the nest 1 contains the alternative 1.
    device :
        The device to use for the computation

    Returns
    -------
    preds.T :
        The nested predictions
    pred_i_m :
        The prediction of choosing alt i knowing nest m
    pred_m :
        The prediction of choosing nest m
    """
    if not torch_installed:
        raise ImportError(
            "Pytorch is not installed. Please install it to run rumboost on torch tensors."
        )

    n_obs = raw_preds.size(0)
    n_alt = raw_preds.size(1)
    pred_i_m = torch.zeros((n_obs, n_alt), device=device)
    V_tilde_m = torch.zeros((n_obs, len(mu)), device=device)
    nest_alt = torch.zeros(n_alt, dtype=torch.int64, device=device)
    nests_tensor = torch.tensor(list(nests.keys())).to(device)
    for a, n in nests.items():
        nest_alt[n] = a
    mu_tensor = mu[nest_alt]

    mu_raw_preds_3d = torch.exp(mu_tensor * raw_preds)[:, :, None].repeat(
        1, 1, nests_tensor.size(0)
    )
    mask_3d = torch.where(
        (nest_alt[:, None] == nests_tensor[:, None].T).repeat(n_obs, 1, 1), 1, 0
    )
    sum_in_nest = torch.sum(mu_raw_preds_3d * mask_3d, dim=1)

    pred_i_m = torch.exp(mu_tensor * raw_preds) / torch.sum(
        sum_in_nest[:, None, :].repeat(1, n_alt, 1) * mask_3d, dim=2
    )

    V_tilde_m = 1 / mu * torch.log(sum_in_nest)

    # Pred of choosing nest m
    pred_m = torch.nn.functional.softmax(V_tilde_m, dim=1)

    # Final predictions for choosing i
    preds = pred_i_m * torch.sum(
        pred_m[:, None, :].repeat(1, n_alt, 1) * mask_3d, dim=2
    )

    return preds, pred_i_m, pred_m


@compile_decorator
def _nest_probs_torch_compiled(raw_preds, mu, nests, device):
    """compute nested predictions.

    Parameters
    ----------
    raw_preds :
        The raw predictions from the booster as a torch tensor
    mu :
        The list of mu values for each nest as a torch tensor
        The first value correspond to the first nest and so on.
    nests :
        The dictionary keys are the nest numbers and its values are the
        list of alternatives in the nest.
        By example, {0:[0,2], 1:[1]} means that the nest 0 contains the
        alternatives 0 and 2 and the nest 1 contains the alternative 1.
    device :
        The device to use for the computation

    Returns
    -------
    preds.T :
        The nested predictions
    pred_i_m :
        The prediction of choosing alt i knowing nest m
    pred_m :
        The prediction of choosing nest m
    """
    if not torch_installed:
        raise ImportError(
            "Pytorch is not installed. Please install it to run rumboost on torch tensors."
        )

    n_obs = raw_preds.size(0)
    n_alt = raw_preds.size(1)
    pred_i_m = torch.zeros((n_obs, n_alt), device=device)
    V_tilde_m = torch.zeros((n_obs, len(mu)), device=device)
    nest_alt = torch.zeros(n_alt, dtype=torch.int64, device=device)
    nests_tensor = torch.tensor(list(nests.keys())).to(device)
    for a, n in nests.items():
        nest_alt[n] = a
    mu_tensor = mu[nest_alt]

    mu_raw_preds_3d = torch.exp(mu_tensor * raw_preds)[:, :, None].repeat(
        1, 1, nests_tensor.size(0)
    )
    mask_3d = torch.where(
        (nest_alt[:, None] == nests_tensor[:, None].T).repeat(n_obs, 1, 1), 1, 0
    )
    sum_in_nest = torch.sum(mu_raw_preds_3d * mask_3d, dim=1)

    pred_i_m = torch.exp(mu_tensor * raw_preds) / torch.sum(
        sum_in_nest[:, None, :].repeat(1, n_alt, 1) * mask_3d, dim=2
    )

    V_tilde_m = 1 / mu * torch.log(sum_in_nest)

    # Pred of choosing nest m
    pred_m = torch.nn.functional.softmax(V_tilde_m, dim=1)

    # Final predictions for choosing i
    preds = pred_i_m * torch.sum(
        pred_m[:, None, :].repeat(1, n_alt, 1) * mask_3d, dim=2
    )

    return preds, pred_i_m, pred_m


def _cross_nested_probs_torch(raw_preds, mu, alphas, device):
    """compute cross nested predictions.

    Parameters
    ----------
    raw_preds :
        The raw predictions from the booster
    mu :
        The list of mu values for each nest.
        The first value correspond to the first nest and so on.
    alphas :
        The list of alpha values for each nest.
        The first value correspond to the first nest and so on.
    device :
        The device to use for the computation

    Returns
    -------
    preds :
        The cross nested predictions
    pred_i_m :
        The prediction of choosing alt i knowing nest m
    pred_m :
        The prediction of choosing nest m
    """
    if not torch_installed:
        raise ImportError(
            "Pytorch is not installed. Please install it to run rumboost on torch tensors."
        )

    # scaling and exponential of raw_preds, following by degree of memberships
    raw_preds_mu_alpha_3d = (alphas**mu)[None, :, :] * torch.exp(
        mu[None, None, :] * raw_preds[:, :, None]
    )
    # storing sum of utilities in nests
    sum_in_nest = torch.sum(raw_preds_mu_alpha_3d, dim=1) ** (1 / mu)[None, :]

    # pred of choosing i knowing m.
    pred_i_m = raw_preds_mu_alpha_3d / torch.sum(
        raw_preds_mu_alpha_3d, dim=1, keepdim=True
    )
    del raw_preds_mu_alpha_3d

    # pred of choosing m
    pred_m = sum_in_nest / torch.sum(sum_in_nest, dim=1, keepdim=True)
    del sum_in_nest

    # final predictions for choosing i
    preds = torch.sum(pred_i_m * pred_m[:, None, :], dim=2)

    return preds, pred_i_m, pred_m


@compile_decorator
def _cross_nested_probs_torch_compiled(raw_preds, mu, alphas, device):
    """compute cross nested predictions.

    Parameters
    ----------
    raw_preds :
        The raw predictions from the booster
    mu :
        The list of mu values for each nest.
        The first value correspond to the first nest and so on.
    alphas :
        The list of alpha values for each nest.
        The first value correspond to the first nest and so on.
    device :
        The device to use for the computation

    Returns
    -------
    preds :
        The cross nested predictions
    pred_i_m :
        The prediction of choosing alt i knowing nest m
    pred_m :
        The prediction of choosing nest m
    """
    if not torch_installed:
        raise ImportError(
            "Pytorch is not installed. Please install it to run rumboost on torch tensors."
        )

    # scaling and exponential of raw_preds, following by degree of memberships
    raw_preds_mu_alpha_3d = (alphas**mu)[None, :, :] * torch.exp(
        mu[None, None, :] * raw_preds[:, :, None]
    )
    # storing sum of utilities in nests
    sum_in_nest = torch.sum(raw_preds_mu_alpha_3d, dim=1) ** (1 / mu)[None, :]

    # pred of choosing i knowing m.
    pred_i_m = raw_preds_mu_alpha_3d / torch.sum(
        raw_preds_mu_alpha_3d, dim=1, keepdim=True
    )
    del raw_preds_mu_alpha_3d

    # pred of choosing m
    pred_m = sum_in_nest / torch.sum(sum_in_nest, dim=1, keepdim=True)
    del sum_in_nest

    # final predictions for choosing i
    preds = torch.sum(pred_i_m * pred_m[:, None, :], dim=2)

    return preds, pred_i_m, pred_m


def _threshold_preds_torch(raw_preds, thresholds):
    """compute ordinal predictions.

    Parameters
    ----------
    raw_preds :
        The raw predictions from the booster
    thresholds :
        The list of thresholds

    Returns
    -------
    preds :
        The ordinal predictions
    """
    if not torch_installed:
        raise ImportError(
            "Pytorch is not installed. Please install it to run rumboost on torch tensors."
        )

    thresholds = torch.tensor(thresholds).to(raw_preds.device)
    preds = torch.zeros(
        raw_preds.shape[0], thresholds.shape[0] + 1, device=raw_preds.device
    )
    sigmoids = torch.sigmoid(raw_preds - thresholds)
    preds[:, 0] = 1 - sigmoids[:, 0]
    preds[:, 1:-1] = -torch.diff(sigmoids, dim=1)
    preds[:, -1] = sigmoids[:, -1]

    return preds


@compile_decorator
def _threshold_preds_torch_compiled(raw_preds, thresholds):
    """compute ordinal predictions.

    Parameters
    ----------
    raw_preds :
        The raw predictions from the booster
    thresholds :
        The list of thresholds

    Returns
    -------
    preds :
        The ordinal predictions
    """
    if not torch_installed:
        raise ImportError(
            "Pytorch is not installed. Please install it to run rumboost on torch tensors."
        )

    thresholds = torch.tensor(thresholds).to(raw_preds.device)
    preds = torch.zeros(
        raw_preds.shape[0], thresholds.shape[0] + 1, device=raw_preds.device
    )
    sigmoids = torch.sigmoid(raw_preds - thresholds)
    preds[:, 0] = 1 - sigmoids[:, 0]
    preds[:, 1:-1] = -torch.diff(sigmoids, dim=1)
    preds[:, -1] = sigmoids[:, -1]

    return preds


def _f_obj_torch(
    preds,
    num_classes,
    utility,
    labels_j,
):
    if not torch_installed:
        raise ImportError(
            "Pytorch is not installed. Please install it to run rumboost on torch tensors."
        )

    pred = preds.T[utility, :].view(-1)  # corresponding predictions
    factor = num_classes / (
        num_classes - 1
    )  # factor to correct redundancy (see Friedmann, Greedy Function Approximation)
    eps = 1e-6
    labels = labels_j.T[utility, :].view(-1)
    grad = pred - labels
    factor_times_one_minus_pred = factor * (1 - pred)
    hess = (pred * factor_times_one_minus_pred).clamp_(min=eps)

    return grad, hess


@compile_decorator
def _f_obj_torch_compiled(
    preds,
    num_classes,
    utility,
    labels_j,
):
    if not torch_installed:
        raise ImportError(
            "Pytorch is not installed. Please install it to run rumboost on torch tensors."
        )
    pred = preds.T[utility, :].view(-1)  # corresponding predictions
    factor = num_classes / (
        num_classes - 1
    )  # factor to correct redundancy (see Friedmann, Greedy Function Approximation)
    eps = 1e-6
    labels = labels_j.T[utility, :].view(-1)
    grad = pred - labels
    factor_times_one_minus_pred = factor * (1 - pred)
    hess = (pred * factor_times_one_minus_pred).clamp_(min=eps)

    return grad, hess


def _f_obj_binary_torch(
    preds,
    labels,
):
    if not torch_installed:
        raise ImportError(
            "Pytorch is not installed. Please install it to run rumboost on torch tensors."
        )
    preds = preds.view(-1)
    labels = labels.view(-1)
    eps = 1e-6
    grad = preds - labels
    hess = (preds * (1 - preds)).clamp_(min=eps)

    return grad, hess


@compile_decorator
def _f_obj_binary_torch_compiled(
    preds,
    labels,
):
    if not torch_installed:
        raise ImportError(
            "Pytorch is not installed. Please install it to run rumboost on torch tensors."
        )
    preds = preds.view(-1)
    labels = labels.view(-1)
    eps = 1e-6
    grad = preds - labels
    hess = (preds * (1 - preds)).clamp_(min=eps)

    return grad, hess


def _f_obj_mse_torch(
    preds,
    target,
):
    if not torch_installed:
        raise ImportError(
            "Pytorch is not installed. Please install it to run rumboost on torch tensors."
        )
    preds = preds.view(-1)
    target = target.view(-1)
    grad = 2 * (preds - target)
    hess = 2 * torch.ones_like(preds)

    return grad, hess


@compile_decorator
def _f_obj_mse_torch_compiled(
    preds,
    target,
):
    if not torch_installed:
        raise ImportError(
            "Pytorch is not installed. Please install it to run rumboost on torch tensors."
        )
    preds = preds.view(-1)
    target = target.view(-1)
    grad = 2 * (preds - target)
    hess = 2 * torch.ones_like(preds)

    return grad, hess


def _f_obj_nested_torch(
    labels,
    preds_i_m,
    preds_m,
    num_classes,
    mu,
    nests,
    device,
    utility,
):
    if not torch_installed:
        raise ImportError(
            "Pytorch is not installed. Please install it to run rumboost on torch tensors."
        )
    label = labels.int()
    n_obs = preds_i_m.shape[0]
    data_idx = torch.arange(n_obs, device=device, dtype=torch.int32)
    factor = num_classes / (num_classes - 1)
    n_alt = preds_i_m.shape[1]
    nest_alt = torch.zeros(n_alt, dtype=torch.int32, device=device)
    for a, n in nests.items():
        nest_alt[n] = a
    label_nest = nest_alt[None, :].repeat(n_obs, 1)[data_idx, label]

    shared_ensembles_tensor = torch.from_numpy(np.array(utility)).to(device)

    pred_i_m = preds_i_m[
        :, shared_ensembles_tensor
    ]  # pred of alternative j knowing nest m
    pred_m = preds_m[:, :, None].repeat(1, 1, n_alt)[
        :, nest_alt[shared_ensembles_tensor], shared_ensembles_tensor
    ]  # prediction of choosing nest m

    mu_reps = mu[:, None].repeat(1, n_alt)

    grad = torch.where(
        label[:, None] == shared_ensembles_tensor[None, :],
        -mu_reps[nest_alt[shared_ensembles_tensor], shared_ensembles_tensor]
        * (1 - pred_i_m)
        - pred_i_m * (1 - pred_m),
        torch.where(
            label_nest[:, None] == nest_alt[shared_ensembles_tensor][None, :],
            mu_reps[nest_alt[shared_ensembles_tensor], shared_ensembles_tensor]
            * pred_i_m
            - pred_i_m * (1 - pred_m),
            pred_i_m * pred_m,
        ),
    )
    hess = torch.where(
        label[:, None] == shared_ensembles_tensor[None, :],
        -mu_reps[nest_alt[shared_ensembles_tensor], shared_ensembles_tensor]
        * pred_i_m
        * (1 - pred_i_m)
        * (
            1
            - mu_reps[nest_alt[shared_ensembles_tensor], shared_ensembles_tensor]
            - pred_m
        )
        + pred_i_m**2 * pred_m * (1 - pred_m),
        torch.where(
            label_nest[:, None] == nest_alt[shared_ensembles_tensor][None, :],
            -mu_reps[nest_alt[shared_ensembles_tensor], shared_ensembles_tensor]
            * pred_i_m
            * (1 - pred_i_m)
            * (
                1
                - mu_reps[nest_alt[shared_ensembles_tensor], shared_ensembles_tensor]
                - pred_m
            )
            + pred_i_m**2 * pred_m * (1 - pred_m),
            -pred_i_m
            * pred_m
            * (
                -mu_reps[nest_alt[shared_ensembles_tensor], shared_ensembles_tensor]
                * (1 - pred_i_m)
                - pred_i_m * (1 - pred_m)
            ),
        ),
    )
    hess.mul_(factor)

    return grad, hess


@compile_decorator
def _f_obj_nested_torch_compiled(
    labels, preds_i_m, preds_m, num_classes, mu, nests, device, utility
):
    if not torch_installed:
        raise ImportError(
            "Pytorch is not installed. Please install it to run rumboost on torch tensors."
        )

    label = labels.int()
    n_obs = preds_i_m.shape[0]
    data_idx = torch.arange(n_obs, device=device, dtype=torch.int32)
    factor = num_classes / (num_classes - 1)
    n_alt = preds_i_m.shape[1]
    nest_alt = torch.zeros(n_alt, dtype=torch.int32, device=device)
    for a, n in nests.items():
        nest_alt[n] = a
    label_nest = nest_alt[None, :].repeat(n_obs, 1)[data_idx, label]

    shared_ensembles_tensor = torch.from_numpy(np.array(utility)).to(device)

    pred_i_m = preds_i_m[
        :, shared_ensembles_tensor
    ]  # pred of alternative j knowing nest m
    pred_m = preds_m[:, :, None].repeat(1, 1, n_alt)[
        :, nest_alt[shared_ensembles_tensor], shared_ensembles_tensor
    ]  # prediction of choosing nest m

    mu_reps = mu[:, None].repeat(1, n_alt)

    grad = torch.where(
        label[:, None] == shared_ensembles_tensor[None, :],
        -mu_reps[nest_alt[shared_ensembles_tensor], shared_ensembles_tensor]
        * (1 - pred_i_m)
        - pred_i_m * (1 - pred_m),
        torch.where(
            label_nest[:, None] == nest_alt[shared_ensembles_tensor][None, :],
            mu_reps[nest_alt[shared_ensembles_tensor], shared_ensembles_tensor]
            * pred_i_m
            - pred_i_m * (1 - pred_m),
            pred_i_m * pred_m,
        ),
    )
    hess = torch.where(
        label[:, None] == shared_ensembles_tensor[None, :],
        -mu_reps[nest_alt[shared_ensembles_tensor], shared_ensembles_tensor]
        * pred_i_m
        * (1 - pred_i_m)
        * (
            1
            - mu_reps[nest_alt[shared_ensembles_tensor], shared_ensembles_tensor]
            - pred_m
        )
        + pred_i_m**2 * pred_m * (1 - pred_m),
        torch.where(
            label_nest[:, None] == nest_alt[shared_ensembles_tensor][None, :],
            -mu_reps[nest_alt[shared_ensembles_tensor], shared_ensembles_tensor]
            * pred_i_m
            * (1 - pred_i_m)
            * (
                1
                - mu_reps[nest_alt[shared_ensembles_tensor], shared_ensembles_tensor]
                - pred_m
            )
            + pred_i_m**2 * pred_m * (1 - pred_m),
            -pred_i_m
            * pred_m
            * (
                -mu_reps[nest_alt[shared_ensembles_tensor], shared_ensembles_tensor]
                * (1 - pred_i_m)
                - pred_i_m * (1 - pred_m)
            ),
        ),
    )
    hess.mul_(factor)

    return grad, hess


def _f_obj_cross_nested_torch(
    labels,
    preds_i_m,
    preds_m,
    preds,
    num_classes,
    mu,
    device,
    utility,
):
    if not torch_installed:
        raise ImportError(
            "Pytorch is not installed. Please install it to run rumboost on torch tensors."
        )
    label = labels.int()
    data_idx = torch.arange(preds_i_m.shape[0], device=device, dtype=torch.int32)
    factor = num_classes / (num_classes - 1)

    pred_j_m = preds_i_m[:, utility, :]  # pred of alternative j knowing nest m
    pred_i_m = preds_i_m[data_idx, label, :][
        :, None, :
    ]  # prediction of choice i knowing nest m
    pred_m = preds_m[:, None, :]  # prediction of choosing nest m
    pred_i = preds[data_idx, label][:, None, None]  # pred of choice i
    pred_j = preds[:, utility][:, :, None]  # pred of alt j

    pred_i_m_pred_m = pred_i_m * pred_m
    pred_j_m_pred_m = pred_j_m * pred_m
    pred_i_m_pred_i = pred_i_m * pred_i
    pred_i_m_squared = pred_i_m**2
    pred_j_m_squared = pred_j_m**2
    pred_i_squared = pred_i**2
    pred_j_m_pred_j_squared = (pred_j_m - pred_j) ** 2
    pred_i_m_1_mu_mu_pred_i = pred_i_m * (1 - mu) + mu - pred_i
    pred_j_m_1_mu_pred_j = pred_j_m * (1 - mu) - pred_j

    mu_squared = mu**2

    d_pred_i_Vi = torch.sum(
        (pred_i_m_pred_m * pred_i_m_1_mu_mu_pred_i), dim=2, keepdim=True
    )  # first derivative of pred i with respect to Vi
    d_pred_i_Vj = torch.sum(
        (pred_i_m_pred_m * pred_j_m_1_mu_pred_j), dim=2, keepdim=True
    )  # first derivative of pred i with respect to Vj
    d_pred_j_Vj = torch.sum(
        (pred_j_m_pred_m * (pred_j_m_1_mu_pred_j + mu)), dim=2, keepdim=True
    )  # first derivative of pred j with respect to Vj

    mu_3pim2_3pim_2pimpi_pi = mu * (
        -3 * pred_i_m_squared + 3 * pred_i_m + 2 * (pred_i_m_pred_i - pred_i)
    )
    pim2_2pimpi_pi2_dpiVi = (
        pred_i_m_squared - 2 * pred_i_m_pred_i + pred_i_squared - d_pred_i_Vi
    )
    mu2_2pim2_3pim_1 = mu_squared * (2 * pred_i_m_squared - 3 * pred_i_m + 1)
    mu2_pjm = mu_squared * (-pred_j_m)
    mu_pjm2_pjm = mu * (-pred_j_m_squared + pred_j_m)

    d2_pred_i_Vi = torch.sum(
        (
            pred_i_m_pred_m
            * (mu2_2pim2_3pim_1 + mu_3pim2_3pim_2pimpi_pi + pim2_2pimpi_pi2_dpiVi)
        ),
        dim=2,
        keepdim=True,
    )
    d2_pred_i_Vj = torch.sum(
        (
            pred_i_m_pred_m
            * (mu2_pjm + mu_pjm2_pjm + pred_j_m_pred_j_squared - d_pred_j_Vj)
        ),
        dim=2,
        keepdim=True,
    )

    mask = torch.from_numpy(np.array(utility)).to(device)[None, :] == label[:, None]
    grad = mask[:, :, None] * (((-1 / pred_i) * d_pred_i_Vi)) + (
        1 - mask[:, :, None]
    ) * (((-1 / pred_i) * d_pred_i_Vj))
    hess = mask[:, :, None] * (
        (-1 / pred_i**2) * (d2_pred_i_Vi * pred_i - d_pred_i_Vi**2)
    ) + (1 - mask[:, :, None]) * (
        (-1 / pred_i**2) * (d2_pred_i_Vj * pred_i - d_pred_i_Vj**2)
    )
    hess.mul_(factor)

    return grad, hess


@compile_decorator
def _f_obj_cross_nested_torch_compiled(
    labels,
    preds_i_m,
    preds_m,
    preds,
    num_classes,
    mu,
    device,
    utility,
):
    if not torch_installed:
        raise ImportError(
            "Pytorch is not installed. Please install it to run rumboost on torch tensors."
        )

    label = labels.int()
    data_idx = torch.arange(preds_i_m.shape[0], device=device, dtype=torch.int32)
    factor = num_classes / (num_classes - 1)

    pred_j_m = preds_i_m[:, utility, :]  # pred of alternative j knowing nest m
    pred_i_m = preds_i_m[data_idx, label, :][
        :, None, :
    ]  # prediction of choice i knowing nest m
    pred_m = preds_m[:, None, :]  # prediction of choosing nest m
    pred_i = preds[data_idx, label][:, None, None]  # pred of choice i
    pred_j = preds[:, utility][:, :, None]  # pred of alt j

    pred_i_m_pred_m = pred_i_m * pred_m
    pred_j_m_pred_m = pred_j_m * pred_m
    pred_i_m_pred_i = pred_i_m * pred_i
    pred_i_m_squared = pred_i_m**2
    pred_j_m_squared = pred_j_m**2
    pred_i_squared = pred_i**2
    pred_j_m_pred_j_squared = (pred_j_m - pred_j) ** 2
    pred_i_m_1_mu_mu_pred_i = pred_i_m * (1 - mu) + mu - pred_i
    pred_j_m_1_mu_pred_j = pred_j_m * (1 - mu) - pred_j

    mu_squared = mu**2

    d_pred_i_Vi = torch.sum(
        (pred_i_m_pred_m * pred_i_m_1_mu_mu_pred_i), dim=2, keepdim=True
    )  # first derivative of pred i with respect to Vi
    d_pred_i_Vj = torch.sum(
        (pred_i_m_pred_m * pred_j_m_1_mu_pred_j), dim=2, keepdim=True
    )  # first derivative of pred i with respect to Vj
    d_pred_j_Vj = torch.sum(
        (pred_j_m_pred_m * (pred_j_m_1_mu_pred_j + mu)), dim=2, keepdim=True
    )  # first derivative of pred j with respect to Vj

    mu_3pim2_3pim_2pimpi_pi = mu * (
        -3 * pred_i_m_squared + 3 * pred_i_m + 2 * (pred_i_m_pred_i - pred_i)
    )
    pim2_2pimpi_pi2_dpiVi = (
        pred_i_m_squared - 2 * pred_i_m_pred_i + pred_i_squared - d_pred_i_Vi
    )
    mu2_2pim2_3pim_1 = mu_squared * (2 * pred_i_m_squared - 3 * pred_i_m + 1)
    mu2_pjm = mu_squared * (-pred_j_m)
    mu_pjm2_pjm = mu * (-pred_j_m_squared + pred_j_m)

    d2_pred_i_Vi = torch.sum(
        (
            pred_i_m_pred_m
            * (mu2_2pim2_3pim_1 + mu_3pim2_3pim_2pimpi_pi + pim2_2pimpi_pi2_dpiVi)
        ),
        dim=2,
        keepdim=True,
    )
    d2_pred_i_Vj = torch.sum(
        (
            pred_i_m_pred_m
            * (mu2_pjm + mu_pjm2_pjm + pred_j_m_pred_j_squared - d_pred_j_Vj)
        ),
        dim=2,
        keepdim=True,
    )

    mask = torch.from_numpy(np.array(utility)).to(device)[None, :] == label[:, None]
    grad = mask[:, :, None] * (((-1 / pred_i) * d_pred_i_Vi)) + (
        1 - mask[:, :, None]
    ) * (((-1 / pred_i) * d_pred_i_Vj))
    hess = mask[:, :, None] * (
        (-1 / pred_i**2) * (d2_pred_i_Vi * pred_i - d_pred_i_Vi**2)
    ) + (1 - mask[:, :, None]) * (
        (-1 / pred_i**2) * (d2_pred_i_Vj * pred_i - d_pred_i_Vj**2)
    )
    hess.mul_(factor)

    return grad, hess


def _f_obj_proportional_odds_torch(
    labels,
    preds,
    raw_preds,
    thresholds,
):
    if not torch_installed:
        raise ImportError(
            "Pytorch is not installed. Please install it to run rumboost on torch tensors."
        )

    thresholds = torch.tensor(thresholds).to(raw_preds.device)
    # add a zero
    thresholds = torch.cat([thresholds, torch.tensor([0], device=raw_preds.device)])
    labels = labels.view(-1).int()

    grad = (
        (labels == 0).float() * torch.sigmoid(raw_preds - thresholds[0])
        + (labels == thresholds.shape[0]).float() * (preds[:, -1] - 1)
        + ((labels > 0) & (labels < thresholds.shape[0])).float()
        * (
            torch.sigmoid(raw_preds - thresholds[labels - 1])
            + torch.sigmoid(raw_preds - thresholds[labels])
            - 1
        )
    )

    hess = (
        (labels == 0).float() * preds[:, 0] * torch.sigmoid(raw_preds - thresholds[0])
        + (labels == thresholds.shape[0]).float() * preds[:, -1] * (1 - preds[:, -1])
        + ((labels > 0) & (labels < thresholds.shape[0])).float()
        * (
            torch.sigmoid(raw_preds - thresholds[labels - 1])
            * (1 - torch.sigmoid(raw_preds - thresholds[labels - 1]))
            + torch.sigmoid(raw_preds - thresholds[labels])
            * (1 - torch.sigmoid(raw_preds - thresholds[labels]))
        )
    )

    return grad, hess


@compile_decorator
def _f_obj_proportional_odds_torch_compiled(
    labels,
    preds,
    raw_preds,
    thresholds,
):
    if not torch_installed:
        raise ImportError(
            "Pytorch is not installed. Please install it to run rumboost on torch tensors."
        )

    thresholds = torch.tensor(thresholds).to(raw_preds.device)
    # add a zero
    thresholds = torch.cat([thresholds, torch.tensor([0], device=raw_preds.device)])
    labels = labels.view(-1).int()

    grad = (
        (labels == 0).float() * torch.sigmoid(raw_preds - thresholds[0])
        + (labels == thresholds.shape[0]).float() * (preds[:, -1] - 1)
        + ((labels > 0) & (labels < thresholds.shape[0])).float()
        * (
            torch.sigmoid(raw_preds - thresholds[labels - 1])
            + torch.sigmoid(raw_preds - thresholds[labels])
            - 1
        )
    )

    hess = (
        (labels == 0).float() * preds[:, 0] * torch.sigmoid(raw_preds - thresholds[0])
        + (labels == thresholds.shape[0]).float() * preds[:, -1] * (1 - preds[:, -1])
        + ((labels > 0) & (labels < thresholds.shape[0])).float()
        * (
            torch.sigmoid(raw_preds - thresholds[labels - 1])
            * (1 - torch.sigmoid(raw_preds - thresholds[labels - 1]))
            + torch.sigmoid(raw_preds - thresholds[labels])
            * (1 - torch.sigmoid(raw_preds - thresholds[labels]))
        )
    )

    return grad, hess


def _f_obj_coral_torch(
    labels,
    raw_preds,
    thresholds,
):
    if not torch_installed:
        raise ImportError(
            "Pytorch is not installed. Please install it to run rumboost on torch tensors."
        )
    raw_preds = raw_preds[:, None]
    thresholds = torch.tensor(thresholds).to(raw_preds.device)

    sigmoids = torch.sigmoid(raw_preds - thresholds)
    classes = torch.arange(thresholds.shape[0], device=raw_preds.device)

    grad = torch.sum(sigmoids - (labels[:, None] > classes[None, :]).float(), dim=1)

    hess = torch.sum(sigmoids * (1 - sigmoids), dim=1)

    return grad, hess


@compile_decorator
def _f_obj_coral_torch_compiled(
    labels,
    raw_preds,
    thresholds,
):
    if not torch_installed:
        raise ImportError(
            "Pytorch is not installed. Please install it to run rumboost on torch tensors."
        )
    raw_preds = raw_preds[:, None]
    thresholds = torch.tensor(thresholds).to(raw_preds.device)

    sigmoids = torch.sigmoid(raw_preds - thresholds)
    classes = torch.arange(thresholds.shape[0], device=raw_preds.device)

    grad = torch.sum(sigmoids - (labels[:, None] > classes[None, :]).float(), dim=1)

    hess = torch.sum(sigmoids * (1 - sigmoids), dim=1)

    return grad, hess



[docs]
def cross_entropy_torch(preds, labels):
    """
    Compute negative cross entropy for given predictions and data.

    Parameters
    ----------
    preds: torch.Tensor
        Predictions for all data points and each classes from a softmax function. preds[i, j] correspond
        to the prediction of data point i to belong to class j.
    labels: torch.Tensor
        The labels of the original dataset, as int.

    Returns
    -------
    Cross entropy : float
        The negative cross-entropy, as float.
    """
    if not torch_installed:
        raise ImportError(
            "Pytorch is not installed. Please install it to run rumboost on torch tensors."
        )
    return (
        -torch.mean(
            torch.log(
                preds[
                    torch.arange(
                        labels.shape[0], device=labels.device, dtype=torch.int32
                    ),
                    labels,
                ]
            )
        )
        .cpu()
        .type(torch.float32)
        .numpy()
    )




[docs]
@compile_decorator
def cross_entropy_torch_compiled(preds, labels):
    """
    Compute negative cross entropy for given predictions and data.

    Parameters
    ----------
    preds: torch.Tensor
        Predictions for all data points and each classes from a softmax function. preds[i, j] correspond
        to the prediction of data point i to belong to class j.
    labels: torch.Tensor
        The labels of the original dataset, as int.

    Returns
    -------
    Cross entropy : float
        The negative cross-entropy, as float.
    """
    if not torch_installed:
        raise ImportError(
            "Pytorch is not installed. Please install it to run rumboost on torch tensors."
        )
    return (
        -torch.mean(
            torch.log(
                preds[torch.arange(labels.shape[0], device=labels.device), labels]
            )
        )
        .cpu()
        .numpy()
    )




[docs]
def binary_cross_entropy_torch(preds, label):
    """
    Compute binary cross entropy for given predictions and data.

    Parameters
    ----------
    preds: torch.Tensor
        Predictions for all data points from a sigmoid function.
    label: torch.Tensor
        The labels of the original dataset, as int.

    Returns
    -------
    Binary cross entropy : float
        The binary cross-entropy, as float.
    """
    if not torch_installed:
        raise ImportError(
            "Pytorch is not installed. Please install it to run rumboost on torch tensors."
        )
    return (
        -torch.mean(label * torch.log(preds) + (1 - label) * torch.log(1 - preds))
        .cpu()
        .type(torch.float32)
        .numpy()
    )




[docs]
@compile_decorator
def binary_cross_entropy_torch_compiled(preds, label):
    """
    Compute binary cross entropy for given predictions and data.

    Parameters
    ----------
    preds: torch.Tensor
        Predictions for all data points from a sigmoid function.
    label: torch.Tensor
        The labels of the original dataset, as int.

    Returns
    -------
    Binary cross entropy : float
        The binary cross-entropy, as float.
    """
    if not torch_installed:
        raise ImportError(
            "Pytorch is not installed. Please install it to run rumboost on torch tensors."
        )
    return (
        -torch.mean(label * torch.log(preds) + (1 - label) * torch.log(1 - preds))
        .cpu()
        .numpy()
    )




[docs]
def mse_torch(preds, target):
    """
    Compute the mean squared error for given predictions and data.

    Parameters
    ----------
    preds: torch.Tensor
        Predictions for all data points.
    target: torch.Tensor
        The target values of the original dataset.

    Returns
    -------
    Mean squared error : float
        The mean squared error, as float.
    """
    if not torch_installed:
        raise ImportError(
            "Pytorch is not installed. Please install it to run rumboost on torch tensors."
        )
    return torch.mean((preds.view(-1) - target.view(-1)) ** 2).cpu().numpy()




[docs]
@compile_decorator
def mse_torch_compiled(preds, target):
    """
    Compute the mean squared error for given predictions and data.

    Parameters
    ----------
    preds: torch.Tensor
        Predictions for all data points.
    target: torch.Tensor
        The target values of the original dataset.

    Returns
    -------
    Mean squared error : float
        The mean squared error, as float.
    """
    if not torch_installed:
        raise ImportError(
            "Pytorch is not installed. Please install it to run rumboost on torch tensors."
        )
    return torch.mean((preds.view(-1) - target) ** 2).cpu().numpy()




[docs]
def coral_eval_torch(
    preds,
    labels,
):
    """
    Compute the coral evaluation function.

    Parameters
    ----------
    preds : torch.Tensor
        The predictions from the booster
    labels : torch.Tensor
        The labels of the original dataset, as int.
    Returns
    -------
    float
        The coral evaluation function, as float.
    """

    if not torch_installed:
        raise ImportError(
            "Pytorch is not installed. Please install it to run rumboost on torch tensors."
        )
    sigmoids = -torch.cumsum(preds, dim=1)[:, :-1] + 1
    classes = torch.arange(preds.shape[1] - 1, device=preds.device)
    levels = labels[:, None] > classes[None, :]

    return (
        -torch.mean(
            torch.mean(
                torch.log(sigmoids) * levels.float()
                + torch.log(1 - sigmoids) * (1 - levels.float()),
                dim=1,
            )
        )
        .cpu()
        .numpy()
    )




[docs]
@compile_decorator
def coral_eval_torch_compiled(
    preds,
    labels,
):
    """
    Compute the coral evaluation function.

    Parameters
    ----------
    preds : torch.Tensor
        The predictions from the booster
    labels : torch.Tensor
        The labels of the original dataset, as int.
    Returns
    -------
    float
        The coral evaluation function, as float.
    """

    if not torch_installed:
        raise ImportError(
            "Pytorch is not installed. Please install it to run rumboost on torch tensors."
        )
    sigmoids = -torch.cumsum(preds, dim=1)[:, :-1] + 1
    classes = torch.arange(preds.shape[1] - 1, device=preds.device)
    levels = labels[:, None] > classes[None, :]

    return (
        -torch.mean(
            torch.mean(
                torch.log(sigmoids) * levels.float()
                + torch.log(1 - sigmoids) * (1 - levels.float()),
                dim=1,
            )
        )
        .cpu()
        .numpy()
    )