Source code for autogluon.cloud.model.foundation_model

"""FoundationModel — predict with pretrained foundation models on AWS."""

from __future__ import annotations

import tempfile
from abc import abstractmethod
from pathlib import Path
from typing import Any, Dict, List, Literal, Optional, Union

import pandas as pd

from ..backend.backend_factory import BackendFactory
from ..backend.constant import SAGEMAKER, TABULAR_SAGEMAKER, TIMESERIES_SAGEMAKER
from ..endpoint.tabular_endpoint import TabularEndpoint
from ..endpoint.timeseries_endpoint import TimeSeriesEndpoint
from ..scripts.script_manager import ScriptManager
from ..utils.aws_utils import resolve_cloud_output_path
from .registry import get_model_config


class FoundationModel:
    """
    Pretrained foundation model inference on AWS.

    Factory: FoundationModel("chronos-bolt-base", ...) returns the appropriate
    task-specific subclass (TimeSeriesFoundationModel, TabularFoundationModel).

    Examples
    --------
    >>> model = FoundationModel("chronos-bolt-base")
    >>> predictions = model.predict(data, prediction_length=12)
    """

    _backend_map: Dict[str, str] = {}
    _predictor_type: str

    def __new__(cls, model_id: str, **kwargs) -> "FoundationModel":
        if cls is not FoundationModel:
            return super().__new__(cls)
        config = get_model_config(model_id)
        task = config["task"]
        if task == "forecasting":
            return super().__new__(TimeSeriesFoundationModel)
        elif task in ("classification", "regression"):
            return super().__new__(TabularFoundationModel)
        raise ValueError(f"Unsupported task: {task}")

    def __init__(
        self,
        model_id: str,
        backend: Literal["sagemaker"] = "sagemaker",
        cloud_output_path: Optional[str] = None,
        hyperparameters: Optional[Dict[str, Any]] = None,
        role: Optional[str] = None,
    ):
        """
        Parameters
        ----------
        model_id
            ID of the foundation model from the model registry.
        backend
            Cloud backend to use.
        cloud_output_path
            S3 location where intermediate artifacts are stored. Accepts:

            * ``s3://bucket`` — a unique timestamped subfolder ``ag-<timestamp>`` is appended.
            * ``s3://bucket/prefix`` — used verbatim. Re-running with the same prefix
              will overwrite previously written artifacts.
            * ``None`` (default) — use the bucket saved in ``~/.autogluon/cloud.yaml`` (set
              by :func:`autogluon.cloud.bootstrap` / :func:`autogluon.cloud.register`) and
              append a timestamped subfolder. Raises if no bucket is configured.
        hyperparameters
            Default hyperparameters applied to inference and (when supported) training.
        role
            ARN of the SageMaker execution role used to run training and inference jobs. If ``None``, falls back to
            ``role_arn`` in ``~/.autogluon/cloud.yaml`` (set by :func:`autogluon.cloud.bootstrap` /
            :func:`autogluon.cloud.register`), and finally to ``sagemaker.get_execution_role()``.
        """
        self.model_id = model_id
        self.cloud_output_path = resolve_cloud_output_path(cloud_output_path, backend_name=backend)
        self._config = get_model_config(model_id)
        self._hyperparameter_overrides = hyperparameters or {}
        self._tmpdir = tempfile.TemporaryDirectory(prefix="ag_fm_")

        backend_name = self._backend_map.get(backend)
        if backend_name is None:
            raise ValueError(
                f"Backend '{backend}' is not supported for {self.__class__.__name__}. "
                f"Available: {list(self._backend_map.keys())}"
            )
        self._backend = BackendFactory.get_backend(
            backend=backend_name,
            local_output_path=self._tmpdir.name,
            cloud_output_path=self.cloud_output_path,
            predictor_type=self._predictor_type,
            role=role,
        )

    def _get_hyperparameters(
        self, context: Literal["inference", "training"], overrides: Optional[Dict[str, Any]] = None
    ) -> Dict[str, Any]:
        """Merge registry defaults → constructor overrides → call-site overrides."""
        config_key = "inference_hyperparameters" if context == "inference" else "training_hyperparameters"
        return self._config.get(config_key, {}) | self._hyperparameter_overrides | (overrides or {})

    @abstractmethod
    def _build_predictor_init_args(self, **user_kwargs) -> Dict[str, Any]:
        """Build predictor_init_args dict from user-provided kwargs.

        Subclasses override to map their public API kwargs (e.g., prediction_length,
        target, known_covariates_names) to the dict that TimeSeriesPredictor/TabularPredictor expects.
        """
        ...

    @abstractmethod
    def _build_predictor_fit_args(self, hyperparameters: Optional[Dict[str, Any]] = None) -> Dict[str, Any]:
        """Build predictor_fit_args dict. Subclasses override with task-specific logic."""
        ...

    @property
    @abstractmethod
    def _serve_script_path(self) -> str:
        """Path to the serve script for this model type."""
        ...

    @abstractmethod
    def deploy(self, **kwargs):
        """Deploy model to a real-time endpoint.

        Subclasses implement this and return a task-specific endpoint
        (e.g., TimeSeriesEndpoint, TabularEndpoint).
        """
        ...

    @abstractmethod
    def predict(self, data: Union[str, Path, pd.DataFrame], wait: bool = True, **kwargs) -> Optional[pd.DataFrame]:
        """Subclasses override with task-specific signature."""
        ...

    def _deploy_backend(
        self,
        instance_type: Optional[str] = None,
        endpoint_name: Optional[str] = None,
        hyperparameters: Optional[Dict[str, Any]] = None,
        framework_version: str = "latest",
        custom_image_uri: Optional[str] = None,
        wait: bool = True,
        **backend_kwargs,
    ) -> None:
        """Shared deploy logic. Subclasses call this then wrap the endpoint."""
        if instance_type is None:
            instance_type = self._config["deploy_instance_type"]

        serve_config = {
            "model_name": self._config["model_name"],
            "hyperparameters": self._get_hyperparameters("inference", hyperparameters),
        }

        model_kwargs = backend_kwargs.pop("model_kwargs", {})
        model_kwargs["entry_point"] = self._serve_script_path

        self._backend.deploy(
            predictor_path=None,
            endpoint_name=endpoint_name,
            framework_version=framework_version,
            instance_type=instance_type,
            custom_image_uri=custom_image_uri,
            wait=wait,
            model_kwargs=model_kwargs,
            serve_config=serve_config,
            **backend_kwargs,
        )
        assert self._backend.endpoint is not None

    def fit(
        self,
        train_data: Union[str, Path, pd.DataFrame],
        output_path: Optional[str] = None,
        instance_type: Optional[str] = None,
        hyperparameters: Optional[Dict[str, Any]] = None,
        wait: bool = True,
        **kwargs,
    ) -> "FoundationModel":
        """
        Fine-tune the model. Returns a new FoundationModel pointing to the fine-tuned artifact.

        Parameters
        ----------
        train_data
            Training data, as a DataFrame or local/S3 path to a data file.
        output_path
            S3 path to store fine-tuned model.
            If None, will auto-generate under cloud_output_path.
        instance_type
            Instance type for the training job.
            If None, will use the default from the model registry.
        hyperparameters
            Model hyperparameters for training. Overrides values passed to the constructor.
            Available hyperparameters for each model are listed in the AutoGluon documentation.
        wait
            If True, block until training completes.

        Returns
        -------
        FoundationModel
            New instance with hyperparameters pointing to the fine-tuned artifact.

        :meta private:
        """
        if not self._config.get("fine_tunable", False):
            raise ValueError(f"Model '{self.model_id}' does not support fine-tuning.")
        raise NotImplementedError

    def cache_model_artifact(self, s3_path: str) -> str:
        """
        Pre-cache model weights to S3 (for VPC-deployed endpoints).

        Launches a small job that downloads weights from HuggingFace
        and uploads them to S3.

        Parameters
        ----------
        s3_path
            S3 path where the model weights should be cached.

        Returns
        -------
        str
            S3 path to the cached artifact.

        :meta private:
        """
        raise NotImplementedError



[docs]
class TimeSeriesFoundationModel(FoundationModel):
    """Foundation model for time series forecasting (Chronos, etc.)."""

    _backend_map = {SAGEMAKER: TIMESERIES_SAGEMAKER}
    _predictor_type = "timeseries"

    @property
    def _serve_script_path(self) -> str:
        return ScriptManager.SAGEMAKER_TIMESERIES_FM_SERVE_SCRIPT_PATH


[docs]
    def deploy(
        self,
        instance_type: Optional[str] = None,
        endpoint_name: Optional[str] = None,
        hyperparameters: Optional[Dict[str, Any]] = None,
        framework_version: str = "latest",
        custom_image_uri: Optional[str] = None,
        wait: bool = True,
        **backend_kwargs,
    ) -> TimeSeriesEndpoint:
        """
        Deploy model to a real-time endpoint.

        Parameters
        ----------
        instance_type
            Instance type for the endpoint.
            If None, will use the default from the model registry.
        endpoint_name
            Custom endpoint name.
            If None, will auto-generate a unique name.
        hyperparameters
            Model hyperparameters for inference. Overrides values passed to the constructor.
        framework_version
            Container framework version. If 'latest', uses the most recent available.
        custom_image_uri
            Custom Docker image URI for the inference container.
        wait
            Whether to block until the endpoint is ready.
        **backend_kwargs
            Backend-specific arguments (e.g., initial_instance_count, volume_size,
            model_kwargs, deploy_kwargs).

        Returns
        -------
        TimeSeriesEndpoint
        """
        self._deploy_backend(
            instance_type=instance_type,
            endpoint_name=endpoint_name,
            hyperparameters=hyperparameters,
            framework_version=framework_version,
            custom_image_uri=custom_image_uri,
            wait=wait,
            **backend_kwargs,
        )
        return TimeSeriesEndpoint(self._backend.endpoint)


    def _build_predictor_fit_args(self, hyperparameters: Optional[Dict[str, Any]] = None) -> Dict[str, Any]:
        model_name = self._config["model_name"]
        merged_hp = self._get_hyperparameters("inference", hyperparameters)
        return {
            "hyperparameters": {model_name: merged_hp},
            "skip_model_selection": True,
        }

    def _build_predictor_init_args(
        self,
        target: str = "target",
        prediction_length: int = 1,
        quantile_levels: Optional[List[float]] = None,
        **kwargs,
    ) -> Dict[str, Any]:
        """Map user kwargs to TimeSeriesPredictor init args."""
        args: Dict[str, Any] = {
            "target": target,
            "prediction_length": prediction_length,
        }
        if quantile_levels is not None:
            args["quantile_levels"] = quantile_levels
        return args


[docs]
    def predict(
        self,
        data: Union[str, Path, pd.DataFrame],
        target: str = "target",
        id_column: str = "item_id",
        timestamp_column: str = "timestamp",
        known_covariates: Optional[Union[str, Path, pd.DataFrame]] = None,
        static_features: Optional[Union[str, Path, pd.DataFrame]] = None,
        prediction_length: int = 1,
        quantile_levels: Optional[List[float]] = None,
        hyperparameters: Optional[Dict[str, Any]] = None,
        instance_type: Optional[str] = None,
        framework_version: str = "latest",
        custom_image_uri: Optional[str] = None,
        wait: bool = True,
        predictions_path: Optional[str] = None,
        **backend_kwargs,
    ) -> Optional[pd.DataFrame]:
        """
        Run batch prediction for time series.

        Parameters
        ----------
        data
            Historical time series to forecast from, in long format, as a DataFrame or local/S3 path to
            a data file. See the `TimeSeriesPredictor docs <https://auto.gluon.ai/stable/api/autogluon.timeseries.TimeSeriesPredictor.html>`_
            for the expected format.
        target
            Name of the column that contains the target values to forecast.
        id_column
            Name of the column with the unique identifier of each time series (item).
        timestamp_column
            Name of the column with the observation timestamps.
        known_covariates
            Future values of the known covariates over the forecast horizon. Covariate column names are
            inferred from the columns (excluding ``id_column`` and ``timestamp_column``).
        static_features
            Static (time-independent) features describing each individual time series.
        prediction_length
            Forecast horizon: how many time steps into the future the model should predict.
        quantile_levels
            List of increasing decimals between 0 and 1 specifying which quantiles to estimate. Defaults
            to ``[0.1, 0.2, ..., 0.9]``.
        hyperparameters
            Model hyperparameters for inference. Overrides values passed to the constructor.
        instance_type
            Instance type for the prediction job. If None, uses registry default.
        framework_version
            Container framework version.
        custom_image_uri
            Custom Docker image URI for the container.
        wait
            If True, block and return DataFrame. If False, return the job handle.
        predictions_path
            S3 URL where predictions will be written by the prediction job (e.g.
            ``s3://my-bucket/runs/2024-05-01/predictions.csv``). The container's SageMaker execution
            role must have ``s3:PutObject`` permission for this location. Defaults to
            ``{cloud_output_path}/{job_name}/predictions.csv``. Predictions use AutoGluon's canonical
            column names ``item_id`` and ``timestamp``, regardless of the ``id_column`` /
            ``timestamp_column`` passed in.
        **backend_kwargs
            Additional backend-specific arguments (e.g., job_name, volume_size,
            autogluon_sagemaker_estimator_kwargs).

        Returns
        -------
        Optional[pd.DataFrame]
        """
        if instance_type is None:
            instance_type = self._config["predict_instance_type"]

        predictor_init_args = self._build_predictor_init_args(
            target=target,
            prediction_length=prediction_length,
            quantile_levels=quantile_levels,
        )

        predictor_fit_args = self._build_predictor_fit_args(hyperparameters)
        data_channels = {
            "train_data": data,
            "known_covariates": known_covariates,
            "static_features": static_features,
        }

        extra_ag_args: Dict[str, Any] = {"predict_after_fit": True}
        if predictions_path is not None:
            extra_ag_args["predictions_path"] = predictions_path

        self._backend.fit(
            predictor_init_args=predictor_init_args,
            predictor_fit_args=predictor_fit_args,
            data_channels=data_channels,
            id_column=id_column,
            timestamp_column=timestamp_column,
            framework_version=framework_version,
            instance_type=instance_type,
            custom_image_uri=custom_image_uri,
            wait=wait,
            extra_ag_args=extra_ag_args,
            **backend_kwargs,
        )

        if not wait:
            # TODO: return a handle that supports polling status and fetching results
            return None

        return self._backend.get_fit_predict_results()




class TabularFoundationModel(FoundationModel):
    """Foundation model for tabular prediction (Mitra, TabICL, etc.)."""

    _backend_map = {SAGEMAKER: TABULAR_SAGEMAKER}
    _predictor_type = "tabular"

    @property
    def _serve_script_path(self) -> str:
        return ScriptManager.SAGEMAKER_TABULAR_FM_SERVE_SCRIPT_PATH

    def _build_predictor_init_args(self, label: str = "target", **kwargs) -> Dict[str, Any]:
        """Map user kwargs to TabularPredictor init args."""
        return {"label": label}

    def _build_predictor_fit_args(self, hyperparameters: Optional[Dict[str, Any]] = None) -> Dict[str, Any]:
        model_name = self._config["model_name"]
        merged_hp = self._get_hyperparameters("inference", hyperparameters)
        return {
            "hyperparameters": {model_name: merged_hp},
            "fit_weighted_ensemble": False,
            "calibrate_decision_threshold": False,
        }

    def deploy(
        self,
        instance_type: Optional[str] = None,
        endpoint_name: Optional[str] = None,
        hyperparameters: Optional[Dict[str, Any]] = None,
        framework_version: str = "latest",
        custom_image_uri: Optional[str] = None,
        wait: bool = True,
        **backend_kwargs,
    ) -> TabularEndpoint:
        """
        Deploy the foundation model to a real-time endpoint.

        Parameters
        ----------
        instance_type
            Instance type for the endpoint. If None, uses registry default.
        endpoint_name
            Custom endpoint name. If None, auto-generated.
        hyperparameters
            Model hyperparameters for inference. Overrides constructor values.
        framework_version
            Container framework version.
        custom_image_uri
            Custom Docker image URI for the inference container.
        wait
            Whether to block until the endpoint is ready.
        **backend_kwargs
            Backend-specific arguments.

        Returns
        -------
        TabularEndpoint
        """
        self._deploy_backend(
            instance_type=instance_type,
            endpoint_name=endpoint_name,
            hyperparameters=hyperparameters,
            framework_version=framework_version,
            custom_image_uri=custom_image_uri,
            wait=wait,
            **backend_kwargs,
        )
        return TabularEndpoint(self._backend.endpoint)

    def _run_fit_predict_job(
        self,
        train_data: Union[str, Path, pd.DataFrame],
        test_data: Union[str, Path, pd.DataFrame],
        *,
        label: str,
        hyperparameters: Optional[Dict[str, Any]],
        instance_type: Optional[str],
        framework_version: str,
        custom_image_uri: Optional[str],
        wait: bool,
        predictions_path: Optional[str],
        **backend_kwargs,
    ) -> Optional[pd.DataFrame]:
        """Launch a single fit+predict SageMaker job.

        For classification tasks the job emits a combined DataFrame ``[<label>, <class>_proba, ...]``
        so :meth:`predict` and :meth:`predict_proba` can share one job. For regression it emits the
        single-column predictions DataFrame.
        """
        if instance_type is None:
            instance_type = self._config["predict_instance_type"]

        predictor_init_args = self._build_predictor_init_args(label=label)
        predictor_fit_args = self._build_predictor_fit_args(hyperparameters)
        data_channels = {
            "train_data": train_data,
            "test_data": test_data,
        }

        extra_ag_args: Dict[str, Any] = {"predict_after_fit": True}
        if predictions_path is not None:
            extra_ag_args["predictions_path"] = predictions_path

        self._backend.fit(
            predictor_init_args=predictor_init_args,
            predictor_fit_args=predictor_fit_args,
            data_channels=data_channels,
            framework_version=framework_version,
            instance_type=instance_type,
            custom_image_uri=custom_image_uri,
            wait=wait,
            extra_ag_args=extra_ag_args,
            **backend_kwargs,
        )

        if not wait:
            return None

        return self._backend.get_fit_predict_results()

    def predict(
        self,
        train_data: Union[str, Path, pd.DataFrame],
        test_data: Union[str, Path, pd.DataFrame],
        label: str = "target",
        hyperparameters: Optional[Dict[str, Any]] = None,
        instance_type: Optional[str] = None,
        framework_version: str = "latest",
        custom_image_uri: Optional[str] = None,
        wait: bool = True,
        predictions_path: Optional[str] = None,
        **backend_kwargs,
    ) -> Optional[pd.Series]:
        """
        Run batch prediction for tabular tasks.

        For tabular foundation models (e.g., Mitra), ``train_data`` provides the few-shot context
        and ``test_data`` contains the rows to predict on. Both are uploaded to a single SageMaker
        training job that runs the in-context-learning fit and prediction in one pass.

        Returns
        -------
        Optional[pd.Series]
            Predicted labels (``None`` when ``wait`` is False).
        """
        from ..utils.utils import split_pred_and_pred_proba

        result = self._run_fit_predict_job(
            train_data=train_data,
            test_data=test_data,
            label=label,
            hyperparameters=hyperparameters,
            instance_type=instance_type,
            framework_version=framework_version,
            custom_image_uri=custom_image_uri,
            wait=wait,
            predictions_path=predictions_path,
            **backend_kwargs,
        )
        if result is None:
            return None
        if self._config["task"] == "regression":
            return result.iloc[:, 0]
        pred, _ = split_pred_and_pred_proba(result)
        return pred

    def predict_proba(
        self,
        train_data: Union[str, Path, pd.DataFrame],
        test_data: Union[str, Path, pd.DataFrame],
        label: str = "target",
        include_predict: bool = False,
        hyperparameters: Optional[Dict[str, Any]] = None,
        instance_type: Optional[str] = None,
        framework_version: str = "latest",
        custom_image_uri: Optional[str] = None,
        wait: bool = True,
        predictions_path: Optional[str] = None,
        **backend_kwargs,
    ) -> Optional[Union[pd.DataFrame, "tuple"]]:
        """
        Run batch prediction returning class probabilities. Only valid for classification tasks.

        Parameters mirror :meth:`predict`. If ``include_predict`` is True, returns a tuple of
        ``(prediction, predict_probability)``; otherwise returns ``predict_probability`` only.
        """
        from ..utils.utils import split_pred_and_pred_proba

        if self._config["task"] != "classification":
            raise ValueError(f"predict_proba is only supported for classification, got task='{self._config['task']}'.")
        result = self._run_fit_predict_job(
            train_data=train_data,
            test_data=test_data,
            label=label,
            hyperparameters=hyperparameters,
            instance_type=instance_type,
            framework_version=framework_version,
            custom_image_uri=custom_image_uri,
            wait=wait,
            predictions_path=predictions_path,
            **backend_kwargs,
        )
        if result is None:
            return None
        pred, pred_proba = split_pred_and_pred_proba(result)
        if include_predict:
            return pred, pred_proba
        return pred_proba