MobilityPredictionEvaluator

srai.benchmark.MobilityPredictionEvaluator ¶

MobilityPredictionEvaluator(k: int = np.inf)

Bases: BaseEvaluator

Evaluator for models predicting H3 index trajectories directly.

k (int) : If set, only the first k elements of each sequence are used for metrics computation. Defaults to np.inf (use full sequences).

Source code in srai/benchmark/mobility_prediction_evaluator.py

def __init__(self, k: int = np.inf) -> None:
    """
    Create the evaluator.

    Args:
    k (int) : If set, only the first k elements of each sequence are used for metrics
             computation. Defaults to np.inf (use full sequences).
    """
    self.k = k
    super().__init__(task="mobility_prediction")

evaluate ¶

evaluate(
    dataset: sds.PointDataset | sds.TrajectoryDataset,
    predictions: list[list[str]],
    log_metrics: bool = True,
    hf_token: Optional[str] = None,
    **kwargs: Any
) -> dict[str, float]

Evaluate predicted H3 index sequences against ground truth H3 sequences.

PARAMETER	DESCRIPTION
`dataset`	Dataset to evaluate. TYPE: `TrajectoryDataset`
`predictions`	Predicted sequences of H3 indexes. TYPE: `List[List[str]]`
`log_metrics`	If True, logs metrics. TYPE: `bool` DEFAULT: `True`
`hf_token`	Ignored. TYPE: `str` DEFAULT: `None`
`**kwargs`	trip_ids (List[str]): List of trip IDs corresponding to predictions. TYPE: `Any` DEFAULT: `{}`

RETURNS	DESCRIPTION
`dict[str, float]`	dict[str, float]: Evaluation metrics.

Source code in srai/benchmark/mobility_prediction_evaluator.py

def evaluate(
    self,
    dataset: sds.PointDataset | sds.TrajectoryDataset,
    predictions: list[list[str]],
    log_metrics: bool = True,
    hf_token: Optional[str] = None,
    **kwargs: Any,
) -> dict[str, float]:
    """
    Evaluate predicted H3 index sequences against ground truth H3 sequences.

    Args:
        dataset (TrajectoryDataset): Dataset to evaluate.
        predictions (List[List[str]]): Predicted sequences of H3 indexes.
        log_metrics (bool): If True, logs metrics.
        hf_token (str, optional): Ignored.
        **kwargs:
            - trip_ids (List[str]): List of trip IDs corresponding to predictions.

    Returns:
        dict[str, float]: Evaluation metrics.
    """
    if not isinstance(dataset, sds.TrajectoryDataset):
        raise ValueError("This evaluator only supports TrajectoryDataset.")

    trip_ids = kwargs.get("trip_ids")
    if trip_ids is None:
        raise ValueError("`trip_ids` are required for trajectory evaluation.")

    _, _, h3_test = dataset.get_h3_with_labels()
    if h3_test is None:
        raise ValueError("The function 'get_h3_with_labels' returned None for h3_test.")

    trip_id_col = dataset.target if dataset.target is not None else "trip_id"
    h3_col = "h3_sequence_y"  # Adjust if this column name differs

    # Map predictions to their corresponding trip ID
    trip_to_prediction = {
        int(trip_id): prediction for trip_id, prediction in zip(trip_ids, predictions)
    }
    trip_to_prediction_keys = trip_to_prediction.keys()

    all_trip_ids = set(map(int, h3_test[trip_id_col].unique()))
    available_trip_ids = set(trip_to_prediction_keys).intersection(all_trip_ids)
    missing_trip_ids = set(trip_to_prediction_keys).difference(available_trip_ids)

    if missing_trip_ids:
        logging.info(
            f"{len(missing_trip_ids)} trip_ids have no matching data in the test set "
            f"and will be skipped. Evaluating {len(available_trip_ids)} trip(s)."
        )

    if not available_trip_ids:
        raise ValueError("No matching trip ids found in test dataset.")

    # Build filtered true sequences and predictions
    true_sequences = []
    filtered_predictions = []

    for trip_id in available_trip_ids:
        trip_df = h3_test[h3_test[trip_id_col] == trip_id]
        true_h3_seq = trip_df[h3_col].iloc[0]
        pred_h3_seq = trip_to_prediction[trip_id]

        true_sequences.append(true_h3_seq)
        filtered_predictions.append(pred_h3_seq)

    # Compute metrics
    metrics = self._compute_metrics(true_sequences, filtered_predictions, self.k)

    if log_metrics:
        self._log_metrics(metrics)

    return metrics