RunSet and Alignment¶

RunSet is a fluent multi-run analysis primitive built on top of tracker query APIs. Use it when you need to:

Partition runs by a field/facet (split_by)
Filter runs by mixed run-field/facet predicates (filter)
Keep latest runs globally or per group (latest)
Align two run collections for 1:1 comparison (align)

Minimal example¶

from consist import RunSet, Tracker

tracker = Tracker(run_dir="./runs", db_path="./provenance.duckdb")

baseline = RunSet.from_query(tracker, label="baseline", parent_id="base")
policy = RunSet.from_query(tracker, label="policy", parent_id="policy")

pair = baseline.align(policy, on="year")
diffs = pair.config_diffs(namespace="beam")

API reference¶

`consist.runset.RunSet` `dataclass` ¶

Ordered run collection with grouping and alignment helpers.

Parameters:

Name	Type	Description	Default
`runs`	`List[Run]`	Run records included in this collection.	required
`label`	`Optional[str]`	Optional descriptive label propagated to derived RunSets and `to_frame()` output.	`None`

Notes

Methods are non-destructive. Operations like filter, latest, and split_by return new RunSet instances.

`from_query(tracker, label=None, **filters)` `classmethod` ¶

Build a tracker-backed RunSet from Tracker.find_runs filters.

Parameters:

Name	Type	Description	Default
`tracker`	`Tracker`	Tracker used to execute the query and resolve facet fields.	required
`label`	`Optional[str]`	Optional label for the returned RunSet.	`None`
`**filters`	`Any`	Keyword filters forwarded directly to `Tracker.find_runs`.	`{}`

Returns:

Type	Description
`RunSet`	Tracker-backed RunSet containing matching runs.

`from_runs(runs, label=None)` `classmethod` ¶

Build a RunSet from an existing iterable of runs.

Parameters:

Name	Type	Description	Default
`runs`	`Iterable[Run]`	Source run objects.	required
`label`	`Optional[str]`	Optional label for the returned RunSet.	`None`

Returns:

Type	Description
`RunSet`	New RunSet containing the provided runs. Field-based helpers work on these sets, but facet-based helpers require a tracker-backed RunSet created with `RunSet.from_query(...)` or `Tracker.run_set(...)`.

Notes

Use this constructor when you already have concrete Run objects and only need field-based operations such as positional access or grouping on built-in run attributes like year or status. If you need facet- aware helpers such as filter(scenario=...) or split_by("seed"), build the RunSet from a tracker-backed query instead so facet values can be loaded from the provenance store.

`split_by(field)` ¶

Partition runs into keyed sub-RunSets by field or facet value.

Parameters:

Name	Type	Description	Default
`field`	`str`	Run field (for example `"status"`, `"model"`, `"year"`) or flattened facet key (for example `"scenario_id"` or `"seed"`).	required

Returns:

Type	Description
`Dict[Any, RunSet]`	Ordered dict keyed by the resolved field value, sorted ascending. Missing values are grouped under `None`.

`filter(**field_values)` ¶

Filter runs by exact field/facet matches.

Parameters:

Name	Type	Description	Default
`**field_values`	`Any`	Key-value predicates. A run is retained only if all predicates match.	`{}`

Returns:

Type	Description
`RunSet`	New RunSet with runs that satisfy all predicates.

`latest(group_by=None)` ¶

Keep the most recent run by created_at globally or per group.

Parameters:

Name	Type	Description	Default
`group_by`	`Optional[List[str]]`	Grouping fields/facet keys. When omitted, returns a single-run RunSet containing the overall latest run.	`None`

Returns:

Type	Description
`RunSet`	New RunSet containing latest run(s) for each group.

`align(other, on)` ¶

Align two RunSets 1:1 on a shared field or facet key.

Parameters:

Name	Type	Description	Default
`other`	`RunSet`	Comparison RunSet.	required
`on`	`str`	Alignment key. Can reference a Run field or facet key.	required

Returns:

Type	Description
`AlignedPair`	Pair object containing only keys present on both sides, in sorted order.

Raises:

Type	Description
`ValueError`	If either side has duplicate values for `on`.

`to_frame()` ¶

Materialize a run summary DataFrame.

Returns:

Type	Description
`DataFrame`	One row per run with base columns: `run_id, label, status, model, created_at, ended_at` plus one column per facet key present across the RunSet.

`iter()` ¶

Iterate over runs in collection order.

`len()` ¶

Return the number of runs in the collection.

`getitem(index)` ¶

Return run at positional index.

`consist.runset.AlignedPair` `dataclass` ¶

Two RunSets matched 1:1 along a shared field/facet dimension.

Parameters:

Name	Type	Description	Default
`on`	`str`	Field/facet key used for alignment.	required
`left`	`RunSet`	Left-hand RunSet with keys ordered to match `keys`.	required
`right`	`RunSet`	Right-hand RunSet with keys ordered to match `keys`.	required
`keys`	`List[Any]`	Shared alignment key values present in both RunSets.	required

`pairs()` ¶

Iterate over matched (left_run, right_run) pairs.

Yields:

Type	Description
`tuple[Run, Run]`	Pair of aligned runs.

`apply(fn)` ¶

Apply a pairwise function over aligned runs and concatenate results.

Parameters:

Name	Type	Description	Default
`fn`	`Callable[[Run, Run, Any], DataFrame]`	Function called as `fn(left_run, right_run, key)` for each pair.	required

Returns:

Type	Description
`DataFrame`	Concatenated DataFrame with an added `_align_key` column.

Raises:

Type	Description
`TypeError`	If `fn` does not return a pandas DataFrame.

`config_diffs(namespace=None, prefix=None)` ¶

Compute config diffs for each aligned pair using Tracker.diff_runs.

Parameters:

Name	Type	Description	Default
`namespace`	`Optional[str]`	Namespace passed to `Tracker.diff_runs`.	`None`
`prefix`	`Optional[str]`	Optional key prefix filter passed to `Tracker.diff_runs`.	`None`

Returns:

Type	Description
`DataFrame`	Columns: `on_value, key, namespace, status, left_value, right_value`.

Raises:

Type	Description
`RuntimeError`	If neither RunSet is tracker-backed.

`to_frame()` ¶

Materialize aligned-pair summary rows.

Returns:

Type	Description
`DataFrame`	Columns: `key, left_run_id, right_run_id, left_status, right_status`.

RunSet and Alignment¶

Minimal example¶

API reference¶

consist.runset.RunSet dataclass ¶

from_query(tracker, label=None, **filters) classmethod ¶

from_runs(runs, label=None) classmethod ¶

split_by(field) ¶

filter(**field_values) ¶

latest(group_by=None) ¶

align(other, on) ¶

to_frame() ¶

__iter__() ¶

__len__() ¶

__getitem__(index) ¶

consist.runset.AlignedPair dataclass ¶

pairs() ¶

apply(fn) ¶

config_diffs(namespace=None, prefix=None) ¶

to_frame() ¶

`consist.runset.RunSet` `dataclass` ¶

`from_query(tracker, label=None, **filters)` `classmethod` ¶

`from_runs(runs, label=None)` `classmethod` ¶

`split_by(field)` ¶

`filter(**field_values)` ¶

`latest(group_by=None)` ¶

`align(other, on)` ¶

`to_frame()` ¶

`iter()` ¶

`len()` ¶

`getitem(index)` ¶

`consist.runset.AlignedPair` `dataclass` ¶

`pairs()` ¶

`apply(fn)` ¶

`config_diffs(namespace=None, prefix=None)` ¶

`to_frame()` ¶