fix validation sampling

delphi-suite · jaidhyani · Mar 19, 2024 · Feb 4, 2024 · Feb 4, 2024 · Feb 4, 2024
commit 580d3c60b18a133bc2d99fe5e5e83448b8ea7092
diff --git a/src/delphi/train/train_step.py b/src/delphi/train/train_step.py
@@ -51,6 +51,7 @@ def train_step(
             batch_size=config.batch_size,
             split_to_ds={"train": train_ds, "val": validation_ds},
             device=run_context.device,
+            epoch=model_training_state.epoch,
         )
         new_best_val_loss = False
         if losses["val"] < model_training_state.best_val_loss:

diff --git a/src/delphi/train/utils.py b/src/delphi/train/utils.py
@@ -249,13 +249,13 @@ def estimate_loss(
     batch_size: int,
     split_to_ds: dict[str, Dataset],
     device: torch.device,
+    epoch: int,
 ) -> dict[str, float]:
     """helps estimate an arbitrarily accurate loss over either split using many batches"""
     out = {}
     model.eval()
     for split, ds in split_to_ds.items():
-        # TODO: actually sample from val!!!!!
-        batch_iter = iter(batch_generator(ds, batch_size, 0, 0))
+        batch_iter = iter(batch_generator(ds, batch_size, epoch, 1234))
         losses = torch.zeros(eval_iters)  # keep on CPU
         for k in range(min(eval_iters, len(ds) // batch_size)):  # type: ignore
             X, Y = get_next_xy(batch_iter, device)