Auto-format

explosion · Aug 27, 2019 · dd04a1a · dd04a1a
1 parent 541505e
commit dd04a1a
Show file tree

Hide file tree

Showing 4 changed files with 37 additions and 17 deletions.
diff --git a/spacy_pytorch_transformers/_train.py b/spacy_pytorch_transformers/_train.py
@@ -4,11 +4,22 @@
 from .util import cyclic_triangular_rate
 
 
-def train_while_improving(nlp, train_data, evaluate, *,
-    learning_rate: float, batch_size: int,
-    weight_decay: float, classifier_lr: float, dropout: float,
-    lr_range: int, lr_period: int,
-    steps_per_batch: int, patience: int, eval_every: int):
+def train_while_improving(
+    nlp,
+    train_data,
+    evaluate,
+    *,
+    learning_rate: float,
+    batch_size: int,
+    weight_decay: float,
+    classifier_lr: float,
+    dropout: float,
+    lr_range: int,
+    lr_period: int,
+    steps_per_batch: int,
+    patience: int,
+    eval_every: int
+):
     """Train until an evaluation stops improving. Works as a generator,
     with each iteration yielding a tuple `(batch, info, is_best_checkpoint)`,
     where info is a dict, and is_best_checkpoint is in [True, False, None] -- 
@@ -99,9 +110,7 @@ def train_while_improving(nlp, train_data, evaluate, *,
     steps_per_epoch = nr_batch * steps_per_batch
     optimizer = nlp.resume_training()
     learn_rates = cyclic_triangular_rate(
-        learning_rate / lr_range,
-        learning_rate * lr_range,
-        steps_per_epoch
+        learning_rate / lr_range, learning_rate * lr_range, steps_per_epoch
     )
     optimizer.pytt_lr = next(learn_rates)
     optimizer.pytt_weight_decay = HP.weight_decay
@@ -118,8 +127,13 @@ def train_while_improving(nlp, train_data, evaluate, *,
             optimizer.pytt_lr = next(learn_rates)
             docs, golds = zip(*batch)
             losses = {}
-            nlp.update(docs, golds, drop=HP.dropout, losses=losses,
-                sgd=(optimizer if (step % steps_per_batch == 0) else None))
+            nlp.update(
+                docs,
+                golds,
+                drop=HP.dropout,
+                losses=losses,
+                sgd=(optimizer if (step % steps_per_batch == 0) else None),
+            )
             if step != 0 and not (step % (eval_every * steps_per_batch)):
                 with nlp.use_params(optimizer.averages):
                     score, other_scores = evaluate()
@@ -128,9 +142,14 @@ def train_while_improving(nlp, train_data, evaluate, *,
             else:
                 score, other_scores = (None, None)
                 is_best_checkpoint = None
-            info = {"epoch": epoch, "step": step, "score": score,
-                    "other_scores": other_scores, "loss": losses,
-                    "checkpoints": results}
+            info = {
+                "epoch": epoch,
+                "step": step,
+                "score": score,
+                "other_scores": other_scores,
+                "loss": losses,
+                "checkpoints": results,
+            }
             yield batch, info, is_best_checkpoint
             step += 1
         epoch += 1

diff --git a/spacy_pytorch_transformers/model_registry.py b/spacy_pytorch_transformers/model_registry.py
@@ -93,7 +93,10 @@ def softmax_last_hidden(nr_class, *, exclusive_classes=True, **cfg):
     """
     width = cfg["token_vector_width"]
     return chain(
-        get_pytt_last_hidden, flatten_add_lengths, Pooling(mean_pool), Softmax(nr_class, width)
+        get_pytt_last_hidden,
+        flatten_add_lengths,
+        Pooling(mean_pool),
+        Softmax(nr_class, width),
     )
 
 

diff --git a/spacy_pytorch_transformers/util.py b/spacy_pytorch_transformers/util.py
@@ -238,7 +238,7 @@ def get_segment_ids(name: str, *lengths) -> List[int]:
         return get_gpt2_segment_ids(length1, length2)
     elif "roberta" in name:
         return get_roberta_segment_ids(length1, length2)
- 
+
     else:
         raise ValueError(f"Unexpected model name: {name}")
 

diff --git a/spacy_pytorch_transformers/wrapper.py b/spacy_pytorch_transformers/wrapper.py
@@ -253,5 +253,3 @@ def from_bytes(self, data):
         else:
             map_location = torch.device("cuda")
         self._model.load_state_dict(torch.load(filelike, map_location=map_location))
-
-