mwptoolkit.model.Seq2Seq.transformer¶

class mwptoolkit.model.Seq2Seq.transformer.Transformer(config, dataset)[source]¶

Bases: Module

Initializes internal Module state, shared by both nn.Module and ScriptModule.

calculate_loss(batch_data: dict) → float[source]¶

Finish forward-propagating, calculating loss and back-propagation.

batch_data should include keywords ‘question’, ‘equation’.

decoder_forward(encoder_outputs, seq_mask, target=None, output_all_layers=False)[source]¶

forward(src, target=None, output_all_layers=False) → Tuple[Tensor, Tensor, Dict[str, Any]][source]¶

Parameters

src (torch.Tensor) – input sequence, shape: [batch_size, seq_length].
target (torch.Tensor|None) – target, shape: [batch_size, target_length], default None.
output_all_layers (bool) – default False, return output of all layers if output_all_layers is True.

Returns

token_logits, symbol_outputs, model_all_outputs.

:rtype tuple(torch.Tensor, torch.Tensor, dict)

model_test(batch_data: dict) → tuple[source]¶

Model test.

batch_data should include keywords ‘question’, ‘equation’ and ‘num list’.

predict(batch_data: dict, output_all_layers=False)[source]¶

predict samples without target.

Parameters

Returns

token_logits, symbol_outputs, all_layer_outputs