Source code for mwptoolkit.trainer.abstract_trainer

# -*- encoding: utf-8 -*-
# @Author: Yihuai Lan
# @Time: 2021/08/29 22:13:14
# @File: abstract_trainer.py
import os
from logging import getLogger

import torch

from mwptoolkit.utils.utils import write_json_data


[docs]class AbstractTrainer(object):
    """abstract trainer

    the base class of trainer class.
    
    example of instantiation:
        
        >>> trainer = AbstractTrainer(config, model, dataloader, evaluator)

        for training:
            
            >>> trainer.fit()
        
        for testing:
            
            >>> trainer.test()
        
        for parameter searching:

            >>> trainer.param_search()
    """

    def __init__(self, config, model, dataloader, evaluator):
        """
        Args:
            config (config): An instance object of Config, used to record parameter information.
            model (Model): An object of deep-learning model. 
            dataloader (Dataloader): dataloader object.
            evaluator (Evaluator): evaluator object.
        
        expected that config includes these parameters below:

        test_step (int): the epoch number of training after which conducts the evaluation on test.

        best_folds_accuracy (list|None): when running k-fold cross validation, this keeps the accuracy of folds that already run. 

        """
        super().__init__()
        self.config = config
        self.model = model
        self.dataloader = dataloader
        self.evaluator = evaluator
        self.logger = getLogger()
        self.best_folds_accuracy = config["best_folds_accuracy"]
        self.test_step = config["test_step"]

        self.best_valid_equ_accuracy = 0.
        self.best_valid_value_accuracy = 0.
        self.best_test_equ_accuracy = 0.
        self.best_test_value_accuracy = 0.
        self.start_epoch = 0
        self.epoch_i = 0
        self.output_result = []

        if self.config['k_fold']:
            if self.config['fold_t'] is None:
                self.logger.warning("config should include a parameter 'fold_t', which is the value of current fold.")

        self._build_optimizer()

        if config["resume"] or config["training_resume"]:
            self._load_checkpoint()

    def _save_checkpoint(self):
        raise NotImplementedError

    def _load_checkpoint(self):
        raise NotImplementedError

    def _save_model(self):
        state_dict = {"model": self.model.state_dict()}

        trained_model_dir = self.config['trained_model_dir']
        if not os.path.abspath(trained_model_dir):
            trained_model_dir = os.path.join(os.getcwd(),trained_model_dir)
        if not os.path.exists(trained_model_dir):
            os.mkdir(trained_model_dir)
        if self.config["k_fold"]:
            save_dir = os.path.join(trained_model_dir, 'fold{}'.format(self.config['fold_t']))
        else:
            save_dir = trained_model_dir
        if not os.path.exists(save_dir):
            os.mkdir(save_dir)
        model_file = os.path.join(save_dir, 'model.pth')
        torch.save(state_dict, model_file)
        self.config.save_config(save_dir)
        self.dataloader.dataset.save_dataset(save_dir)

    def _load_model(self):
        if self.config["k_fold"]:
            load_dir = os.path.join(self.config['trained_model_dir'], 'fold{}'.format(self.config['fold_t']))
        else:
            load_dir = self.config['trained_model_dir']
        model_file = os.path.join(load_dir, 'model.pth')
        state_dict = torch.load(model_file, map_location=self.config["map_location"])
        self.model.load_state_dict(state_dict["model"], strict=False)

    def _save_output(self):
        if not os.path.isabs(self.config['output_dir']):
            output_dir = os.path.join(os.getcwd(),self.config['output_dir'])
        else:
            output_dir = self.config['output_dir']
        if not os.path.exists(output_dir):
            os.mkdir(output_dir)
        if self.config["k_fold"]:
            save_dir = os.path.join(output_dir, 'fold{}'.format(self.config['fold_t']))
        else:
            save_dir = output_dir
        if not os.path.exists(save_dir):
            os.mkdir(save_dir)
        output_file = os.path.join(save_dir, 'generation_result.json')
        write_json_data(self.output_result, output_file)

    def _build_optimizer(self):
        raise NotImplementedError

    def _train_batch(self):
        raise NotADirectoryError

    def _eval_batch(self):
        raise NotImplementedError

    def _train_epoch(self):
        raise NotImplementedError

[docs]    def fit(self):
        raise NotImplementedError

[docs]    def evaluate(self, eval_set):
        raise NotImplementedError

[docs]    def test(self):
        raise NotImplementedError

[docs]    def param_search(self):
        raise NotImplementedError