train_single_model.py

"""
Usage:
    train_single_model.py continue <path> [--iterations=<iterations>] [--embeddings=<embeddings>] [--validate_after=<validate_after>] [--batch=<batch>] [--chunk=<chunk>] [--lr=<lr>] [--path_train=<path_train>] [--path_dev=<path_dev>] [--appendix=<appendix>] [--relative] [--directsave]
    train_single_model.py new <dim_hidden> <dim_s1> <dim_s2> <dim_s3>  [--iterations=<iterations>] [--embeddings=<embeddings>] [--validate_after=<validate_after>] [--batch=<batch>] [--chunk=<chunk>] [--lr=<lr>] [--path_train=<path_train>] [--path_dev=<path_dev>] [--appendix=<appendix>] [--relative] [--directsave]
    train_single_model.py experiment <dim_hidden> <dim_s1> <dim_s2> <dim_s3> <path_res> <type> [--iterations=<iterations>] [--embeddings=<embeddings>] [--validate_after=<validate_after>] [--batch=<batch>] [--chunk=<chunk>] [--lr=<lr>] [--path_train=<path_train>] [--path_dev=<path_dev>] [--appendix=<appendix>] [--relative] [--directsave]

Options:
    <dim_hidden>    Hidden dimension of MLP.
    <dim_s1>        Hidden dimension in first sentence encoding LSTM.
    <dim_s2>        Hidden dimension in second sentence encoding LSTM.
    <dim_s3>        Hidden dimension in third sentence encoding LSTM.
    <file>          Already trained model. (not renamed)

    --iterations=<iterations>           How many iterations to train.
    --validate_after=<validate_after>   After how many examples evaluate on the entire data (train & dev).
    --batch=<batch>                     Minibatch size.
    --chunk=<chunk>                     Chunk size (data is splitted into chunks with roughly even size to minimize padding)
    --lr=<lr>                           Learning rate.
    --path_train=<path_train>           Path to train set.
    --path_dev=<path_dev>               Path to development set.
    --appendix=<appendix>               Appendix to add to the name.
    --relative                          Only use |p-h|, p*h for classification if set
    --directsave                        If set, always the best performing model on dev is written to the file while training, else only at the end.
    --embeddings=<embeddings>           Path to pretrained embeddings
"""
from docopt import docopt

import torch.nn.functional as F

import embeddingholder
import mydataloader
import config
from config import *
import time
import train
import pk_experiments
import model
from model import  *

def main():

    args = docopt(__doc__)

    DEFAULT_ITERATIONS = 2
    DEFAULT_LR = 0.0002
    DEFAULT_VAL_AFTER = 2000
    DEFAULT_BATCH = 32
    DEFAULT_CHUNK = 32*400

    iterations = int(args.get('--iterations') or DEFAULT_ITERATIONS)
    validate_after = int(args.get('--validate_after') or DEFAULT_VAL_AFTER)
    batch = int(args.get('--batch') or DEFAULT_BATCH)
    chunk = int(args.get('--chunk') or DEFAULT_CHUNK)
    lr = float(args.get('--lr') or DEFAULT_LR)
    path_train = args.get('--path_train') or PATH_TRAIN_DATA
    path_dev = args.get('--path_dev') or PATH_DEV_DATA
    appendix = args.get('--appendix') or ''
    directsave = args.get('--directsave') or False
    relative = args.get('--relative')
    embedding_path = args.get('--embeddings') or PATH_WORD_EMBEDDINGS
    
    if args['experiment']:
        dim_hidden = int(args['<dim_hidden>'])
        dim_s1 = int(args['<dim_s1>'])
        dim_s2 = int(args['<dim_s2>'])
        dim_s3 = int(args['<dim_s3>'])

        
        experiment_type = args.get('<type>')

        embedding_holder = embeddingholder.EmbeddingHolder(embedding_path)
        train_set = mydataloader.get_dataset_chunks(path_train, embedding_holder, chunk_size=chunk, mark_as='[train]')
        dev_set = mydataloader.get_dataset_chunks(path_dev, embedding_holder, chunk_size=chunk, mark_as='[dev]')
        classifier = classifier = cuda_wrap(EntailmentClassifier(embedding_holder.embeddings, 
                                            embedding_holder.padding(),
                                            dimen_hidden=dim_hidden, 
                                            dimen_out=3, 
                                            dimen_sent_encoder=[dim_s1, dim_s2, dim_s3],
                                            nonlinearity=F.relu, 
                                            dropout=0.1))

        experiment_name, pk_integrator = pk_experiments.experiments[experiment_type]
        classifier_name = train.to_name(lr, dim_hidden, [dim_s2, dim_s2, dim_s3], 
            batch, len(train_set), len(dev_set), str(time.time()), sent_repr='all', appendix=experiment_name)

        train.train_model_with_res(classifier, train_set, dev_set, embedding_holder.padding(), pk_integrator, lr, iterations, batch, validate_after=validate_after, store_intermediate_name=experiment_name)

    elif args['continue']:
        print('yay')
        embedding_holder = embeddingholder.EmbeddingHolder(embedding_path)
        classifier, loaded_name = model.load_model(args['<path>'])
        snli_train = mydataloader.get_dataset_chunks(path_train, embedding_holder, chunk_size=chunk, mark_as='[train]')
        snli_dev = mydataloader.get_dataset_chunks(path_dev, embedding_holder, chunk_size=chunk, mark_as='[dev]')


        train.train_model(classifier, snli_train, snli_dev, embedding_holder.padding(), 
            F.cross_entropy, lr, iterations, batch, validate_after, loaded_name + '.continued_best')

    elif args['new']:
        print('new model')
        dim_hidden = int(args['<dim_hidden>'])
        dim_s1 = int(args['<dim_s1>'])
        dim_s2 = int(args['<dim_s2>'])
        dim_s3 = int(args['<dim_s3>'])

        print(embedding_path)

        if relative:
            sent_repr = 'relative'
        else:
            sent_repr = 'all'


        print('Start training a new model:')
        
        embedding_holder = embeddingholder.EmbeddingHolder(embedding_path)
        snli_train = mydataloader.get_dataset_chunks(path_train, embedding_holder, chunk_size=chunk, mark_as='[train]')
        snli_dev = mydataloader.get_dataset_chunks(path_dev, embedding_holder, chunk_size=chunk, mark_as='[dev]')

        train.search_best_model(snli_train, snli_dev, embedding_holder, [lr], [dim_hidden], [[dim_s1, dim_s2, dim_s3]], [batch], epochs=iterations, validate_after=validate_after, appendix=appendix, directsave=directsave, sent_repr=sent_repr)

if __name__ == '__main__':
    main()