Create main_type.py

ARiSE-Lab · Oct 3, 2017 · 9eac494 · 9eac494
1 parent 5883058
commit 9eac494
Showing 1 changed file with 162 additions and 0 deletions.
diff --git a/main_type.py b/main_type.py
@@ -0,0 +1,162 @@
+###############################################################################
+# Author: Md Rizwan Parvez
+# Project: LanModeledProgramGeneration
+# Date Created: 4/1/2017
+# Some codes are from Wasi Ahmad main.py
+# File Description: This is the main script from where all experimental
+# execution begins.
+###############################################################################
+import torch.nn as nn
+import util, data #, helper, train
+import torch, random
+from torch import optim
+import model_rnd
+import time, math, os
+# from encoder import EncoderRNN
+from embedding_layer import Embedding_Drop_Layer
+from torch.autograd import Variable
+import train
+args = util.get_args()
+# args = get_args()
+# Set the random seed manually for reproducibility.
+
+print ('='*90, '\nWARNING:::: please fix nepochs, dictionary lower case, batchify, data path, batch size, trim_data for non divisible by batch size,  Glove embedding initialization (model_rnd.py 45), pickle_file_name!!!!!\n', '='*89)
+#print ('='*90, '\nWARNING:::: if you have insatnce based lstm you need to init model for each batch!!!!!\n', '='*89)
+
+torch.manual_seed(args.seed)
+if torch.cuda.is_available():
+    if not args.cuda:
+        print('='*90, "\nWARNING: You have a CUDA device, so you should probably run with --cuda\n", '='*89)
+    else:
+    	#torch.cuda.set_device(2)
+    	torch.cuda.manual_seed(args.seed)
+###############################################################################
+# Load data
+###############################################################################
+
+#### fix this
+# corpus = data.Corpus(args.data)
+corpus = data.Corpus(args)
+print('Train set size = ', len(corpus.train_data), len(corpus.train_label))
+# print('Development set size = ', len(corpus.dev))
+# print('Test set size = ', len(corpus.test))
+print('Vocabulary size = ', len(corpus.dictionary))
+
+###############################################################################
+# load_emb
+###############################################################################
+#### fix this
+#file_name = 'train_corpus_3' + 'embeddings_index.p'
+#file_name = 'PBT.p'
+#embeddings_index = util.get_initial_embeddings(file_name, args.data_path, args.word_vectors_directory, args.Glove_filename, corpus.dictionary)
+#print('Number of OOV words = ', len(corpus.dictionary) - len(embeddings_index))
+
+###############################################################################
+# batchify
+###############################################################################
+#### fix this
+
+train_data_trimed, train_label_trimed = util.batchify(corpus.train_data, corpus.train_label, args.batch_size, args.cuda) #[82915, 20] batch size = 20, it's kinda seq len in gen sense
+##### fix this
+#valid_batches = util.batchify(corpus.valid, args.batch_size, args.cuda)
+valid_data_trimed, valid_label_trimed = util.batchify(corpus.valid_data, corpus.valid_label, args.batch_size, args.cuda) #[82915, 20] batch size = 20, it's kinda seq len in gen sense
+
+#### fix this
+#test_batches = util.batchify(corpus.test, args.batch_size, args.cuda) 
+test_data_trimed, test_label_trimed = util.batchify(corpus.test_data, corpus.test_label, args.batch_size, args.cuda) #[82915, 20] batch size = 20, it's kinda seq len in gen sense
+
+assert len(train_data_trimed) == len(train_label_trimed)
+assert len(valid_data_trimed) == len(valid_label_trimed)
+assert len(test_data_trimed) == len(test_label_trimed)
+# print (batchify([2,3,4,3,4,355,4,342,90], 2))
+print('train_batches: size: ', len(train_data_trimed) ) #, 'seq len: ', len(train_data_trimed[0]), '1st instance: ', train_data_trimed[0][:50], '1st label: ', train_label_trimed[0][:50] )# , train_batches[0][0].sentence1)
+
+
+# ###############################################################################
+# # Build the model
+# ###############################################################################
+
+model_f = model_rnd.LanguageModel(corpus.dictionary, args)
+model_b = model_rnd.LanguageModel(corpus.dictionary, args)
+
+if args.cuda:
+    torch.cuda.set_device(args.gpu)
+    model_f.cuda()
+    model_b.cuda()
+
+# ###############################################################################
+# # Dummy use the model
+####fix this
+# ###############################################################################
+
+# list = [[4,14], [14,4]]
+# l_t = torch.LongTensor(list)
+# # list_var = Variable(l_t)
+# # print('========================== before calling model forward', file = sys.stderr)
+# print(model(l_t, l_t)[0][1])
+
+# ###############################################################################
+# # Train the model
+# ###############################################################################
+## loss: CrossEntropyLoss :: Combines LogSoftMax and NLLoss in one single class
+if args.debug_mode:
+    train_data_trimed = train_data_trimed[:50]
+    valid_data_trimed = valid_data_trimed[:50]
+    test_data_trimed = test_data_trimed[:50]
+    #print(len(train_data_trimed))
+    #print(train_data_trimed[::-1][-1][::-1])
+    #exit()
+train = train.Train(model_f, model_b, corpus.dictionary, 'CrossEntropyLoss')
+train.train_epochs(train_data_trimed, train_label_trimed , valid_data_trimed, valid_label_trimed)
+
+
+
+
+
+###############################################################################
+# fix this
+###############################################################################
+#train_data = train_batches
+#val_data = valid_batches
+#test_data = test_batches
+#ntokens = len(corpus.dictionary)
+#model = model.RNNModel(args.model, ntokens, args.emsize, args.nhid, args.nlayers, args.dropout, args.tied)
+#if args.cuda:
+#    model.cuda()
+
+criterion = nn.CrossEntropyLoss(size_average=True)
+
+###############################################################################
+# testing code
+###############################################################################
+
+
+
+# Load the best saved model.
+#with open(args.save, 'rb') as f:
+  #  model = torch.load(f)
+if os.path.isfile(os.path.join(args.log_dir, 'forward_model_best_type.pth.tar')) and os.path.isfile(os.path.join(args.log_dir, 'backward_model_best_type.pth.tar')):
+    print("=> Starting loading  best models for testing")
+    checkpoint_forward= torch.load(os.path.join(args.log_dir, 'forward_model_best_type.pth.tar'))
+    checkpoint_backward= torch.load(os.path.join(args.log_dir, 'backward_model_best_type.pth.tar'))
+    args.start_epoch = checkpoint_forward['epoch']
+    best_perplexity_forward = checkpoint_forward['perplexity']
+    best_perplexity_backward = checkpoint_backward['perplexity']
+    model_f.load_state_dict(checkpoint_forward['state_dict'])
+    model_b.load_state_dict(checkpoint_backward['state_dict'])
+    print("=> Finished loading  best models for testing")
+# Run on test data.
+#print ('using simple forward')
+#util.evaluate(valid_data_trimed, valid_label_trimed ,  model_f, corpus.dictionary, criterion, 0, None, 'forward')
+#print('-' * 89)
+#print ('using simple backward')
+#util.evaluate(valid_data_trimed, valid_label_trimed , model_b, corpus.dictionary, criterion, 0, None, 'backward')
+#print('-' * 89)
+
+
+
+test_loss = train.validate(test_data_trimed, test_label_trimed, model_f, model_b, args.nepochs, is_test = True)
+print('=' * 89)
+print('| End of training | test loss {:.2f} | test ppl {:5.2f} |'.format(
+    test_loss, math.exp(test_loss)))
+print('=' * 89)