Simple Pytorch Steps

September 24, 2021 2 minute read

Import necessary modules
Set device
Define data
Define model
Define loss function
Define optimizer
Train model
Eval model
Save Model
Load Model
inspect model

Import Necessary Modules

import torch
import torch.nn as nn
import torch.optim as optim
from torch.utils.data import DataLoader

Set Device

device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
print(device)

Define Data

# device a sample trainset
traindata = torch.tensor([[1, 2, 3], [2, 3, 4], [5, 7, 4], [9, 1, 4]], dtype=torch.float32)
# map traindata in cuda device or cpu
traindata = traindata.to(device)
# device train label
trainlabel = torch.LongTensor([0, 1, 0, 1])
# map label to cuda or cpu
trainlabel = trainlabel.to(device)
print(traindata)
print(trainlabel)

# define sample test set
testdata = torch.tensor([[1, 2, 3], [2, 3, 4], [5, 7, 4], [9, 1, 4]], dtype=torch.float32)
# map testdata in cuda device or cpu
testdata = testdata.to(device)
# device test label
testlabel = torch.LongTensor([0, 1, 0, 1])
# map label to cuda or cpu
testlabel = testlabel.to(device)

# convert traindata and label to example
def generate_data_example(data, label):
  examples = []
  for d, l in zip(data, label):
    data_set = (d, l)
    examples.append(data_set)
  return examples
 
train_examples = generate_data_example(traindata, trainlabel)
test_examples = generate_data_example(testdata, testlabel)

# fit in dataloader
batch_size = 1
train_dataloader = DataLoader(train_examples, batch_size=batch_size)
test_dataloader = DataLoader(test_examples, batch_size=batch_size)

Define Model

A simple one layer model

class Model(nn.Module):
  def __init__(self, input_size, output_size):
    super(Model, self).__init__()
    self.input_size = input_size
    self.output_size = output_size
    self.linear = nn.Linear(input_size, output_size)

  def forward(self, x):
    out = self.linear(x)
    return out
    
input_size = traindata.shape
print(input_size[1])
model = Model(input_size[1], 2)
model.to(device)
print(model)

Define Loss Function

criterion = nn.CrossEntropyLoss()

Define Optimizer

optimizer = optim.Adam(model.parameters(), lr=0.001)

Train Function

def train(dataloader, model, loss_fn, optimizer):
    size = len(dataloader.dataset)
    model.train()
    for batch, (X, y) in enumerate(dataloader):
        X, y = X.to(device), y.to(device)

        # Compute prediction error
        pred = model(X)
        loss = loss_fn(pred, y)

        # Backpropagation
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()

        if batch % 1 == 0:
            loss, current = loss.item(), batch * len(X)
            print(f"loss: {loss:>7f}  [{current:>5d}/{size:>5d}]")

Test Function

def test(dataloader, model, loss_fn):
    size = len(dataloader.dataset)
    num_batches = len(dataloader)
    model.eval()
    test_loss, correct = 0, 0
    with torch.no_grad():
        for X, y in dataloader:
            X, y = X.to(device), y.to(device)
            pred = model(X)
            test_loss += loss_fn(pred, y).item()
            correct += (pred.argmax(1) == y).type(torch.float).sum().item()
    test_loss /= num_batches
    correct /= size
    print(f"Test Error: \n Accuracy: {(100*correct):>0.1f}%, Avg loss: {test_loss:>8f} \n")

Train

epochs = 5
for t in range(epochs):
    print(f"Epoch {t+1}\n-------------------------------")
    train(train_dataloader, model, criterion, optimizer)
    test(test_dataloader, model, criterion)
print("Done!")

Save Model

torch.save(model.state_dict(), 'model.pth')

Load and Inference

load_model = model.load_state_dict(torch.load('model.pth'))
test_input = torch.tensor([[1, 2, 3]], dtype=torch.float32).to(device)
predict = model(test_input).data.max(1, keepdim=True)[1]
print(predict)

Inspect Model

# inspect parameters
params = model.parameters()
for param in params:
  print(param)
modules = model.named_modules()
for idx, m in enumerate(modules):
  print(idx, m)

Twitter Facebook LinkedIn

Sagor Sarker

Simple Pytorch Steps

Import Necessary Modules

Set Device

Define Data

Define Model

Define Loss Function

Define Optimizer

Train Function

Test Function

Train

Save Model

Load and Inference

Inspect Model

Comments

You May Also Enjoy

Large text data token counting fast

Processing tips of huggingface datasets

Process large CSV file using pandas

Large CSV file multiprocessing