00003、pytorch实现AlexNet代码

市政公所 · 发表于 2023-7-15 15:58:29

model.py
import torch.nn as nn
import torch

class AlexNet(nn.Module):
def __init__(self, num_classes=1000, init_weights=False):
      super(AlexNet, self).__init__()
      self.features = nn.Sequential(
         nn.Conv2d(3, 48, kernel_size=11, stride=4, padding=2),  # input[3, 224, 224]  output[48, 55, 55]
         nn.ReLU(inplace=True),
         nn.MaxPool2d(kernel_size=3, stride=2),                # output[48, 27, 27]
         nn.Conv2d(48, 128, kernel_size=5, padding=2),          # output[128, 27, 27]
         nn.ReLU(inplace=True),
         nn.MaxPool2d(kernel_size=3, stride=2),                # output[128, 13, 13]
         nn.Conv2d(128, 192, kernel_size=3, padding=1),       # output[192, 13, 13]
         nn.ReLU(inplace=True),
         nn.Conv2d(192, 192, kernel_size=3, padding=1),       # output[192, 13, 13]
         nn.ReLU(inplace=True),
         nn.Conv2d(192, 128, kernel_size=3, padding=1),       # output[128, 13, 13]
         nn.ReLU(inplace=True),
         nn.MaxPool2d(kernel_size=3, stride=2),                # output[128, 6, 6]
      )
      self.classifier = nn.Sequential(
         nn.Dropout(p=0.5),
         nn.Linear(128 * 6 * 6, 2048),
         nn.ReLU(inplace=True),
         nn.Dropout(p=0.5),
         nn.Linear(2048, 2048),
         nn.ReLU(inplace=True),
         nn.Linear(2048, num_classes),
      )
      if init_weights:
         self._initialize_weights()

def forward(self, x):
      x = self.features(x)
      x = torch.flatten(x, start_dim=1)
      x = self.classifier(x)
      return x

def _initialize_weights(self):
      for m in self.modules():
         if isinstance(m, nn.Conv2d):
            nn.init.kaiming_normal_(m.weight, mode=&#39;fan_out&#39;, nonlinearity=&#39;relu&#39;)
            if m.bias is not None:
                  nn.init.constant_(m.bias, 0)
         elif isinstance(m, nn.Linear):
            nn.init.normal_(m.weight, 0, 0.01)
            nn.init.constant_(m.bias, 0)train.py
import os
import sys
import json

import torch
import torch.nn as nn
from torchvision import transforms, datasets, utils
import matplotlib.pyplot as plt
import numpy as np
import torch.optim as optim
from tqdm import tqdm

from model import AlexNet

def main():
device = torch.device(&#34;cuda:0&#34; if torch.cuda.is_available() else &#34;cpu&#34;)
print(&#34;using {} device.&#34;.format(device))

data_transform = {
      &#34;train&#34;: transforms.Compose([transforms.RandomResizedCrop(224),
                                 transforms.RandomHorizontalFlip(),
                                 transforms.ToTensor(),
                                 transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5))]),
      &#34;val&#34;: transforms.Compose([transforms.Resize((224, 224)),  # cannot 224, must (224, 224)
                                 transforms.ToTensor(),
                                 transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5))])}

data_root = os.path.abspath(os.path.join(os.getcwd(), &#34;../..&#34;))  # get data root path
image_path = os.path.join(data_root, &#34;data_set&#34;, &#34;flower_data&#34;)  # flower data set path
assert os.path.exists(image_path), &#34;{} path does not exist.&#34;.format(image_path)
train_dataset = datasets.ImageFolder(root=os.path.join(image_path, &#34;train&#34;),
                                       transform=data_transform[&#34;train&#34;])
train_num = len(train_dataset)

# {&#39;daisy&#39;:0, &#39;dandelion&#39;:1, &#39;roses&#39;:2, &#39;sunflower&#39;:3, &#39;tulips&#39;:4}
flower_list = train_dataset.class_to_idx
cla_dict = dict((val, key) for key, val in flower_list.items())
# write dict into json file
json_str = json.dumps(cla_dict, indent=4)
with open(&#39;class_indices.json&#39;, &#39;w&#39;) as json_file:
      json_file.write(json_str)

batch_size = 32
nw = min([os.cpu_count(), batch_size if batch_size > 1 else 0, 8])  # number of workers
print(&#39;Using {} dataloader workers every process&#39;.format(nw))

train_loader = torch.utils.data.DataLoader(train_dataset,
                                             batch_size=batch_size, shuffle=True,
                                             num_workers=nw)

validate_dataset = datasets.ImageFolder(root=os.path.join(image_path, &#34;val&#34;),
                                          transform=data_transform[&#34;val&#34;])
val_num = len(validate_dataset)
validate_loader = torch.utils.data.DataLoader(validate_dataset,
                                                batch_size=4, shuffle=False,
                                                num_workers=nw)

print(&#34;using {} images for training, {} images for validation.&#34;.format(train_num,
                                                                        val_num))
# test_data_iter = iter(validate_loader)
# test_image, test_label = test_data_iter.next()
#
# def imshow(img):
#    img = img / 2 + 0.5  # unnormalize
#    npimg = img.numpy()
#    plt.imshow(np.transpose(npimg, (1, 2, 0)))
#    plt.show()
#
# print(&#39; &#39;.join(&#39;%5s&#39; % cla_dict[test_label[j].item()] for j in range(4)))
# imshow(utils.make_grid(test_image))

net = AlexNet(num_classes=5, init_weights=True)

net.to(device)
loss_function = nn.CrossEntropyLoss()
# pata = list(net.parameters())
optimizer = optim.Adam(net.parameters(), lr=0.0002)

epochs = 10
save_path = &#39;./AlexNet.pth&#39;
best_acc = 0.0
train_steps = len(train_loader)
for epoch in range(epochs):
      # train
      net.train()
      running_loss = 0.0
      train_bar = tqdm(train_loader, file=sys.stdout)
      for step, data in enumerate(train_bar):
         images, labels = data
         optimizer.zero_grad()
         outputs = net(images.to(device))
         loss = loss_function(outputs, labels.to(device))
         loss.backward()
         optimizer.step()

         # print statistics
         running_loss += loss.item()

         train_bar.desc = &#34;train epoch[{}/{}] loss:{:.3f}&#34;.format(epoch + 1,
                                                                  epochs,
                                                                  loss)

      # validate
      net.eval()
      acc = 0.0  # accumulate accurate number / epoch
      with torch.no_grad():
         val_bar = tqdm(validate_loader, file=sys.stdout)
         for val_data in val_bar:
            val_images, val_labels = val_data
            outputs = net(val_images.to(device))
            predict_y = torch.max(outputs, dim=1)[1]
            acc += torch.eq(predict_y, val_labels.to(device)).sum().item()

      val_accurate = acc / val_num
      print(&#39;[epoch %d] train_loss: %.3f  val_accuracy: %.3f&#39; %
            (epoch + 1, running_loss / train_steps, val_accurate))

      if val_accurate > best_acc:
         best_acc = val_accurate
         torch.save(net.state_dict(), save_path)

print(&#39;Finished Training&#39;)

if __name__ == &#39;__main__&#39;:
main()

		自动登录	找回密码
密码			立即注册

00003、pytorch实现AlexNet代码

浏览过的版块