- Bài 1: Giới thiệu
- Bài 2: Cài đặt
- Bài 3: Nền tảng toán học của Neural Networks
- Bài 4: Mạng nơron cơ bản
- Bài 5: Tổng quan về machine learning và deep learning
- Bài 6: Triển khai mạng thần kinh đầu tiên
- Bài 7: Functional Blocks và Terminologies
- Bài 8: Loading Data
- Bài 9: Linear Regression ( Hồi quy tuyến tính )
- Bài 10: Convolutional Neural Network ( CNN )
- Bài 11: Recurrent Neural Network ( RNN )
- Bài 12: Tập dữ liệu ( Dataset )
- Bài 13: Giới thiệu về Convents
- Bài 14: Huấn luyện Convent bằng Scratch
- Bài 15: Feature Extraction trong Convents ( Trích xuất đặc trưng )
- Bài 16: Visualization Convents
- Bài 17: Sequence Processing với Convents
- Bài 18: Word Embedding
- Bài 19: Recursive Neural Networks
Bài 12: Tập dữ liệu ( Dataset ) - Pytorch Cơ bản
Đăng bởi: Admin | Lượt xem: 1953 | Chuyên mục: AI
Trong bài này, ta sẽ tập trung nhiều hơn vào torchvision.datasets và các loại khác nhau . PyTorch bao gồm các bộ tải tập dữ liệu sau:
- MNIST
- COCO (Captioning and Detection)
Tập dữ liệu bao gồm phần lớn hai loại hàm như sau :
- Transform − hàm nhận vào một hình ảnh và trả về một phiên bản đã sửa đổi của nội dung tiêu chuẩn. Chúng có thể được tạo cùng với các phép biến đổi.
- Target_transform − hàm lấy mục tiêu và biến đổi nó. Ví dụ: lấy chuỗi phụ đề và trả về hàng chục chỉ số thế giới.
MNIST :
Tạo tập dữ liệu MNIST mẫu :
dset.MNIST(root, train = TRUE, transform = NONE,
target_transform = None, download = FALSE)
Trong đó :
- root − thư mục gốc của tập dữ liệu nơi dữ liệu đã xử lý tồn tại.
- train − True = Tập huấn luyện, False = Tập kiểm tra
- download − True = tải xuống tập dữ liệu từ internet và đặt nó vào thư mục gốc.
COCO :
Yêu cầu API COCO phải được cài đặt. Ví dụ sau được sử dụng để chứng minh việc triển khai COCO của tập dữ liệu bằng PyTorch:
import torchvision.dataset as dset
import torchvision.transforms as transforms
cap = dset.CocoCaptions(root = ‘ dir where images are’,
annFile = ’json annotation file’,
transform = transforms.ToTensor())
print(‘Number of samples: ‘, len(cap))
print(target)
Kết quả như sau :
Number of samples: 82783
Image Size: (3L, 427L, 640L)
Theo dõi VnCoder trên Facebook, để cập nhật những bài viết, tin tức và khoá học mới nhất!
- Bài 1: Giới thiệu
- Bài 2: Cài đặt
- Bài 3: Nền tảng toán học của Neural Networks
- Bài 4: Mạng nơron cơ bản
- Bài 5: Tổng quan về machine learning và deep learning
- Bài 6: Triển khai mạng thần kinh đầu tiên
- Bài 7: Functional Blocks và Terminologies
- Bài 8: Loading Data
- Bài 9: Linear Regression ( Hồi quy tuyến tính )
- Bài 10: Convolutional Neural Network ( CNN )
- Bài 11: Recurrent Neural Network ( RNN )
- Bài 12: Tập dữ liệu ( Dataset )
- Bài 13: Giới thiệu về Convents
- Bài 14: Huấn luyện Convent bằng Scratch
- Bài 15: Feature Extraction trong Convents ( Trích xuất đặc trưng )
- Bài 16: Visualization Convents
- Bài 17: Sequence Processing với Convents
- Bài 18: Word Embedding
- Bài 19: Recursive Neural Networks