Phân loại ImageNet bằng mạng nơ-ron tích chập sâu,” Hội nghị Hệ thống Xử lý Thông tin Thần kinh (NeurIPS), tập 25, năm 2012.
Bài báo trình bày mô hình mạng nơ-ron tích chập sâu dùng để phân loại ảnh trong bộ dữ liệu ImageNet với hơn 1,2 triệu hình ảnh và 1.000 lớp. Mạng gồm nhiều lớp tích chập và kết nối đầy đủ, sử dụng ReLU, huấn luyện trên GPU và kỹ thuật dropout để giảm quá khớp. Kết quả đạt độ chính xác vượt trội so với các phương pháp trước đó, đánh dấu bước ngoặt quan trọng của học sâu trong lĩnh vực thị giác máy tính.