
ISSN:
Website: www.jomc.vn
Mô hình học sâu phát hiện và nhận diện mã container áp dụng trong vận hành cảng thông minh
Tóm tắt
Thị giác máy tính, một lĩnh vực quan trọng trong trí tuệ nhân tạo, đang ngày càng phát triển mạnh mẽ và được ứng dụng rộng rãi trong nhiều ngành công nghiệp. Dựa trên kiến trúc mạng nơ-ron tích chập (CNN), nhiều mô hình tiên tiến đã được xây dựng để giải quyết các vấn đề như phát hiện đối tượng, phân đoạn hình ảnh, nhận diện ký tự quang học (OCR)... Trong số đó, YOLO nổi bật với khả năng phát hiện đối tượng nhanh và chính xác; và EasyOCR là một công cụ hiệu quả trong nhận dạng ký tự với độ chính xác cao. Nghiên cứu hiện tại tập trung vào việc phát hiện và nhận diện mã thông qua sự kết hợp giữa mô hình YOLOv11 và EasyOCR. Nội dung nghiên cứu bao gồm xây dựng tập dữ liệu, huấn luyện mô hình và đánh giá hiệu suất của mô hình. Kết quả thực nghiệm cho thấy mô hình đề xuất đạt độ chính xác trên 90%, chứng tỏ tính khả thi và tiềm năng ứng dụng trong các hệ thống thực tế trong các cảng thông minh.
Tài liệu tham khảo
- M. Mi and Y. Liu, Smart Ports, 1st ed. Singapore: Springer Nature Singapore, 2022.
- ISO 6346:2022, Freight containers – Coding, identification and marking.
- TCVN 7623:2023, Công-te-nơ vận chuyển – Mã hóa, nhận dạng và ghi nhãn.
- Y. Yoon, K.-D. Ban, H. Yoon, and J. Kim, "Automatic container code recognition from multiple views," ETRI Journal, vol. 38, no. 4, pp. 767–775, 2016.
- Ultralytics, "Ultralytics YOLO11." [Trực tuyến]. Địa chỉ: https://docs.ultralytics.com/models/yolov11/. [Truy cập: 28/04/2025].
- M. Maithani, D. Meher, and S. Gupta, "Multilingual Text Recognition System," in Lecture Notes in Electrical Engineering, vol. 992, Singapore: Springer, 2023, pp. 103–114.
- P. Hidayatullah, N. Syakrani, M. R. Sholahuddin, T. Gelar, and R. Tubagus, "YOLOv8 to YOLO11: A comprehensive architecture in-depth comparative review," arXiv, arXiv:2501.13400v2, 2025.
- R. Kaur and S. Singh, "A comprehensive review of object detection with deep learning," Digital Signal Processing, vol. 132, p. 103812, 2023.
- P. Batra, N. Phalnikar, D. Kurmi, J. Tembhurne, P. Sahare, and T. Diwan, "OCR-MRD: Performance analysis of different Optical Character Recognition engines for medical report digitization," International Journal of Information Technology, vol. 16, pp. 447–455, 2024.