Team [SDSRV.AI]GoN successfully achieved a Gold medal in the offficial Kaggle competition “HuBMAP – Hacking the Human Vasculature”
<Bản dịch tiếng Việt ở dưới>
The official Kaggle competition is named “HuBMAP – Hacking the Human Vasculature”. The goal of this competition is to segment instances of microvascular structures, including capillaries, arterioles, and venules. Competitors will create a model trained on 2D PAS-stained histology images from healthy human kidney tissue slides. The competition was held from 22nd May 2023 to 31st July 2023 and ended with 6,611 registrations and 1,343 participants. All in all, it had 33,356 submissions from 77 countries. Team [SDSRV.AI]GoN has successfully surpassed many teams from major organizations such as NVIDIA, H2O.ai… to secure the 4th position (top 1%) out of 1,064 teams.
Team [SDSRV.AI]GoN includes 2 members, Dam Trong Tuyen (NLP researcher) and Vo Duc Man (VI researcher). Their solution employs a combination of 4 instance segmentation models comprising CascadeRCNN (ResNeXt, Regnet), MaskRCNN (swint), HybridTaskCascade (Re2Net), and 1 object detection model, Yolov6m. Each model is trained with a dataset consisting of 1549 images (dataset1+dataset2), with 84 images from dataset1 utilized for validation. During the inference process, the Weighted Boxes Fusion (WBF) technique is employed to ensemble RPN boxes and ROI boxes, while the masks generated by the ensemble of models utilize the mean average approach. For post-processing, they filter out small instances and refine instance scores using mask scores. Finally, several techniques in their approach significantly influence the private score, namely using only dataset1 for validation and fine-tuning, employing light augmentation, multi-stage ensemble, utilizing YOLOv6 for higher MAR, refining prediction scores, and, undoubtedly, placing strong trust in the validation score – no dilated.
Link for reference: https://www.kaggle.com/competitions/hubmap-hacking-the-human-vasculature/leaderboard
<Bản dịch tiếng Việt>
Cuộc thi Kaggle lấy tên “HuBMAP – Hacking the Human Vasculature”. Mục tiêu của cuộc thi lần này là phân đoạn các cấu trúc mạch máu nhỏ, bao gồm mao mạch, động mạch và tĩnh mạch. Các đội thi sẽ tạo mô hình huấn luyện trên ảnh mô học nhuộm màu 2D PAS từ mẫu mô thận người khỏe mạnh. Cuộc thi diễn ra từ ngày 22 tháng 5 năm 2023 đến ngày 31 tháng 7 năm 2023 với 6,611 lượt đăng ký và 1,343 người tham gia. Tổng cộng, có 33,356 bài dự thi nộp từ 77 quốc gia. [SDSRV.AI]GoN đã xuất sắc vượt qua rất nhiều đội thi đến từ nhiều tổ chức lớn như NVIDIA, H2O.ai… để giành được vị trí thứ 4 chung cuộc (top 1%) trên tổng sổ 1,064 đội.
[SDSRV.AI]GoN gồm 2 thành viên là Đàm Trọng Tuyên (NLP researcher) và Võ Đức Mẫn (VI researcher). Giải pháp của đội sử dụng sự kết hợp của 4 mô hình phân đoạn theo từng đối tượng (instance segmentation) gồm CascadeRCNN (ResNeXt, Regnet), MaskRCNN (swint), HybridTaskCascade (Re2Net) và 1 mô hình phát hiện vật thể (object detection) là Yolov6m. Mỗi mô hình được huấn luyện trên tập dữ liệu bao gồm 1,549 hình ảnh (dataset1+dataset2), trong đó có 84 hình ảnh từ dataset1 được sử dụng cho việc tối ưu (validation). Trong quá trình suy luận, kỹ thuật Weighted Boxes Fusion (WBF) được sử dụng để kết hợp các bouding box RPN và ROI, trong khi các mask được tạo bởi sự kết hợp của các mô hình sử dụng phương pháp tính trung bình. Đối với quá trình hậu xử lý, nhóm đã loại bỏ các instance có diện tích nhỏ và điều chỉnh score của instance bằng cách sử dụng score dự đoán của mask làm trọng số. Cuối cùng, một số kỹ thuật trong phương pháp của nhóm có ảnh hưởng đáng kể đến điểm số trên tập private, bao gồm việc chỉ sử dụng dataset1 cho việc tối ưu, sử dụng light augmentation, ensemble ở nhiều stage của mô hình, sử dụng YOLOv6 cho MAR (Mean Average Recall) cao hơn, sử dụng score của mask để điều chỉnh score của instance trả về, và cuối cùng tin tưởng mạnh mẽ vào điểm số trên tập tối ưu – không sử dụng dilate cho mask.
Đường dẫn tham khảo: https://www.kaggle.com/competitions/hubmap-hacking-the-human-vasculature/leaderboard