Tin tức

Facebook mã nguồn mở ứng dụng nhận dạng đối tượng trên ảnh

26 / 08 / 2016

Hôm nay, nhóm nghiên cứu AI của Facebook (FAIR, Facebook AI Research)  đã chính thức công bố và mở mã nguồn ứng dụng nhận dạng đối tượng trên ảnh. 

Câu hỏi đặt ra cho máy tính từ lâu rằng,

Liệu máy tính có thể nhận dạng được một đối tượng khi nhìn vào một bức ảnh như mắt người nhìn vào ảnh hay không?

Cùng với sự phát triển nhanh về lĩnh vực Deep Learning cùng việc các ông lớn công nghệ nghiên cứu và phát triển các hệ thống, thư viện hay framework làm nền tảng đã làm cho việc hỗ trợ xây dựng nền tảng trí tuệ nhân tạo (AI) được đạt hiệu quả cao và chính xác hơn. Ví dụ trong ảnh dưới đây, việc nhận dạng đối tượng trong ảnh được thực hiện qua 3 bước: (a) chia nhóm - (b) nhận dạng - (c) phân mảng.

Hai bước (a) và (b) là sự khởi đầu trong việc nhận dạng để tìm hiểu những thông tin trên hình có giá trị và thu thập để xử lý. Bước (c) cuối cùng là bước quan trọng nhất, là chìa khoá giúp máy tính có thể cho phép ứng dụng vào để đánh giá hình ảnh.

Hai thuật toán được DeepMask và SharpMask được kết hợp với nhau để tìm ra chính xác các đối tượng có trong ảnh, và thuật toán cuối cùng MultiPathNet sẽ phân loại để dánh dấu xem mỗi đối tượng trong ảnh thuộc nhóm nào (người, chó, cừu ...). Bạn có thể xem demo ở đây.

Việc nghiên cứu này của Facebook có ý nghĩa rất lớn trong việc hỗ trợ xử lý thông tin trong tương lai. Liệu trong một tương lai gần chúng ta sẽ thấy chúng xuất hiện đâu đó trên ứng dụng Facebook chúng ta đang dùng? 

Các bạn có thể tham khảo thêm thông tin từ trang blog gốc, Facebook Code - Segmenting and refining images with SharpMask


Quay lại danh sách
CHIA SẺ BÀI VIẾT
KodeMate
Chat với chúng tôi Chat với chúng tôi - kodemate.com