Facebook chuẩn bị ra mắt một hệ thống đặc biệt, có khả năng “đọc” các bức ảnh và kể lại các nội dung đó cho những người khiếm thị.
Nếu trước đây phần lớn các nội dung trên Internet được thể hiện bằng văn bản, thì ngày nay, mạng thông tin toàn cầu đang chứng kiến sự chiếm lĩnh của các bức ảnh. Theo ước tính, mỗi ngày có khoảng 1,8 tỷ bức ảnh được đăng tải lên các mạng xã hội như Twitter, Instagram và Facebook.
Đây quả là một tin vui cho những ai đam mê nhiếp ảnh, nhưng lại là một tin buồn đối với những người bị khiếm thị hoặc có khả năng nhìn kém. Mặc dù ngày càng có nhiều phương tiện trợ giúp nhưng việc biết được nội dung ảnh trên Internet vẫn là một giấc mơ xa vời đối với những người kém may mắn này.
Tuy nhiên, một ứng dụng mới từ Facebook vừa được ra mắt hôm Thứ Ba vừa rồi đã cố gắng để cải thiện điều đó. Thông thường, người khiếm thị sử dụng một phần mềm định hướng, được gọi là screenreaders, có khả năng chuyển các nội dung trên màn hình máy tính thành lời nói hoặc ký tự braille (hệ thống ký tự dành riêng cho người kiếm thị.) Cho đến nay, điểm trừ lớn nhất của screenreader là chỉ hiểu chữ viết mà không thể “đọc” được tranh ảnh.
Sử dụng công nghệ AI (trí thông minh nhân tạo), các máy chủ của Facebook giờ đây có thể giải mã và miêu tả các hình ảnh được đăng tải trên Internet, sau đó chuyển hóa chúng thành dạng thức quen thuộc để cácscreenreader có thể hiểu và nói lại được.
"Bức ảnh này có thể bao gồm: pizza, thức ăn" - giờ đây người khiếm thị
có thể "xem" được nội dung của các bức ảnh trên Internet (ảnh: bbc)
Facebook cho biết ứng dụng mới này hiện đã có thể nhận dạng được khoảng 80 đồ vật và hành động quen thuộc. Nó sẽ thêm vào những dòng miêu tả (hay còn gọi là alt text) cho mỗi bức ảnh. Càng quét nhiều ảnh, khả năng nhận dạng của phần mềm sẽ càng được nâng cao.
Công nghệ mới của Facebook có thể nhận ra một số đồ vật như:
Giao thông: ô tô, tàu hỏa, máy bay, xe máy, tàu thủy…
Môi trường: núi, cây, tuyết, bầu trời, đại dương, nước, biển…
Thực phẩm: kem, sushi, pizza, cà phê…
Con người: râu quai nón, kính râm, nụ cười, giày… và cả “ảnh tự sướng”.
Người đứng sau ứng dụng đầy tiềm năng này là Matt King, một kỹ sư của Facebook, hiện đã bị mất thị lực do viêm võng mạc. Công nghệ King và các đồng nghiệp của mình đang phát triển sử dụng một phần mềm khác của Facebook, cho phép nhận dạng đồ vật để giải mã nội dung của ảnh chụp. “Công nghệ thông minh nhân tạocủa chúng tôi đã phát triển đến mức nó có thể miêu tả các bức ảnh theo một cách có nghĩa,” King cho biết. “Hiện công nghệ này mới đang ở giai đoạn rất sơ khai, nhưng nó cho phép chúng tôi có thể tiếp tục tiến tới mục tiêu là giúp tất cả mọi người đều có thể tham gia các cuộc hội thoại trên Internet).
Matt King (ngoài cùng, bên trái) và các đồng nghiệp sử dụng công nghệ
Trí thông minh nhân tạo để phát triển hệ thống này (ảnh: BBC)
Hiện tại, hệ thống của Facebook mới chỉ dừng lại ở những miêu tả đơn giản như: “Có hai người đang ở trong bức ảnh này và họ đang cười.”
King và Facebook muốn đưa hệ thống này tiến thêm một bước nữa với việc sử dụng khả năng nhận dạng khuôn mặt để “đọc” được tên những người có mặt trong bức ảnh dựa vào kho dữ liệu người dùng Facebook. Tuy nhiên, ý tưởng này đang phải đối mặt với những băn khoăn liên quan đến vấn đề xâm phạm riêng tư của khách hàng.
Theo Jeff Wieland - trưởng ban Trợ giúp người khuyết tật của Facebook, mạng xã hội này đang tiến hành đầu tư vào những chiến lược giúp tăng cường khả năng tiếp cận của các cộng đồng khác nhau đến những nội dung của Facebook. “Chúng tôi có một đội ngũ tài năng chuyên tìm những biện pháp để kết nối Facebook với các cộng đồng và giữa các cộng đồng với nhau. Đó chính là cơ hội để chúng tôi tạo ra sự công bằng trên thế giới này,” Wieland nói.
Nguồn: BBC