Facebook使用AI改善視障人士的體驗(yàn)

照片是Facebook和其他社交媒體平臺(tái)上最常見(jiàn)的共享內(nèi)容之一。盡管大多數(shù)社交媒體用戶都可以理解圖片并理解圖片的含義，但對(duì)于盲人或視力障礙者而言，這并不是一件容易的事。
Facebook表示，屏幕閱讀器可以使用合成語(yǔ)音來(lái)描述這些圖片的內(nèi)容，從而使盲人或視力障礙的用戶能夠理解Facebookfeed中的圖片。但是，許多照片在發(fā)布時(shí)都沒(méi)有替代文本，導(dǎo)致Facebook在2016年引入了自動(dòng)替代文本（AAT）。
這項(xiàng)技術(shù)使用對(duì)象識(shí)別技術(shù)為盲人或視障用戶按需生成照片描述。自2016年以來(lái)，F(xiàn)acebook一直致力于改善AAT，并于近期推出了下一代技術(shù)。
Facebook在AAT方面的進(jìn)步改善了用戶的照片體驗(yàn)，而AAT可以可靠地檢測(cè)和識(shí)別照片中的概念數(shù)量已擴(kuò)展了十倍以上。這意味著更少的沒(méi)有描述的照片和更詳細(xì)的描述。
AAT可以識(shí)別活動(dòng)，地標(biāo)，動(dòng)物類(lèi)型等。AAT現(xiàn)在將給出以下描述：“它可能是兩個(gè)人的自拍照，在戶外，比薩斜塔”。
Facebook還表示，能夠在照片中包含有關(guān)元素的潛在位置和相對(duì)大小的信息是業(yè)界首創(chuàng)。它并沒(méi)有簡(jiǎn)單地描述“可能是五個(gè)人的合影”。
但是，由于“兩個(gè)人在照片的中央，而其他三個(gè)人分散在邊緣”。 Facebook表示，這項(xiàng)進(jìn)步可以幫助盲人或視障用戶更好地了解家人和朋友發(fā)布的照片??中的內(nèi)容。
最新版本的AAT使用對(duì)數(shù)十億張公共Instagram圖片和標(biāo)簽數(shù)據(jù)進(jìn)行訓(xùn)練的模型。訓(xùn)練后產(chǎn)生的模型在文化和人口統(tǒng)計(jì)方面更準(zhǔn)確，更寬容。
改進(jìn)的AAT可以可靠地識(shí)別1200多個(gè)概念。負(fù)責(zé)編輯AJX