Facebook使用AI改善視障人士的體驗(yàn)

照片是Facebook和其他社交媒體平臺上最常見的共享內(nèi)容之一。

盡管大多數(shù)社交媒體用戶都可以理解圖片并理解圖片的含義，但對于盲人或視力障礙者而言，這并不是一件容易的事。

Facebook表示，屏幕閱讀器可以使用合成語音來描述這些圖片的內(nèi)容，從而使盲人或視力障礙的用戶能夠理解Facebookfeed中的圖片。

但是，許多照片在發(fā)布時都沒有替代文本，導(dǎo)致Facebook在2016年引入了自動替代文本（AAT）。

這項(xiàng)技術(shù)使用對象識別技術(shù)為盲人或視障用戶按需生成照片描述。

自2016年以來，F(xiàn)acebook一直致力于改善AAT，并于近期推出了下一代技術(shù)。

Facebook在AAT方面的進(jìn)步改善了用戶的照片體驗(yàn)，而AAT可以可靠地檢測和識別照片中的概念數(shù)量已擴(kuò)展了十倍以上。

這意味著更少的沒有描述的照片和更詳細(xì)的描述。

AAT可以識別活動，地標(biāo)，動物類型等。

AAT現(xiàn)在將給出以下描述：“它可能是兩個人的自拍照，在戶外，比薩斜塔”。

Facebook還表示，能夠在照片中包含有關(guān)元素的潛在位置和相對大小的信息是業(yè)界首創(chuàng)。

它并沒有簡單地描述“可能是五個人的合影”。

但是，由于“兩個人在照片的中央，而其他三個人分散在邊緣”。

Facebook表示，這項(xiàng)進(jìn)步可以幫助盲人或視障用戶更好地了解家人和朋友發(fā)布的照片??中的內(nèi)容。

最新版本的AAT使用對數(shù)十億張公共Instagram圖片和標(biāo)簽數(shù)據(jù)進(jìn)行訓(xùn)練的模型。

訓(xùn)練后產(chǎn)生的模型在文化和人口統(tǒng)計方面更準(zhǔn)確，更寬容。

改進(jìn)的AAT可以可靠地識別1200多個概念。

負(fù)責(zé)編輯AJX

產(chǎn)品相關(guān)