照片是Facebook和其他社交媒體平臺(tái)上最常見的共享內(nèi)容之一。
盡管大多數(shù)社交媒體用戶都可以理解圖片并理解圖片的含義,但對(duì)于盲人或視力障礙者而言,這并不是一件容易的事。
Facebook表示,屏幕閱讀器可以使用合成語音來描述這些圖片的內(nèi)容,從而使盲人或視力障礙的用戶能夠理解Facebookfeed中的圖片。
但是,許多照片在發(fā)布時(shí)都沒有替代文本,導(dǎo)致Facebook在2016年引入了自動(dòng)替代文本(AAT)。
這項(xiàng)技術(shù)使用對(duì)象識(shí)別技術(shù)為盲人或視障用戶按需生成照片描述。
自2016年以來,F(xiàn)acebook一直致力于改善AAT,并于近期推出了下一代技術(shù)。
Facebook在AAT方面的進(jìn)步改善了用戶的照片體驗(yàn),而AAT可以可靠地檢測(cè)和識(shí)別照片中的概念數(shù)量已擴(kuò)展了十倍以上。
這意味著更少的沒有描述的照片和更詳細(xì)的描述。
AAT可以識(shí)別活動(dòng),地標(biāo),動(dòng)物類型等。
AAT現(xiàn)在將給出以下描述:“它可能是兩個(gè)人的自拍照,在戶外,比薩斜塔”。
Facebook還表示,能夠在照片中包含有關(guān)元素的潛在位置和相對(duì)大小的信息是業(yè)界首創(chuàng)。
它并沒有簡單地描述“可能是五個(gè)人的合影”。
但是,由于“兩個(gè)人在照片的中央,而其他三個(gè)人分散在邊緣”。
Facebook表示,這項(xiàng)進(jìn)步可以幫助盲人或視障用戶更好地了解家人和朋友發(fā)布的照片??中的內(nèi)容。
最新版本的AAT使用對(duì)數(shù)十億張公共Instagram圖片和標(biāo)簽數(shù)據(jù)進(jìn)行訓(xùn)練的模型。
訓(xùn)練后產(chǎn)生的模型在文化和人口統(tǒng)計(jì)方面更準(zhǔn)確,更寬容。
改進(jìn)的AAT可以可靠地識(shí)別1200多個(gè)概念。
負(fù)責(zé)編輯AJX