抖音集團舉辦“AI助力視障群體”技術(shù)公益比賽,相關(guān)成果將孵化落地[無障礙改造]?
1月16日消息,1月13日下午,北京大鐘寺的一個報告廳里,由抖音集團產(chǎn)品經(jīng)理、研發(fā)工程師以及清華大學(xué)、浙江大學(xué)等高校學(xué)生組成的12支隊伍正在進行決賽。5個多月前,64支隊伍,501名參賽選手開啟了這場“AI助力視障群體”為主題的技術(shù)公益大賽。
靈瞳產(chǎn)品演示圖
經(jīng)過三個多小時的角逐,3號參賽隊伍“靈瞳”團隊以最高分獲得一等獎,他們設(shè)計了一款“對話式視覺助手”。這是一款應(yīng)用于手機和智能眼鏡的APP,初始界面類似相機。它可以聽取和理解用戶發(fā)起的提問,同時點擊按鈕錄制物品信息,它會根據(jù)問題提取有效信息并語音回答。
“靈瞳”在交互和視覺技術(shù)上的表現(xiàn)得到了評委和觀眾的一致青睞。交互上,除了連續(xù)探索模式,它還可以實現(xiàn)指尖探索,即用手觸摸屏幕來告訴用戶物品的相對應(yīng)位置。還有一種功能是對話定位,用戶可以先告訴“靈瞳”想要什么樣的物品,比如想要尋找一個紅色的東西,用戶可以拿著攝像頭去尋找,一旦你想要的目標(biāo)出現(xiàn)在屏幕中,“靈瞳”就會提示用戶的位置,在屏幕的左側(cè)還是右側(cè)。“靈瞳”還有一些輔助能力,比如找對襪子,線下買衣服,“靈瞳”都可以幫助你做一些輔助信息和判斷。
“靈瞳”團隊的成員,一名抖音集團的研發(fā)工程師在賽后接受媒體采訪時表示,他最早的觸動來自于身邊人——一位好友去年患上視網(wǎng)膜相關(guān)的疾病,接下來,他的眼睛會慢慢受影響甚至失明。從那之后,他就開始關(guān)注相關(guān)領(lǐng)域的技術(shù)和研發(fā),直至這次參加比賽。
其他11支進入決賽的團隊根據(jù)自身的技術(shù)特點,還提供了關(guān)于視障人群的出行、辦公、購物、美妝、游戲等需求的智能解決方案。抖音公益的相關(guān)負(fù)責(zé)人表示,賽后會支持和協(xié)助有價值的項目進行孵化和落地,期待它們成為視障群體切實可用的產(chǎn)品。
比如“BANG”團隊,他們?yōu)橐曊先后w提供了一款無障礙的創(chuàng)作工具:用AI技術(shù)實現(xiàn)文本轉(zhuǎn)圖、圖像編輯、色塊成圖等功能,支持語音交互方式,幫助視力障礙人群進行便捷創(chuàng)作和表達(dá)。
而“世界和平”團隊則從工作場景出發(fā),希望提供一種面向B端的“工區(qū)無障礙改造”的智能工具,為有視力障礙人群就職的機構(gòu)提供無障礙化改造方案,以給視障群體提供更加舒服的辦公環(huán)境。
相關(guān)數(shù)據(jù)顯示,中國目前有1700多萬視力障礙人士,越來越多的社會力量關(guān)注到了他們,并試圖用技術(shù)和公益的方式來助力他們解決現(xiàn)實的困境。