今天是“國際盲人節”,自1984年設立至今,包括我國在內的世界各國都會為盲人群體舉辦各種活動,以體現對他們的關懷。今年的盲人日前夕,百度推出的DuLight(百度小明)展示了用科技改變盲人生活的創想:在一片黑暗中,只有靠觸摸才能感知世界的日子或將過去,“一個24歲面帶微笑的女性”“一把漂亮的紅色椅子”“100%純果汁”……借助這雙科技的眼睛,生活中的物品、場景從圖像轉變為語音,幫助盲人朋友越來越清晰地“看見”這個世界。
>>背景 將盲人生活需求轉化為推動力
早在2007年,百度公司便推出百度盲道:一個為方便視障人士上網閱讀資訊、參與社區互動、聽歌、訪問網際網路上其他相關網站的特殊入口。在這項功能中,百度新聞搜索、百度網頁搜索、百度MP3搜索、百度貼吧、百度知道、百度百科、Hao123網址導航這7項主要搜索服務升級為盲道版,在頁面設計等方面充分考慮視障人士的需求,方便他們使用。
2013年,盲人開發團隊的負責人曹軍致信百度CEO李彥宏,希望得到百度的資金和技術支援,開發一款盲人讀屏軟體。在百度團隊的幫助下,曹軍的公司成功研發出了幫助盲人使用手機的讀屏軟體。
在和盲人的接觸中,百度公益的工作人員發現了譬如人民幣不容易通過盲文識別、不能分辨包裝大小相似的藥盒等更多的制約盲人日常生活的問題,希望通過科技和人工智慧得以解決。因此百度公益聯合百度研究院、IDL深度學習實驗室,將這些盲人實實在在的生活需求轉化為推動力,試圖通過圖像識別、大數據等技術,打造出一款專門服務於盲人的硬體。
努力沒有白費,今年9月8日,百度推出了DuLight,展示了百度用科技改變盲人生活的創想。技術的進步為DuLight的誕生提供了基礎,除了原有的獨立手機端應用,DuLight加入了輕量級的新型硬體,成功完成向全系列盲人個人助理作業系統的轉變。至此,它將作為盲人新的生活助理和新的搜索服務的發起入口。
>>功能 打造盲人的日常生活私人助理
依託“百度大腦”的圖像識別、人臉識別、語音識別以及深度學習等相關核心技術,DuLight被打造成盲人的日常生活私人助理,幫助盲人朋友了解身邊的環境、進行物品識別、人物辨別,以及錢幣識別等。除此之外,它還可以協助盲人在緊急或特殊情況下發起實時的遠端視頻協助。
面對純牛奶和果汁等無法通過觸摸辨別的商品,通過DuLight的圖像識別功能,只需對準物品、進行拍照操作,DuLight便能夠準確快速地將物品資訊傳遞給盲人;紙幣大小差別不大,盲文又不夠清晰,弄不清手裏到底是多少錢,通過圖像識別功能,即使只掃到錢幣的一角,DuLight也能準確地報出錢幣的面值,幫助盲人朋友購物付款;老朋友已經走到面前卻不知道是誰,很難通過聲音辨別對面的陌生人的大致年齡和身份,這些困擾在DuLight的幫助下都可以順利解決。
而在一些複雜的場景中,例如獨自在家時需要找到特定的藥品或需要在路況複雜的地段過馬路時,盲人朋友總是無所適從,而今,通過DuLight,可以一鍵發起遠端視頻協助,尋求朋友的幫助,提供幫助者在接受求助後,將獲得盲人朋友同樣的視角,實時語音協助解決問題。
除此之外,在産品設計上,通用型界面設計與界面輔助工具相互配合,便於視弱群體更好地辨識螢幕上的文字與圖像。DuLight還實現了盲人友好性語音的交互命令與對話,根據用戶需求和語言命令執行對應的功能,為用戶提供可調節的語音播報速度,人性化十足。觸摸式硬體功能識別的工業設計也使得硬體外觀的紋理設計更加合理,便於盲人通過觸摸調整取景角度。
據百度企業社會責任經理盧健介紹稱,DuLight目前仍處於初期研發階段,後期將通過不斷的迭代加入更多先進的技術和功能,以便更好地為盲人群體服務。
>>揭秘
1.圖像識別
圖像識別技術是指,通過電腦辨識圖像內容並提取語義資訊的過程,典型的任務包括物體識別、物體檢測、圖像分類標注等。它在圖像類數據的智慧化分析管理中扮演著至關重要的角色。
百度通過長期的努力,已經構築了一套比較完整的圖像識別系統,除了能夠有效地處理特定物體的檢測識別(如人臉、文字或是商品),還實現了圖像的分類標注、圖文綜合理解的對話型識別,以及主觀圖像品質評估等應用。
2.人臉識別
人與人之間大量的互動讓人臉識別成了最為實用的圖像識別細分領域。相比于無領域限制的圖像識別,聚焦在人臉上的識別技術顯然能夠做到更加精準與高效。
百度現有的人臉識別技術已經具備了很強的識別用戶的能力,這項技術可以對用戶的性別、年齡、面部表情等特徵進行辨識,還可以區分不同的用戶。
3.語音識別
Dulight採用領先的DNN聲學模型,使得語音識別更加精準。基於大量語言模型建立起來的語音識別系統,能夠實現更好的人機互動。海量文本語料做基礎,同時對文本庫進行實時更新,提升語音識別的效率和品質。 (于文)
[責任編輯: 李振]