ad9_210*60
關鍵詞:
台灣網  >  經貿  >   商業

專家預言機器人20年內競逐普利策獎:對手?幫手?

2016年09月23日 10:26:01  來源:科技日報
字號:    

  寫稿機器人: 我們的對手還是幫手?

  表述明確,文筆犀淩!未來的某天,一早翻看新聞的你,不禁讚嘆起某位記者的高水準。不過你心裏也清楚,即便當面聽到,這位從不吃飯、睡覺的“作者”也不會説聲謝謝。因為“他”,是機器人。

  預言完畢,讓我們回到今天。奧運會雖然結束了,但寫稿機器人在新聞界所引發的震動,乃至恐懼,依然餘音未消。有人預言,在不遠的未來,寫稿機器人將徹底取代人力記者。

  那麼,所有的媒體同行,以及看熱鬧的圍觀群眾,寫稿機器人到底是我們的對手還是幫手呢?

  機器記者能拿普利策獎

  人工智慧註定將滲透到各個行業,媒體業亦不能“倖免”。

  奧運會期間,寫稿機器人“張小明”通過直接對接奧組委的數據庫資訊,實時撰寫新聞稿件,以電視直播的速度發佈稿件,主要報道了乒乓球、網球、羽毛球和女足的比賽,在16天的時間內共發佈456篇奧運簡訊和資訊,平均每條新聞生成到發佈時間不到2秒鐘,為103萬讀者提供了第一時間的賽事報道,單篇最高閱讀量超過11萬。

  隨著自然語言處理、大數據計算等人工智慧技術的發展,國內外許多媒體已經開始了機器人報道的探索與實踐。以寫稿機器人為代表的人工智慧可讓大數據從負擔變成便利,重塑媒體的內容生産和分散發佈。

  美國《紐約時報》在財報季、運動比賽報道中用機器人寫稿已成慣例,其數字部門開發的機器人編輯Blossomblot每天推送300篇文章,受推薦文章的平均閱讀量是未推薦文章的38倍;美聯社在過去一年多時間裏均使用Wordsmith系統編發企業財報;國際文傳電訊社計劃用雅虎的機器人演算法來發佈美式橄欖球回顧式報道;成立於2007年的Automated Insights是一家有美聯社融資背景的科技公司,2015年寫了150億篇文章,宣稱自己是世界上最大的內容生産者;路透社也在嘗試發表機器撰寫的文章,其負責人稱在一次盲測中,機器的作品表現得比人類作品更具可讀性……有專家預言,機器人將在20年內競逐普利策獎。

  寫稿機器人在國內的發展也十分迅速。2015年9月,騰訊財經一篇名為《8月CPI漲2%創12個月新高》的文章刷爆各大媒體頭條,其作者就是騰訊開發的自動化新聞寫作機器人“Dreamwriter”。今年5月29日,四川綿陽發生地震,一條題為《綿陽安州發生4.3級地震》的新聞開始流傳于網路,寫下這篇560字的新聞稿件並第一時間發佈在網路上的正是國家地震臺網研發的智慧機器人,且全程僅花了6秒鐘,可以説幾乎跑贏了地震波的速度。

  人工智慧發展的必然結果

  媒體領域遭遇機器人入侵,原因就在於自然識別和資訊數據庫技術已經達到了相當成熟度,且這種成熟度是和新聞媒體的要求很好地匹配了起來。

  寫稿機器人的背後是一個高度結構化的海量資訊網,無論是文案、資訊圖表或其他表達形式,機器人編輯都可以像音樂家擺弄音符一樣去重構組裝。無論是天氣預報還是地震預警再到賽事報道等各種資訊,都最終能夠放入到機器人數據庫中去,這樣的系統潛力巨大,可以構建無限可能。

  北大電腦研究院教授萬小軍告訴記者,寫稿機器人實際上是一種數字技術和智慧寫稿編程系統。它用機器代替人完成實時監控資訊源,利用文本解析和資訊抽取技術實現自動資訊抽取,採用機器學習演算法並融合編輯記者團隊的經驗和智慧,以模板和規則知識庫的方式,根據實時抽取的資訊作出判斷,輸出相應的模板及規則知識庫內容,從而産生新聞,以此應對海量、高速、多樣的大數據産生的資訊。

  和傳統媒體人相比,寫稿機器人可以瞬間完成海量閱讀、海量分析,尤其是針對上市公司的公告、財務報表、官方發佈、社交平臺、證券行情等資訊源。與此同時,又可以根據網際網路活躍點擊量數據,暫態篩選出下一個熱點新聞,並通過後臺的演算法快速合成新聞。整體上看來,寫稿機器人在速度和數量上有著不可忽視的絕對優勢。

  依靠海量的大數據平臺和不斷演進的演算法設計,生成一篇深度報道的時間已經由最初的30秒縮短到2秒以內,其精度和準確率還在不斷提升,而且擬人化、情感化的技能也在持續加強。

  “張小明”團隊的技術總監李磊説,近兩年的國際自然語言大會(ACL)給人感受最深的是,在自然語言處理和理解方面,機器深度學習的進步非常之大,2016年幾乎超過2/3的論文在研究深度學習領域。雖然深度學習和自然語言處理在文本方面還沒有達到語音和圖像處理技術一樣的成熟度,但現在也已有了很大進步。事實上,國外已經出現了新一代智慧寫作軟體“Narrative”。

  “活人”記者依然是師傅

  當然,純技術角度做新聞編輯報道還是存在一定局限性。萬年進化而成的人腦,絕非幾十歲的機器人能輕易代替。

  美國密蘇裏大學教授唐納德·裏諾茲曾表示,大多數自然語言系統都在簡單描述一個事件,但大多數新聞都是描繪性的,甚至是事件驅動型的。人工智慧系統在進行新聞創作時需要解決海量技術難題,包括自然語言處理中的自動摘要、文本分類等,還有知識庫和知識發現(KDD)等相關技術,比如實體定義、關係抽取、問答系統等。簡單來説,就是機器首先需要理解自然語言,然後通過知識管理弄明白新聞中各個要素之間的關係。

  有問題,就有答案。谷歌開源了SyntaxNet,將神經網路和搜索技術結合起來,在解決歧義問題上取得顯著進展,該軟體能像訓練有素的語言學家一樣分析簡單句法;Facebook推出了文本理解引擎DeepText,每秒能理解幾千篇博文內容,語言種類多達20多種,準確度接近人類水準。

  今年6月,人工智慧創業公司Maluuba公司發表了一篇關於機器理解的論文,提出了目前最先進的機器閱讀理解系統EpiReader,該模型在CNN和童書測試(CBT)兩個數據集上的成績都超過了谷歌DeepMind、Facebook和IBM。EpiReader採取兩個步驟來確定問題答案。第一步(Extractor),使用了一個雙向GPU逐字閱讀故事和問題,接著採用一種類似Pointer Network中的Attention機制在故事中挑選出可能作為答案備選的單詞。第二步(Reasoner),這些備選答案被插入(完型填空)式的問題中,構成一些“假設”,接著卷積神經網路會將每個假設與故事中的每個句子加以比較,尋找文本蘊涵(Textual Entailment)關係。簡單來説,蘊涵是指,兩個陳述具有很強的相關性。因此,最近似故事假設的蘊涵得分最高。最後,將蘊涵得分與第一步得到的分數相結合,給出每一個備選答案正確的概率。

  萬小軍教授説,記者聯繫採訪對象,觀察對方,用心去感受人物,再對大量資料進行整理,做出取捨,對這些複雜細緻的情感工作,目前人工智慧機器人用深度學習的演算法尚不能搞定。由於目前的技術制約,寫稿機器人還無法開展自行思考,智慧寫稿系統在稿件的深度以及稿件個性化上很難在短時間內取得突破。從這個意義上講,寫稿機器人為傳統記者節省了大量查閱資料的檢索時間,有助於人力記者寫出更有深度和富含情感的新聞作品。新聞的字裏行間包含著記者的判斷、價值觀與人文關懷,未來新聞人應該把精力重點放在機器人無法完成的調查性、深度解釋性報道上,這樣雙方才可以真正實現互相補充、相得益彰。

  李磊説,新聞機器人並不會取代記者,相反會成為記者的好幫手。機器人寫稿將大大提高記者産出新聞的數量和速度,節省媒體的時間成本和運營成本,提升媒體運營的成本收益率。用戶的閱讀興趣呈長尾分佈,單篇閱讀量高的新聞可以由人力記者來寫,但是更大量的單篇閱讀量稍低的新聞同樣很有價值,由人來寫則收益率並不高,而請機器人來寫既能彌補這部分閱讀需求,又能降低新聞采編的成本,可謂一舉多得。

  ——記者觀察——

  有了“他”們會更好

  撰寫這篇稿件時,我始終無法不去想這樣一個問題:寫稿機器人來了,自己會不會失業呢?

  當然,目前還不至於。對於媒體,內容是王道,沒有深度的媒體人可能會被寫稿機器人淘汰,而能做出好內容的深度報道記者則不會。

  人工智慧要想達到替代人類的水準,需要好幾個階段的演化。第一階段首先是在各個垂直領域誕生若干超級智慧,比如健康和知識問答領域的“沃森”、圍棋領域的“AlphaGo”等。這些垂直超級智慧可以在特定領域內展現出遠超人類的能力,但是在擅長領域之外沒有任何作為。不過,他們將為誕生在所有領域內具備超人能力的終極智慧打下初步基礎。

  知識改變命運,技術改變世界。相信在以寫稿機器人為代表的人工智慧技術引領下,全球終將步入一個全新的資訊技術時代。憑藉不斷進步的技術的力量和更多的試驗、更早的調整及更好的準備,人類將會建設出一個更加智慧化的美好世界。

  文·本報記者 李 釗

[責任編輯:李帥]

特別推薦
點擊排名
聚焦策劃