加強文獻數據庫建設 別讓科學研究從源頭被截流
加強文獻數據庫建設 別讓科學研究從源頭被截流
關注生命科學研究四要素②
文獻數據庫已成為從世界看中國、從中國看世界的資訊交流平臺,中國應有更多有分量的論文和有影響力的期刊,同時應建立屬於自己的世界一流的權威文獻數據庫,才能在未來科學技術的競爭中掌握話語權。
天津大學生命科學學院教授
王澤方
近日,中國昆蟲學會、中國實驗動物學會等單位的一項調研發現,我國高等院校在購買數據方面的花費相當可觀。上海地區2019年有4家高校購買資源的經費超過了3000萬元,其中一家達到6000萬元。
我國缺乏完備的文獻數據庫,不僅要支出大量科研經費購買文獻數據,而且科學資訊嚴重依賴國外,也為科學研究帶來更多的不確定性風險。
“如今,文獻數據庫已成為從世界看中國、從中國看世界的資訊交流平臺,中國應有更多有分量的論文和有影響力的期刊,同時應建立屬於自己的世界一流的權威文獻數據庫,才能在未來科學技術的競爭中掌握話語權。”天津大學生命科學學院教授王澤方表示。
常用文獻庫幾乎都隸屬國外出版集團
“幾乎每個學科在開展一項研究前都要先做大量的文獻調研。”王澤方介紹,以生命科學為例,目前在生命科學領域最常用的數據文獻庫比較集中,幾乎都來自國外大型商業化出版集團。其中最大的是荷蘭的愛思唯爾(Elsevier),這個集團出版了2500余種期刊,大名鼎鼎的《柳葉刀》《細胞》等期刊都屬於該集團。此外愛思唯爾還出版3.9萬餘種電子書籍,擁有全世界最大的文摘和引文數據庫斯高帕斯(Scopus)等,每年全球共有35萬篇論文發表在愛思唯爾公司出版的期刊中。
此外施普林格 自然和約翰 威利父子出版公司也是為整個科研界提供頂尖服務的全球性出版集團,前者擁有世界上歷史悠久的、最有名望的科學期刊《自然》,後者出版的期刊涉及化學、化工、生命、電腦工程、數學、物理等,是非常全面的大型出版社。
“除了上述數據文獻來源,科學網(Web of Science)也是獲取全球學術資訊的重要數據庫平臺。”王澤方透露,“衡量期刊學術影響力的影響因子就是由科學網提出的。”
“此外,還有一些獲取文獻數據的補充途徑,包括各專業組織或學會主辦的平臺或期刊。其中最為著名的是由美國國立醫學圖書館提供的一個免費搜索引擎PubMed,它能提供全面的生物醫學方面的論文以及摘要的檢索服務,是目前網際網路上使用最為廣泛的免費搜索引擎。另外,美國科學促進會主辦的著名期刊《科學》(Science)和美國科學院主辦的《美國科學院院報》(PNAS)也是獲取生命科學文獻的重要途徑之一。”王澤方説。
“除了英文數據庫,常用的還有幾個中文文獻數據庫,比如中國知網(CNKI)、萬方數據庫、國家科技圖書文獻中心等。”王澤方介紹,其中國家科技圖書文獻中心是一個虛擬的科技文獻資訊服務機構。
數據文獻庫對科研的意義非常重大
對目前生命科學研究領域大量依賴國外數據文獻庫的現狀,王澤方無奈地表示:“生命科學領域的文獻90%以上都出自這些英文數據庫,大量的重磅科研成果大都發表在《科學》《自然》《細胞》和《柳葉刀》等重要期刊上,因此要想掌握學科內的最新動態,必須要經常查閱這些文獻。”
“這樣的後果會導致科學研究受制於人,從大處説,隨時可能被‘卡脖子’,很多科研將無法開展;從小處説,很多規則都是對方制定,使用起來將處處受限。”王澤方説,“我們花費了大量的經費訂閱數據庫,但是並不能獲得原始數據。同時線上人數也受到限制,超出使用人數,其他人就無法查閱數據,只能等待有人下線後再使用。”
此外,不是所有高校都有充足的科研經費購買所有重要數據庫,這些高校的科研人員和學生的研究工作就會受到影響。有的高校可能會根據自己的優勢學科,購買部分專業的數據庫。其他專業的學生就需要靠文獻傳遞的方式,通過其他高校或者其他途徑獲取文獻,非常不方便。“久而久之就會造成教育資源不均衡,學科發展不平衡。”王澤方擔憂地表示。
“更嚴重的是,數據庫還是一個學術交流的平臺,關乎智慧財産權競爭和學術話語權。”王澤方解釋,由於某些著名期刊影響力大,在此發論文
代表著被學術界認可。因此科研人員會努力在這些期刊上發表科研成果。誰先發表出來,誰就搶佔了這項研究的智慧財産權,這對於科研的意義非常重大。
如今幾大國外大型出版集團壟斷了科技文獻數據庫,他們隨意提價已讓學界與出版商矛盾頻出。2018年底,美國加州大學與愛思唯爾未能就開放獲取出版協議和訂閱價格達成一致。談判破裂後,愛思唯爾切斷了加州大學對其旗下千余種期刊的訪問許可權。直到今年,雙方才重新達成合作。這期間,加州大學35萬餘名師生只能通過求助所在校區的圖書館、在網路上尋找合法的開放獲取副本、或者直接聯繫作者等方法來獲取他們想讀的新論文。
建立大型本土文獻數據庫勢在必行
“國家已經意識到文獻傳播也就是智慧財産權傳播的話語權與主動權的重要性,因此推出了‘中國科技期刊卓越行動計劃’,旨在推動我國科技期刊高品質發展,加快建設世界一流科技期刊。”王澤方介紹,在國家政策的推動下,我國生命科學領域涌現出一批高水準期刊。
其中中國科學院上海生命科學研究院生物化學與細胞生物學研究所與中國細胞生物學學會共同主辦的《細胞研究》(Cell Research),是一本以全英文形式出版、編輯和發行原創性研究論文、學科綜述及快報的國際性學術月刊。
此外還有由高等教育出版社與中國生物物理學學會、中國科學院北京生命科學研究院聯合主辦,由施普林格負責海外發行的《蛋白和細胞》(Protein &Cell)雜誌,是一本創立於2010年的本土期刊,主編由中國科學院院士饒子和擔任。
“雖然目前我國在生命科學領域有了一些自己的高水準期刊雜誌,但是要想做到海外四大數據庫的規模還任重道遠。”王澤方説。
縱觀這些老牌出版集團的發展歷史,愛思唯爾的前身可追溯到16世紀,而現代公司也興起于1880年;施普林格 自然成立於1869年;約翰 威利父子出版公司成立於1807年,都有超過100年的歷史。經過漫長的發展,這幾大出版集團通過合併小的期刊雜誌,不斷發展壯大起來,都變成了超大的文獻數據庫。
“因為歷史悠久,建設完善,這些出版集團邊際效應非常低,維護成本很少,特別是網路化以後。”王澤方認為,與此同時,現在再進入這個行業,壁壘就變得非常高了,因為大量的版權已經掌握在這些出版集團手中,需要花大價錢購買,根本無法形成良性的競爭。
此外建立一個在全球具有影響力的期刊數據庫,還有一個難點就是語言問題。“目前學術期刊的官方語言幾乎都是英語,因此合併起來相對容易。而我們的很多期刊都是中文。”王澤方表示。
“未來通過政策引導和政府扶持,一定會加快中國文獻數據庫的建設。”王澤方建議,可以借鑒國外的商業運作模式,整合更多的社會資源。比如某一領域的數據文獻對某家公司特別有價值,那麼就可以由這家公司負責這一領域的文獻數據庫的建設。這樣就可以集合社會資本,積少成多,最終建立起大型、完備的我國本土的文獻數據庫。