基因組數(shù)據(jù)共享將生物醫(yī)學(xué)研究推向快車道,但向公共領(lǐng)域發(fā)布的現(xiàn)有數(shù)據(jù)指南一方面承認(rèn)免費(fèi)和無條件使用數(shù)據(jù)的重要性,另一方面還未能解決這種重要性與數(shù)據(jù)生產(chǎn)者首次發(fā)布數(shù)據(jù)的“權(quán)利”之間的關(guān)系。
在美國能源部聯(lián)合基因組研究所負(fù)責(zé)人Nikos Kyrpides看來,這種自相矛盾導(dǎo)致了數(shù)據(jù)生產(chǎn)者和數(shù)據(jù)使用者對公共數(shù)據(jù)的使用有著不同的解釋和持續(xù)的爭論。
“根源在于缺乏數(shù)據(jù)使用的明確指導(dǎo)原則。”在接受《中國科學(xué)報》采訪時,Kyrpides再次強(qiáng)調(diào),公共數(shù)據(jù)應(yīng)該被視為開放資源,不受限制地被用于分析、解釋和發(fā)布。相關(guān)論文近日在線發(fā)表于《科學(xué)》。
時不時遇到“軟障礙”
公共基因組數(shù)據(jù)使用自由是國際生命科學(xué)研究領(lǐng)域的傳統(tǒng)與共識,自人類基因組計劃實施以來,大量的開放共享基因組數(shù)據(jù)信息極大地促進(jìn)了生物醫(yī)學(xué)研究的進(jìn)步。
1990年啟動并有我國參與的人類基因組計劃被看成科學(xué)史上的偉大工程,3年前,該計劃負(fù)責(zé)人Eric Green、James Watson和Francis Collins在《自然》上撰文總結(jié)了人類基因組計劃的6點經(jīng)驗,其中之一是數(shù)據(jù)共享化。
正是人類基因組計劃改變了生物醫(yī)學(xué)研究的數(shù)據(jù)共享原則,促成了1996年百慕大原則,即同意將超過一定規(guī)模的基因組測序數(shù)據(jù)在產(chǎn)生后的24小時內(nèi)提交到公共數(shù)據(jù)庫。
一直以來,促進(jìn)數(shù)據(jù)共享仍在繼續(xù)并有新的變化。2003年勞德代爾堡協(xié)定重申和擴(kuò)大了百慕大原則,認(rèn)為大規(guī)?;蚪M序列數(shù)據(jù)的預(yù)發(fā)布對科學(xué)界有巨大的益處,同時指出數(shù)據(jù)共享限定在團(tuán)體資源項目。
自該協(xié)定簽署以來,實現(xiàn)更廣泛、更快速、更有效的數(shù)據(jù)共享成為學(xué)界反復(fù)討論的主題。
在數(shù)據(jù)共享大背景下,學(xué)術(shù)論文在發(fā)表時,一般都會公開并共享相關(guān)的基因組數(shù)據(jù)。“但是政府資助的各類科研項目產(chǎn)出的基因組數(shù)據(jù),數(shù)量更為廣泛,在論文發(fā)表前共享程度極低。”中國科學(xué)院—馬普學(xué)會計算生物學(xué)伙伴研究所研究員張國慶告訴《中國科學(xué)報》。
張國慶使用國際基因組數(shù)據(jù)時曾被要求填寫申請,“但由于審核機(jī)制不透明,導(dǎo)致時不時地遇到‘軟障礙’”。
“數(shù)據(jù)共享政策并不是一成不變的,許多資助機(jī)構(gòu)已經(jīng)對政策進(jìn)行了微調(diào)。”Kyrpides介紹,比如2014年美國國立衛(wèi)生研究院制定的基因組數(shù)據(jù)共享政策,正在創(chuàng)造一個更完善的數(shù)據(jù)共享生態(tài)系統(tǒng),“這是以前協(xié)定所沒有的”。
“這不是自相矛盾嗎”
事態(tài)的發(fā)展“證明勞德代爾堡協(xié)定已過時,需要對其修訂以反映科技現(xiàn)狀”,Kyrpides認(rèn)為,協(xié)定通常局限于良好的團(tuán)隊資源項目,但不包括所有測序項目。
在接受《中國科學(xué)報》采訪時,Kyrpides還指出勞德代爾堡協(xié)定的矛盾之處。根據(jù)協(xié)定,向公共領(lǐng)域發(fā)布的數(shù)據(jù)是任何人都應(yīng)該且能夠不受任何限制地使用的,并且規(guī)定這些數(shù)據(jù)要在出版之前發(fā)布,以便讓整個團(tuán)體從中受益。
這些年,基因測序產(chǎn)生了無數(shù)的數(shù)據(jù)集,其中許多數(shù)據(jù)集在沒有出版的情況下公開發(fā)布。但協(xié)定同時又提到,“想要使用未公布的公共數(shù)據(jù)的人應(yīng)首先得到數(shù)據(jù)生產(chǎn)者的許可”,Kyrpides表示,“這不是自相矛盾嗎”。
研究人員也提到了贊成限制公共基因組數(shù)據(jù)使用的人通常有兩個理由,一是未驗證的預(yù)發(fā)布數(shù)據(jù)可能包含錯誤,二是生成新的數(shù)據(jù)往往需要耗費(fèi)很長時間。
在張國慶看來,數(shù)據(jù)使用受限主要原因是數(shù)據(jù)的相關(guān)權(quán)益不清晰,難以保證樣品提供、數(shù)據(jù)產(chǎn)出、數(shù)據(jù)管理、數(shù)據(jù)分析等各方的利益。
此外,基因組數(shù)據(jù)相關(guān)的個人信息的安全管理要求不清晰也是一方面原因,比如敏感數(shù)據(jù)。
“我們承認(rèn),對于現(xiàn)有的敏感人類基因數(shù)據(jù),一些限制可能是適當(dāng)?shù)摹?rdquo;Kyrpides也表示。
不過,研究人員發(fā)現(xiàn)對分享敏感數(shù)據(jù)的抵制正逐漸得到緩解??v觀整個生物醫(yī)學(xué)文獻(xiàn),2015年至2017年,約有1/5已發(fā)表的文章共享原始數(shù)據(jù),較前幾年大幅度增加。
確定使用原則
“不受限制地使用公共數(shù)據(jù)應(yīng)該與學(xué)術(shù)界的獎勵制度保持一致。”Kyrpides認(rèn)為,資助機(jī)構(gòu)需要認(rèn)識到數(shù)據(jù)共享的意義,并向生成數(shù)據(jù)的科學(xué)家授予適當(dāng)?shù)臉s譽(yù)。
同樣重要的是,“要確定有效的方法,為描述數(shù)據(jù)生成后,協(xié)議以及特定數(shù)據(jù)集的生成提供支持”。Kyrpides告訴記者,更要重新審視資助機(jī)構(gòu)和期刊出版商的數(shù)據(jù)發(fā)布策略。
研究人員認(rèn)為,期刊出版商需要重新考慮出版政策,即在手稿提交出版時數(shù)據(jù)的可用性。Kyrpides等人建議,序列數(shù)據(jù)及其相關(guān)的元數(shù)據(jù)需要在手稿提交同行評審時與詳細(xì)協(xié)議一起免費(fèi)提供,而不是在發(fā)表后。
“要推進(jìn)基因組學(xué)領(lǐng)域的發(fā)展,就需要制定強(qiáng)有力的政策,促進(jìn)開放和不受限制的數(shù)據(jù)共享,促進(jìn)包容性的團(tuán)體驅(qū)動的研究和培訓(xùn)。”Kyrpides說。
點擊下圖,預(yù)登記觀展
合作咨詢
肖女士
021-33392297
Kelly.Xiao@imsinoexpo.com