生物樣本庫是轉(zhuǎn)化醫(yī)學(xué)研究的寶貴資源,隨著"十二五"國家科技計劃的推進,我國的生物樣本庫建設(shè)蓬勃發(fā)展。上海交通大學(xué)附屬新華醫(yī)院王偉業(yè)教授作為國外引進的樣本庫信息化管理專家,主要從事生物樣本庫建設(shè)和信息化管理方面的工作,指導(dǎo)多家醫(yī)院生物樣本庫基本的建設(shè)工作。在2014生物樣本庫與臨床研究論壇上,生物谷特別采訪了王偉業(yè)教授,大家來看看他對中國生物樣本庫建設(shè)以及信息化管理方面的解讀。
樣本庫建設(shè)不能以大和多來衡量
生物谷:生物樣本庫建設(shè)國內(nèi)外的差別主要體現(xiàn)在哪些方面?
王偉業(yè)教授:我想從樣本資源的本身,管理以及信息化和共享三方面來說這個問題。建樣本庫的根本目的是建一個研究資源的平臺,一是資源整合應(yīng)用,二是為不同學(xué)科的研究人員提供合作研究平臺。國內(nèi)外的區(qū)別可以從優(yōu)勢和差距兩個方面來講。
從樣本資源來說,中國最大的特點是樣本資源量大,資源種類多樣化。與歐美國家相比在較短時間內(nèi)能夠積累大量資源。在中國一個月的就診數(shù)量,在國外達到同樣的病例數(shù)可能要幾個月,如胸腺腫瘤類,據(jù)說整個歐洲的例數(shù)甚至少于中國的一家三甲?漆t(yī)院。單從研究性資源來看,這是有利的方面。而不好的方面是沒有考慮好應(yīng)用問題。比如一個產(chǎn)品需沒有做市場調(diào)查,沒有計劃應(yīng)用措施,就可能造成"儲存性"的資源浪費,這也是樣本庫資源管理方面存在的問題。
在中國,很多人習(xí)慣以大和多來衡量事物的好壞。經(jīng)常會聽到有人用樣本量多少和空間大小來衡量一個樣本庫的發(fā)展狀況,這是概念性問題,會直接影響到樣本庫的建設(shè)和管理等一系列問題。我認為樣本庫不能以大和多來衡量其價值,那個時代已經(jīng)過去了。目前我國樣本庫建設(shè)需要的是:以做模板為主,然后去擴充。簡單來講,1和10只是大小的區(qū)別,但最難和最關(guān)鍵的是1要怎么去做,有了1,擴增到10就很容易了。
第二個差別是樣本庫資源的進口和出口。樣本庫建設(shè)可以簡單描述為像計算機中的任何一個事件:打個字到鍵盤上,這是"進口",計算機運算或處理一下輸入的內(nèi)容,這是"操作",然后中屏幕上顯示;進口"的結(jié)果,這是"出口"。目前在我國樣本庫建設(shè)中,由于資源豐富,且操作相對容易,所以"進口"的速度很快。但具體"操作"跟國外相比還有不小的差異。當(dāng)然每個樣本庫都很重視這個方面。但是我認為現(xiàn)在最大的問題可能是樣本庫資源的"出口"問題,即資源的應(yīng)用,F(xiàn)在中國做生物樣本庫,一定要與傳統(tǒng)的,以單一課題的需求為目的的生物樣本儲存有本質(zhì)的區(qū)別:一是在管理的組織結(jié)構(gòu)上,二是作為系統(tǒng)化醫(yī)學(xué)研究的資源。而現(xiàn)在大多樣本庫建設(shè)還沒有發(fā)生本質(zhì)上的改變。
第三,理念上認識的差距較大。我國每家醫(yī)院都在做樣本庫建設(shè),事實上有些沒有必要重復(fù)建,比如有些小的醫(yī)院。因為一旦要建,從建設(shè)庫到人員培訓(xùn)等所有資源都會產(chǎn)生重復(fù)的花費,這方面主要問題是缺乏系統(tǒng)化的認識和設(shè)計。而國外則目標比較明確,很多樣本庫都是建設(shè)在大的醫(yī)藥公司,比如輝瑞,因為各家醫(yī)院都跟他有研發(fā)方面的合作。而我們國內(nèi)許多建庫的目的還停留在提高科研、發(fā)文章上面,總強調(diào)發(fā)文章的SCI多少分。不管是管理層面,還是目的性方面的認識問題,都存在理念的問題。
另外,國外還有個重要的特點,就是團體合作,協(xié)作性比較強,比如美國NIH的NCI有關(guān)項目,以及加拿大的P3G項目。我國目前在這方面較薄弱。國外信息化發(fā)達,在一些專病領(lǐng)域,他們都以團隊或聯(lián)盟的性質(zhì)整合應(yīng)用資源如經(jīng)費,而我國總的來說還是單兵作戰(zhàn),雖有一些團體,但是沒有改變實質(zhì)。這可能跟文化有關(guān)系。很多人一談到共享,會覺得拿了自己的東西。事實上,共享并非你拿我的,我拿你的這么簡單。由于認識上的問題,很多人會回避,而不是去解決共享機制的建設(shè)。簡單來講,我們之間怎么共享,以何種機制來實現(xiàn),而不是把共享的方式簡單認為是一方拿另一方的東西,總是以"防守"和回避來解決問題。
資源整合也是同樣的問題:認為資源整合就是把所有資源實體上放置在一起,因而就回避不整合,各自為陣。我現(xiàn)在和國外的合作項目,就是研發(fā)國際信息共享的機制:整合各自分析結(jié)果再次分析,但是原始信息各自嚴密自行保存,不涉及到任何共享。這就是面對大家都普遍存在的問題去尋求另外的機制來解決。他們共享的目的很清晰,也同樣受規(guī)定限制,但會想辦法用技術(shù)來解決這個問題,而不是回避。所以我認為在這方面,我們還是存在理念認識方面的差距。
生物樣本庫建設(shè)中的內(nèi)容和方法中國也可以成為國際規(guī)范
生物谷:國外在管理、操作規(guī)范方面,有哪些值得中國借鑒的地方?
王偉業(yè)教授:講到國際規(guī)范,通常是指歐美規(guī)范,其實我們沒有必要總是跟在后面走,國際規(guī)范本身也可以包括中國。有些研發(fā)工作,可以針對現(xiàn)實的問題動手先做,沒必要一定符合"國際規(guī)范",我們做出來有價值的一定會被借鑒,也就會逐步發(fā)展為某種意義上的"國際規(guī)范",而不是框架性的認為,國外還沒做,我們就不必要做。有次在會議上報告我們相關(guān)研發(fā)的資源交流項目的時候,就有不只一個聽眾提問,你們做的國際上有沒有先例,是否符合"國際規(guī)范"之類的問題。我當(dāng)時答復(fù)就是一是不知道,二是沒有考慮過。為什么一定要先了解有沒有國際先例再做呢?只要我們認為是有價值的,能夠解決我們實際的問題,我們就是先例,也可以到一定時候成為某種意義上的"國際規(guī)范"。今年初,我在美國與國際樣本協(xié)會負責(zé)人討論提及我們的項目時,發(fā)現(xiàn)他們也在做類似事情,所以只要是問題,大家都能夠想到。
當(dāng)然國際上在這方面發(fā)展比我們早,其中由許多我們可借鑒、可采用的建設(shè)發(fā)展理念,我們沒有必要自己再做一套。從國外樣本庫建設(shè)規(guī)范化來說,我們需要采用。總體來講主要有兩個大規(guī)范:一是美國國立衛(wèi)生研究院NIH里面的NCI,即美國腫瘤研究所,他們給生物樣本庫專門設(shè)立一個辦公室叫OBBR,那里設(shè)了一套我們常說的標準規(guī)范,他們叫最佳實踐即英文的BestPractice。規(guī)范還不能稱為標準,標準可能是必須服從的。但目前樣本庫建設(shè)方面國際上還沒有真正意義上的標準,只能稱為最佳實踐。根據(jù)所有專家過去的操作,大家認為最好的辦法,然后依據(jù)去做,是大家目前能力范圍認為的最好或應(yīng)該采用的方法。而且這是不斷更新的過程,事情發(fā)展到一定階段,大家都這么做,就會通過某種機制或手段體現(xiàn)其價值標準而成為操作標準規(guī)范。
另外一個規(guī)范就是國際樣本庫協(xié)會ISBER(InternationalSocietyofBiologicalEnvironmentalRepository)采用的最佳實踐,其最新版本的是2012年做的。這兩個最大的區(qū)別就是ISBER考慮比較高層面的,沒有太詳細,更多的是構(gòu)架一些理念,而美國NCI的OBBR做的比較細,他們所有樣本資源最早都是從腫瘤樣本做起,從病理科開始發(fā)展。這是目前國際上存在的主要兩大規(guī)范。幾年前,中國也曾經(jīng)制定過樣本庫規(guī)范,如我國重大疾病樣本庫建設(shè)規(guī)范,是由中國生物醫(yī)藥協(xié)會組織樣本庫分會主任委員郜恒俊教授領(lǐng)導(dǎo)的團隊在開展這方面的工作,近年來,他們主要是推動以國際生物樣本庫協(xié)會ISBER的最佳實踐指南為主的規(guī)范化建設(shè)。
可借鑒的第三點是他們的信息化發(fā)展。這方面國際發(fā)展的的速度與我們差別較大,而且很多是由于理念認識不同而導(dǎo)致信息化發(fā)展方面的阻礙。國外信息化發(fā)展比較早,在科研上,我們會有很多可借鑒的。目前生物樣本庫與傳統(tǒng)生物資源保存最根本的區(qū)別就是樣本的信息化問題。我在許多場合的報告都會提出一點,就是樣本本身幾乎沒有什么價值,真正的價值在于其特有的信息,也就是生物樣本是唯一的生物實體,它既有豐富的臨床信息,又有詳細的實驗室信息,這是其他實體無法做到的,動物模型或細胞不能夠正確反映臨床信息。臨床和實驗室信息的結(jié)合正是轉(zhuǎn)化醫(yī)學(xué)的起點。簡單來說,現(xiàn)代建設(shè)生物樣本庫的目的就是如何能夠把生物樣本資源轉(zhuǎn)化或翻譯成為數(shù)據(jù)信息資源,如果樣本沒有信息的轉(zhuǎn)化,其作為轉(zhuǎn)化醫(yī)學(xué)和個體化醫(yī)學(xué)研究的寶貴資源也將成為一句空話。現(xiàn)在人們參觀某個生物樣本庫,總是看有多大空間,多少冰箱,有什么儀器,有幾個人等等,但是真正能夠展示一個樣本庫價值的只有信息,一個有價值和管理規(guī)范的數(shù)據(jù)庫,其核心點也不是發(fā)表過多少篇文章。我相信將來我們再談生物樣本庫,重點也會轉(zhuǎn)移到相應(yīng)的信息化建設(shè)與發(fā)展。最近我申報一個新的項目,是與美國方面合作的,因為我知道他們那里做的非常好,正是我們需要的。所以從信息化的角度,他們有很多方面值得我們借鑒。
生物谷:如何看待生物樣本庫信息化管理以及標準化?
王偉業(yè)教授:前面已經(jīng)簡單提到生物樣本的信息化建設(shè)的必要和重要性。信息化不能單一解釋為管理,樣本信息化的核心簡單地說就是如何以正確的方式描述樣本所包含的信息內(nèi)容并且讓這些信息能夠充分體現(xiàn)樣本的特性與特征。我前面提到想做的項目,其關(guān)鍵點就是如何特異性的描述樣本資源的特征。比如同樣是大腸癌樣本,不同的樣本庫描述特征可能不一樣,現(xiàn)代醫(yī)學(xué)越來越精細化,腫瘤樣本的特性會有基因分型,個體化治療更需要分型。單說是大腸癌樣本沒有多少價值,因為每個人的大腸癌樣本內(nèi)涵不同。這就需要描述非常特征性的信息。在科研應(yīng)用上,樣本的特征性描述如果不全面,或不夠精細,就要考慮這個樣本是否符合你的研究需要,所以信息化的重點就是如何特異性的描述樣本,即樣本的特性。
第二點是上述的樣本信息化方法要逐步走向規(guī)范化和標準化,比如大腸癌樣本在不同的樣本庫要以同樣的內(nèi)容和方法來描述,這樣經(jīng)過統(tǒng)一,規(guī)范化然后被接受后,才能逐步走向標準化。所以標準化是水到渠成的事情,把基底鋪好,一步步不斷朝前走,到一定時候才能實現(xiàn)標準化,而不是今天講標準,很快就能做到標準。先找到正確的方向,建立一定的基礎(chǔ),然后自然會走到標準化。
生物谷:整體來講,挑戰(zhàn)還是比較多。國家政府層面對這個支持情況怎么樣?
王偉業(yè)教授:樣本庫建設(shè)的發(fā)展需要領(lǐng)導(dǎo)層面和政策的支持,政策決定樣本庫的發(fā)展方向和可行性。許多醫(yī)院領(lǐng)導(dǎo)在這方面意識很強,能夠大力推動樣本庫的發(fā)展。今年6月在北京將召開第六屆生物樣本庫標準化管理會議,其中專門設(shè)有一個醫(yī)院院長高峰論壇,其目的很明確。中國的樣本庫建設(shè)之所以能夠在短時間內(nèi)發(fā)展迅速,是各醫(yī)院領(lǐng)導(dǎo)大力支持的結(jié)果。正因為如此,也說明領(lǐng)導(dǎo)的支持是非常關(guān)鍵的因素。
據(jù)我所知,樣本庫建設(shè)目前還沒有作為一個科研項目來申請資金項目。目前的資金,都只是來自當(dāng)?shù)卣闹С忠约搬t(yī)院自身投入。
轉(zhuǎn)化醫(yī)學(xué)是從臨床到實驗室,再把實驗室獲得的結(jié)果帶回到臨床應(yīng)用。這個過程需要研究對象,尤其涉及個體化治療。如果沒有生物樣本資源,一切都是空談。生物樣本的可貴之處是其既有臨床信息,又有實驗室的研究信息,樣本資源在實驗室研究和臨床信息之間搭建了一個通道,能夠起到實驗室與臨床之間往來的橋梁作用。轉(zhuǎn)化醫(yī)學(xué)的多方面都涉及樣本庫,所以資金支持對樣本庫建設(shè)不是大問題。也就是說,目前在建設(shè)樣本庫方面不會因資金短缺問題而做不好。
當(dāng)然資金處理方面也會存在一些問題。有些資金在沒有得到全面的規(guī)劃和設(shè)計之前就以分配的方式到了各個機構(gòu),就像把需要一個拳頭的力量來做的事情分成單個手指去單獨執(zhí)行。一個全面的自動化特性平臺可以在保證質(zhì)量的前提下完成同樣的流程式操作,但資金分配后導(dǎo)致任何一家單位都承擔(dān)不起,即使購買了設(shè)備,所需的試劑與耗材也會缺乏資金,或者有了設(shè)備,卻沒有單位有那么多需求,最終也不能夠真正應(yīng)用。因此資金需要在高層面設(shè)計合理后才能更好地整合協(xié)調(diào)。
第二是樣本庫的維持,大多醫(yī)院或單位對樣本庫建設(shè)的支持往往是大力支持硬件設(shè)施,如冰箱,房間,工作人員。其實消耗品也很重要,至少需要占5%,但這筆經(jīng)費一般沒有來源,有設(shè)備卻無法開工。如何有機制地維護這種平臺是目前我們都能夠看到的一個挑戰(zhàn)性問題。比如,一家小醫(yī)院為了順應(yīng)發(fā)展趨勢而建個樣本庫,由于科研平臺薄弱,加上缺乏共享應(yīng)用,之后的使用就會很少而沒有辦法維持,最后可能就類似于傳統(tǒng)上的一個實驗室有幾個冰箱。這涉及到國際上探討的樣本庫經(jīng)濟學(xué)方面的思考(BiobankEconomics)。當(dāng)然這取決于管理人員在管理樣本庫,使用樣本庫等很多方面的能力,因此將來能夠走下去的可能只有為數(shù)不多的生物樣本庫。
資金支持方面,目前國外NIH也可能沒有特別經(jīng)費支持。比如NIH設(shè)有個專門資金來支持一些重大項目的申請,但必須利用已經(jīng)存在的生物樣本資源,這可能是把資源最大化利用的一個正確案例。
生物樣本庫信息化管理,專職容易專業(yè)難
生物谷:如何看待國家生物樣本庫信息化管理方面人才問題?
王偉業(yè)教授:首先,在中國,許多樣本庫通常是雇幾個專職工作人員,就稱樣本庫有專職人員負責(zé),當(dāng)然這沒有錯,但需要明白專職并不等于專業(yè)化。另外對于樣本庫中的"庫"字,在現(xiàn)實中可能造成理念上的誤解:庫,很容易被認為像倉庫一樣,而倉庫會讓人想到儲存。所以"樣本庫"不像一個與研究非常緊密的機構(gòu)。在英文里有些機構(gòu)會寫成BiospecimenResearch。事實上,儲存樣本只是生物樣本庫主要功能的一項,其功能絕不僅限于儲存。如果一直停留在這個誤區(qū),會造成之后相應(yīng)的錯誤,我認為最主要的是資源的應(yīng)用或共享。目前,樣本資源的應(yīng)用與研究方面的結(jié)合、信息共享為前提的資源共享等一系列問題都沒有得到解決。所以,從專職到專業(yè)是個復(fù)雜的學(xué)習(xí)過程。由于樣本庫涉及的知識范圍很廣,如醫(yī)學(xué)、生物學(xué),分子生物學(xué)、冷凍保存技術(shù)、生物信息學(xué)和信息管理學(xué)等,現(xiàn)在已經(jīng)把其看作是一門新型的學(xué)科。所以我認為應(yīng)該成立生物樣本中心,以反映其職能和功能特性。
樣本庫的信息化管理是樣本資源所必須的,信息化和生物信息是兩個方向,而生物信息學(xué)需要這兩個領(lǐng)域的交叉人才。人們?nèi)菀装焉镄畔⒗斫鉃镮T,但是IT人員只能夠滿足要求的計算機功能,卻不知道生物領(lǐng)域的邏輯。因此需要生物學(xué)和IT人員緊密配合才能夠達到需求。當(dāng)然,并不是要求樣本庫工作人員都必須懂得信息化的知識,目前也辦不到,但是至少管理層的人一定要有相應(yīng)工作需要的基本知識,負責(zé)項目的人要有能力在中間做協(xié)調(diào),這點很重要。樣本庫建設(shè)下一個階段的發(fā)展一定是以信息化為重點。從我的工作經(jīng)驗來看,我的生物信息化知識加上我自己對計算機方面的的愛好,跨學(xué)科的知識與技能對我?guī)椭艽,我現(xiàn)在可以設(shè)計數(shù)據(jù)庫的邏輯方面需要。生物樣本庫是一個多學(xué)科的領(lǐng)域,需要一個從專職到專業(yè)化的轉(zhuǎn)變和更新的歷程。
生物谷:我國樣本庫信息化人才方面存在哪些問題?
王偉業(yè)教授:中國在生物信息化方面發(fā)展跟國外的差距相對比較大,也可以這么說,我國生物信息化的發(fā)展明顯滯后于醫(yī)學(xué)生物研究的發(fā)展。不少做分子生物研究領(lǐng)域的人,因為工作需要使用很多信息系統(tǒng),然后去鉆研信息相關(guān)方面的知識與技能,可能不需要知道詳細編程,但至少知道信息化的邏輯。從管理項目來講,需要掌握一些基本知識和一些邏輯過程。
另一方面,可能做生物的人對計算機認識少,國內(nèi)對樣本庫信息化管理方面的認識不足,很容易把一些問題歸納為計算機的問題。其實有不少需求或者問題不一定是計算機方面的,比如樣本庫的信息怎么去標識,怎么注解等相關(guān)問題,這不能夠只依賴IT的工作,而是需要樣本庫的工作人員去做的,因為這樣的工作需要醫(yī)學(xué)生物的專業(yè)知識。現(xiàn)在生物醫(yī)學(xué)研究離不開數(shù)據(jù),離不開信息化,大數(shù)據(jù)處理、生物樣本信息處理,完全用Excel格式或手工記錄已經(jīng)不能滿足現(xiàn)代生物醫(yī)學(xué)研究所產(chǎn)生的數(shù)據(jù)量和復(fù)雜性方面的需求。
生物谷:針對這些問題,您個人是否有好的解決建議?
王偉業(yè)教授:首先我們需要培訓(xùn),目前,生物樣本庫建設(shè)缺少以進修方式來達到掌握技能和管理的方式,而主要采取學(xué)習(xí)班的方式,這樣時間有限,而且不能實踐性的涉及到具體工作。樣本庫方面的工作主要還是應(yīng)用型的操作和管理技能,尤其是對信息管理系統(tǒng)的掌握,單靠課堂方式的培訓(xùn)是不夠的。在實際工作中如果遇到問題,學(xué)習(xí)正確的思考和解決問題的方法是最重要的。我提倡的是,通過做事,才能真正知道如何解決問題,才能把一套知識學(xué)會。目前在我的團隊,我對他們的要求就是以"進修"的方式,直接參與到日常工作中去。
去年因項目進展要求,我們走訪了一些樣本庫,發(fā)現(xiàn)存在的問題主要在信息化管理方面:把樣本登記到樣本庫信息管理系統(tǒng)中是很容易辦到的事情,但信息內(nèi)容幾乎空白,這樣的樣本從信息系統(tǒng)本身而言是沒有辦法應(yīng)用的,因為連基本的搜索恐怕都做不到。現(xiàn)在我們的樣本庫信息以臨床診斷作為樣本的主要信息,比如某種腫瘤的臨床診斷名稱。而個體信息可能都沒有。再舉個傳統(tǒng)的簡單例子,收集了群體的樣本后,只描述臨床診斷是某種型肺癌,如果研究者是想用此樣本來研究抽煙和肺癌發(fā)生的相關(guān)性,但是是樣本提供者是抽煙的,還是喝咖啡的等相關(guān)信息都沒有,研究人員就無法確定樣本資源是否是研究所需要的。
樣本庫的發(fā)展,首先要建立,然后才能統(tǒng)一也必須統(tǒng)一,最后才有可能發(fā)展為樣本資源網(wǎng)絡(luò),這是國際樣本庫發(fā)展趨勢中的三個里程碑。但是這里的"統(tǒng)一",并不是在實體上把樣本資源整合在一起,不是把資源放在一起整合儲存那么簡單。整合應(yīng)該是相同的資源在應(yīng)用時具備相容性,可以用同一個標準來評價其質(zhì)量和特性等。有了相容性,需要時才可以真正的整合應(yīng)用,即使分開研究,由于信息規(guī)范統(tǒng)一,得到的結(jié)果也可以"整合"分析。所以"整合"可以分別理解為整合儲存,整合應(yīng)用和整合分析幾種方式。另外"網(wǎng)絡(luò)"并非計算機網(wǎng)絡(luò)那么簡單,網(wǎng)絡(luò)代表共享,包括信息和樣本資源的共享。我認為信息共享是樣本資源共享的前提:信息不能夠共享,就不能確定樣本資源是否有資質(zhì)共享。目前我們在建設(shè)的初期,信息化方面的問題很明顯。信息雖然很多,比如很多稱為電子病歷的病歷有可能僅僅是電子版的記錄,并不是真正意義上的電子病歷,真正的電子病歷是將所有病歷信息化的計算機可以應(yīng)用的病歷信息。
當(dāng)然,這些基本的理念可以通過培訓(xùn),通過提供一些進修的平臺,讓從業(yè)人員從實際上接觸并解決問題。現(xiàn)在承擔(dān)樣本庫工作的專職人員缺乏一些必要的專業(yè)技能和經(jīng)驗,需要通過專業(yè)化的學(xué)習(xí)從專職成為專業(yè)人員。樣本庫是設(shè)計面廣泛的應(yīng)用科學(xué)與研究,因為實驗室的研究結(jié)果與樣本庫的專業(yè)程度緊密相關(guān),尤其在研究中出現(xiàn)的問題,樣本庫工作人員需要直接思考并解決問題。所以談到職業(yè)方向,從業(yè)者如果一開始僅把建庫理解為做好儲存是沒有意義的。負責(zé)人應(yīng)該具有較高的專業(yè)化程度,不能把專職和專業(yè)等同起來,做專職易,做專業(yè)難!
王偉業(yè)教授2012年引進回國,之后開展了很多生物樣本庫信息化建設(shè)方面的工作。對于未來,他又有著怎樣的期待呢?
生物谷:請您介紹一下回國后這兩年在樣本庫資源共享方面的工作情況。
王偉業(yè)教授:前面談到過,資源共享的前提是信息共享,其條件是樣本資源必須在信息化建設(shè)方面有可比性和相容性,只有合格的樣本資源才能夠共享。另外,共享的實施也是通過信息化管理運作來實現(xiàn)的。兩年來,除了領(lǐng)導(dǎo)研發(fā)合作團隊研發(fā)信息化管理系統(tǒng),也作為技術(shù)負責(zé)人指導(dǎo)研發(fā)信息化共享平臺。我們走出的較關(guān)鍵性的一步就是統(tǒng)一信息管理系統(tǒng),這為不同樣本庫之間共享信息打好了基礎(chǔ)。統(tǒng)一的信息化管理系統(tǒng)可以解決不同信息管理系統(tǒng)因不同的邏輯和結(jié)構(gòu)設(shè)計而帶來的信息搜索方面的難題。
我的工作重心還有我負責(zé)申報的兩項信息化國際合作科研項目,已經(jīng)獲得上海科委國際合作項目和國家科技部國際科技合作專項的立項經(jīng)費支持。項目的主要目的是探索應(yīng)用統(tǒng)一多方數(shù)據(jù)元素的方法和數(shù)據(jù)屏蔽技術(shù),建設(shè)信息共享機制和運作模式,促進國內(nèi)國際合作研究。這些技術(shù)和模式同時也是樣本資源共享建設(shè)發(fā)展的需求。
另外,為樣本庫建設(shè)下一階段的發(fā)展考慮,我正在負責(zé)國家科技部的研究項目,重點是研究樣本庫信息資源的語義化描述/注解、語義化索引以及樣本庫資源語義化檢索等方面的工作,為建設(shè)語義化的樣本庫(SemanticBiobank)。這也是生物資源和生物大數(shù)據(jù)共享的另一個需求模式。通過語義化注解,樣本資源可以通過一定的統(tǒng)計學(xué)分析來評估樣本信息質(zhì)量的可比性和相似性,為判斷資源共享的合理性提供一個可分析的方法。
樣本庫共享首先是樣本的信息共享。如果不知道樣本的信息,無從知道是否要共享。一些可能并不是你想要的樣本,并非簡單講樣本的質(zhì)量好壞,凡不符合研究需要的樣本對你來說就是垃圾,當(dāng)然也可能對別人是寶藏。所以跟別人資源共享,一定要先了解別人的資源對你是否有用,這是信息共享的前提。是否愿意共享是目前的一個主要障礙,當(dāng)然也缺乏具體的應(yīng)用方式和機制。有時同國際方面合作時,會有這種情況:愿意合作,但樣本不合格。
第四是信息化管理,我設(shè)計的信息化管理流程和邏輯,是與專業(yè)的IT團隊合作完成的,這樣我具有的跨學(xué)科知識和經(jīng)驗?zāi)軌蚱鸬揭欢ǖ囊龑?dǎo)作用。在系統(tǒng)設(shè)計方面,融入的要素一定是將來要用的模式,而不是只考慮眼前的應(yīng)用,有些方式和功能可能被認為用不著,但是里面涵蓋著發(fā)展必須要有的。只滿足眼前,不考慮將來,這是信息數(shù)據(jù)管理方面要避免的。信息交流越先進越好,最終理想是只有一種信息,可能這才是需要的標準。雖然在實際中可能很難,但至少不能鋪的太廣,比如一百個生物樣本庫,用了幾十個不同的管理系統(tǒng),這樣會走向混亂。所以標準化必須打好基礎(chǔ),否則沒辦法實現(xiàn)標準,即使提供一個標準也做不到。針對這個問題,不同樣本庫之間要互相做接口,互相征詢和改變,這樣大家才能逐步走向標準。
生物谷:最后,您對中國生物樣本庫建設(shè)以及自己之后的工作有什么期待?
王偉業(yè)教授:期待當(dāng)然有,我知道最近有關(guān)方面要討論建立國家層面的生物樣本庫。人類生物樣本資源庫主要有兩種,一種是正常人群的,一種是病人源性的。中國資源種類多,病人多,需要一個逐步發(fā)展完整的機制和政策以及手段來規(guī)范化,我認為要采用先做模式,后擴展的方式,如同企業(yè)要先做強后做大一樣,真正把樣本庫建設(shè)做成一個科學(xué)化的行業(yè)。
對于自己的工作期待,當(dāng)然也就是自己的研究項目,希望能夠引導(dǎo)樣本庫信息化發(fā)展,目前樣本庫信息還不能實現(xiàn)共享。單純講資源共享不可行,中間有斷層,這個領(lǐng)域內(nèi)的培訓(xùn)和專業(yè)化層面跟國際上有很多可交流借鑒的地方。所以我要利用我個人的一點的優(yōu)勢通過國際合作的方式,實事求是的合作,利用已經(jīng)有的技術(shù)平臺和一些理念。另外,我認為國際合作并不是獲取一項技術(shù),單純的技術(shù)不是最重要的,因為技術(shù)也可以花錢買來。所以單純有技術(shù)是不夠的,重要的是模式和平臺。我的研究項目很看重模式平臺。我們有時過于強調(diào)技術(shù),但是技術(shù)和平臺不是一回事,一個平臺的管理規(guī)章制度、流程、質(zhì)控質(zhì)檢以及所有的專業(yè)技術(shù)人員代表著能否做好這件事情。所以合作或者共享,尤其和國際上合作,最需要做的平臺就是信息交流平臺。