要說(shuō)基因大數(shù)據(jù)領(lǐng)域的創(chuàng)新玩家,就不得不提23andMe。這家成立于2006年的公司可以說(shuō)是現(xiàn)代基因檢測(cè)企業(yè)的鼻祖。在創(chuàng)立之初,就推出了直接面向消費(fèi)者的基因檢測(cè)和解讀服務(wù);直到今天,國(guó)內(nèi)外開(kāi)展類似業(yè)務(wù)的公司身上,無(wú)論是業(yè)務(wù)模式還是解讀內(nèi)容,或多或少都有23andMe的影子。
然而,2013年FDA叫停了23andMe面向消費(fèi)者的解讀業(yè)務(wù),理由是擔(dān)心解讀信息的不準(zhǔn)確可能會(huì)對(duì)用戶的健康造成負(fù)面影響。于是23andMe不得不從解讀結(jié)果中去掉了與建康和疾病風(fēng)險(xiǎn)有關(guān)的部分。這一點(diǎn)其實(shí)是可以理解的,畢竟人是遺傳與外界環(huán)境共同作用的產(chǎn)物,遺傳因素的影響在很多時(shí)候都不如環(huán)境;而且,生物醫(yī)學(xué)研究還處于初始階段,對(duì)于多數(shù)疾病的理解還不夠全面。
不過(guò),2015年初,F(xiàn)DA批準(zhǔn)了23andMe針對(duì)布盧姆綜合癥(Bloom Symdrome,一種隱性遺傳?。┑幕驒z測(cè)方案。23andMe在隨后的聲明中強(qiáng)調(diào),23andMe在美國(guó)公民中隨機(jī)抽取667名用戶,代表處于不同年紀(jì)、性別、種族和教育背景的群體,通過(guò)他們的反應(yīng)來(lái)證明自己產(chǎn)品的介紹和結(jié)果解讀易于理解。FDA認(rèn)為,面向個(gè)人的疾病基因檢測(cè)服務(wù)至少應(yīng)該滿足以下兩點(diǎn),即:
(1)所有面向家庭檢測(cè)的產(chǎn)品都需要詳細(xì)的使用說(shuō)明,證明用戶在從未了解其產(chǎn)品的情況下可以看懂并正確操作;
(2)檢測(cè)結(jié)果清晰且適合普通用戶閱讀理解,告訴他們何種結(jié)果與用戶何種期待相匹配。只有這樣,基因檢測(cè)產(chǎn)品才能抓住用戶的心,并將他們轉(zhuǎn)化為基因檢測(cè)的傳播者。
值得指出的是,在收集到足夠多的用戶數(shù)據(jù)后,23andMe搖身一變,開(kāi)始成為大數(shù)據(jù)的玩家,因?yàn)橛脩魳悠?數(shù)據(jù)本身就是重要的戰(zhàn)略資源。比如說(shuō),23andMe在2012年的時(shí)候就已經(jīng)收集了約9000例帕金森癥病人的樣本。這些樣本可以用來(lái)發(fā)現(xiàn)新的致病突變。于是,23andMe龐大的用戶群吸引了不少生物技術(shù)特別是醫(yī)藥公司進(jìn)行投資。
23andMe的成功使人們看到了基因檢測(cè)走向消費(fèi)級(jí)市場(chǎng)的可能性,這一巨大的蛋糕吸引了投資人的廣泛興趣。自23andMe之后,眾多基因檢測(cè)、基因大數(shù)據(jù)公司紛紛成立,很多還成功獲得風(fēng)投的青睞,比如Human Longevity Inc,Seven Bridges Genomics等等。
位于美國(guó)波士頓的Seven Bridges Genomics公司,是基因大數(shù)據(jù)云計(jì)算領(lǐng)域的先行者。其所有的分析工具都部署在云端,無(wú)縫融合了生物醫(yī)學(xué)問(wèn)題的構(gòu)思假設(shè),以及海量的數(shù)據(jù)和豐富的計(jì)算資源,是目前唯一一家同時(shí)為英國(guó)國(guó)家政府和美國(guó)國(guó)家政府提供基因組軟件的公司。2016年初, Seven Bridges Genomics宣布將其云計(jì)算平臺(tái)架設(shè)在谷歌云上面,成為繼Tute Genomics之后又一家加入谷歌基因組陣營(yíng)的強(qiáng)力玩家。
直到今天,投資人對(duì)基因大數(shù)據(jù)初創(chuàng)企業(yè)還是情有獨(dú)鐘。比如,成功獲得融資的外國(guó)公司就有:
按照基因大數(shù)據(jù)分析公司的業(yè)務(wù)類型, 可以將它們大致分為以下幾類:
第一,云存儲(chǔ)、云計(jì)算類。比如ViaGenetics,它提供云空間以及相應(yīng)的工具用于分析全基因組和exome數(shù)據(jù)。從廣義上講,Amazon、Google、Microsoft以及華為、阿里的云計(jì)算平臺(tái)都屬于此類;而且,他們平臺(tái)的穩(wěn)定性、可靠性、安全性和可按需擴(kuò)展性是小型生信公司所不能比擬的。從數(shù)據(jù)分析的靈活性上講,利用現(xiàn)有云計(jì)算平臺(tái)自行搭建分析流程對(duì)一些大公司也有相當(dāng)?shù)奈Α?
第二,分析流程類。這類產(chǎn)品往往與云計(jì)算相結(jié)合,把分析的流程搬到線上,提供簡(jiǎn)化直觀的操作界面,以方便有生信分析需求但對(duì)技術(shù)了解不深的用戶。比如上面提到的ViaGenetics便是一例,其產(chǎn)品的功能與DNAnexus類似,但賣點(diǎn)在于易用。此外,GenomeNext也提供用于分析序列多態(tài)性和突變的平臺(tái)。類似的公司還有Tute Genomics等,國(guó)內(nèi)則有華大基因的BGI online等。
第三,數(shù)據(jù)整合、解讀類。比如Signifikance,這家公司不僅提供序列分析工具,還能將發(fā)現(xiàn)的突變和多態(tài)位點(diǎn)與臨床數(shù)據(jù)相結(jié)合,幫助醫(yī)生解讀病人數(shù)據(jù)、診斷和準(zhǔn)確用藥。類似的企業(yè)還有Massive Bio以及國(guó)內(nèi)的奇云諾德。此外,Deep Genomics則是一家利用深度學(xué)習(xí)算法預(yù)測(cè)某些基因突變是否會(huì)產(chǎn)生疾病后果的公司。
第四,數(shù)據(jù)庫(kù)知識(shí)庫(kù)類。這類型公司通過(guò)收集、整理、整合公共或私有信息,經(jīng)過(guò)人工檢閱(curation)后匯總為數(shù)據(jù)庫(kù)或知識(shí)庫(kù)。比如,瑞士的Genevestigator就是一家專門整理基因表達(dá)數(shù)據(jù)的公司。而美國(guó)的Genomenon則推出了一款叫做Mastermind的數(shù)據(jù)庫(kù),其中收集了人工檢閱過(guò)的基因序列突變。
第五,輔助類。我們通常將其它無(wú)法準(zhǔn)確分類的公司都放到這一類里。但事實(shí)上,也的確有許多以輔助個(gè)人或保險(xiǎn)公司的產(chǎn)品。這些產(chǎn)品小到科研助手(如Benchling),大到電子病例管理和分析,不一而足。
值得指出的是,同時(shí)具有多個(gè)分類特征的基因大數(shù)據(jù)公司或產(chǎn)品是更常見(jiàn)的。比如,大多產(chǎn)品都以云計(jì)算和云存儲(chǔ)為基礎(chǔ),而數(shù)據(jù)解讀也往往需要檢索突變和知識(shí)數(shù)據(jù)庫(kù)。
聯(lián)系客服