院況簡介
1949年,伴隨著新中國的誕生,中國科學(xué)院成立。
作為國家在科學(xué)技術(shù)方面的最高學(xué)術(shù)機構(gòu)和全國自然科學(xué)與高新技術(shù)的綜合研究與發(fā)展中心,建院以來,中國科學(xué)院時刻牢記使命,與科學(xué)共進,與祖國同行,以國家富強、人民幸福為己任,人才輩出,碩果累累,為我國科技進步、經(jīng)濟社會發(fā)展和國家安全做出了不可替代的重要貢獻。 更多簡介 +
院領(lǐng)導(dǎo)集體
機構(gòu)設(shè)置
創(chuàng)新單元
科技獎勵
科技期刊
工作動態(tài)/ 更多
工作動態(tài)/ 更多
文化副刊
中國科學(xué)院學(xué)部
中國科學(xué)院院部
語音播報
近日,由中國科學(xué)院計算機網(wǎng)絡(luò)信息中心大數(shù)據(jù)部團隊研發(fā)并開源的“PiFlow大數(shù)據(jù)流水線系統(tǒng)”獲2019年開源中國“GVP-碼云最有價值開源項目”獎。
PiFlow系統(tǒng)面向空間科學(xué)、高能物理、微生物等學(xué)科領(lǐng)域大規(guī)模多源異構(gòu)數(shù)據(jù)的快速采集、靈活處理和高效存儲等核心關(guān)鍵技術(shù)挑戰(zhàn),采用Hadoop/Spark分布式存儲與并行計算技術(shù),實現(xiàn)組件式的大通量、高并發(fā)的大數(shù)據(jù)流水線自動化處理。目前該系統(tǒng)已實現(xiàn)100+的數(shù)據(jù)處理組件,包括Hadoop、Spark、MLlib、Hive、Solr、Redis、MemCache、ElasticSearch、JDBC、MongoDB、HTTP、FTP、XML、CSV、JSON等,為用戶提供所見即所得的流水線配置界面,從而實現(xiàn)大數(shù)據(jù)組件式、自動化采集、清洗、計算、存儲及監(jiān)控的全流程服務(wù),同時支持用戶快速自定義數(shù)據(jù)處理組件的擴展開發(fā),滿足數(shù)據(jù)的個性化處理需求。該系統(tǒng)已支撐了科技資源情報服務(wù)、微生物數(shù)據(jù)中心、領(lǐng)域知識圖譜管理與服務(wù)等多項重大項目應(yīng)用。
開源中國運營有中國最大的代碼托管平臺,目前已服務(wù)超過300萬的軟件開發(fā)者。計算機網(wǎng)絡(luò)信息中心大數(shù)據(jù)團隊將陸續(xù)發(fā)布大數(shù)據(jù)采集、大數(shù)據(jù)融合存儲及復(fù)雜網(wǎng)絡(luò)挖掘等一系列核心軟件和工具。
© 1996 - 中國科學(xué)院 版權(quán)所有 京ICP備05002857號-1 京公網(wǎng)安備110402500047號 網(wǎng)站標識碼bm48000002
地址:北京市西城區(qū)三里河路52號 郵編:100864
電話: 86 10 68597114(總機) 86 10 68597289(總值班室)
編輯部郵箱:casweb@cashq.ac.cn
© 1996 - 中國科學(xué)院 版權(quán)所有 京ICP備05002857號-1 京公網(wǎng)安備110402500047號 網(wǎng)站標識碼bm48000002
地址:北京市西城區(qū)三里河路52號 郵編:100864
電話: 86 10 68597114(總機) 86 10 68597289(總值班室)
編輯部郵箱:casweb@cashq.ac.cn
© 1996 - 中國科學(xué)院 版權(quán)所有
京ICP備05002857號-1
京公網(wǎng)安備110402500047號
網(wǎng)站標識碼bm48000002
地址:北京市西城區(qū)三里河路52號 郵編:100864
電話:86 10 68597114(總機)
86 10 68597289(總值班室)
編輯部郵箱:casweb@cashq.ac.cn