國(guó)家茶葉全產(chǎn)業(yè)鏈大數(shù)據(jù)中心于2019年11日13經(jīng)農(nóng)業(yè)農(nóng)村部批復(fù),2021年9日16通過(guò)農(nóng)業(yè)農(nóng)村部驗(yàn)收。中心從國(guó)家戰(zhàn)略需求出發(fā),落實(shí)國(guó)家關(guān)于數(shù)字農(nóng)業(yè)農(nóng)村發(fā)展的部署要求,為涉茶政府部門、經(jīng)營(yíng)主體、科研機(jī)構(gòu)、公眾等提供專業(yè)權(quán)威的數(shù)據(jù)服務(wù),致力于支撐茶產(chǎn)業(yè)科學(xué)決策,提高茶產(chǎn)業(yè)數(shù)字化水平,助推我國(guó)茶產(chǎn)業(yè)數(shù)字化轉(zhuǎn)型,同時(shí)為數(shù)字農(nóng)業(yè)項(xiàng)目建設(shè)提供試點(diǎn)經(jīng)驗(yàn)。中心開展茶產(chǎn)業(yè)數(shù)據(jù)的采集、存儲(chǔ)、挖掘工作,在功能上按照一體化管理和模塊化應(yīng)用思路進(jìn)行,并強(qiáng)化了數(shù)據(jù)采集和應(yīng)用功能,開發(fā)了豐富多元的數(shù)據(jù)采集功能,同時(shí)根據(jù)具體的應(yīng)用場(chǎng)景開發(fā)了相對(duì)獨(dú)立的數(shù)據(jù)挖掘和模型系統(tǒng)。目前已具備數(shù)據(jù)采集、分析和發(fā)布能力,其中消費(fèi)趨勢(shì)數(shù)據(jù)、電商數(shù)據(jù)、輿情監(jiān)測(cè)數(shù)據(jù)已經(jīng)具有明顯的輔助決策能力,對(duì)全面把握茶產(chǎn)業(yè)運(yùn)行規(guī)律、產(chǎn)業(yè)政策制定、指導(dǎo)科學(xué)決策開始發(fā)揮作用。

建設(shè)內(nèi)容:
1.茶葉全產(chǎn)業(yè)鏈數(shù)據(jù)倉(cāng)庫(kù)
利用大數(shù)據(jù)技術(shù)對(duì)互聯(lián)網(wǎng)采集信息進(jìn)行加工處理,按照茶產(chǎn)業(yè)、茶科技、茶文化三大主題板塊初步建成一批涉茶專題庫(kù)。例如:匯聚涉茶電子商務(wù)數(shù)據(jù)上萬(wàn)條,全面、真實(shí)地反映被監(jiān)測(cè)區(qū)的茶葉品牌線上流通情況,為指導(dǎo)茶葉經(jīng)營(yíng)決策提供可靠數(shù)據(jù)來(lái)源;匯聚國(guó)際及國(guó)內(nèi)茶葉生產(chǎn)情況數(shù)據(jù)上萬(wàn)條,為分析國(guó)內(nèi)外茶產(chǎn)業(yè)發(fā)展差異、了解國(guó)內(nèi)外茶葉發(fā)展情況提供數(shù)據(jù)支撐;匯聚茶葉昆蟲標(biāo)本數(shù)據(jù)3000余條,提供在線瀏覽、檢索標(biāo)本服務(wù),提升標(biāo)本管理準(zhǔn)確性,降低了對(duì)實(shí)物標(biāo)本的人為損壞幾率...目前三大板塊專題數(shù)據(jù)庫(kù)建設(shè)10個(gè),供社會(huì)公眾免費(fèi)查詢。
2.數(shù)據(jù)挖掘與決策系統(tǒng)
中心建有功能相對(duì)完善的數(shù)據(jù)匯聚與挖掘平臺(tái)。數(shù)據(jù)挖掘系統(tǒng)可實(shí)現(xiàn)混搭數(shù)據(jù)的融合和數(shù)據(jù)價(jià)值發(fā)掘,具備分析系統(tǒng)的功能、分析能力和計(jì)算能力。通過(guò)數(shù)據(jù)采集系統(tǒng)的治理及清洗,數(shù)據(jù)挖掘系統(tǒng)將基于這部分?jǐn)?shù)據(jù),進(jìn)行指數(shù)編制、數(shù)學(xué)建模、查詢統(tǒng)計(jì)、機(jī)器學(xué)習(xí)、可視化展示等工作,實(shí)現(xiàn)對(duì)數(shù)據(jù)的綜合利用,為茶產(chǎn)業(yè)生產(chǎn)、管理與科學(xué)研究提供各類統(tǒng)計(jì)、檢索、分析、識(shí)別、評(píng)估、預(yù)測(cè)、決策等服務(wù)。
3. 茶葉輿情與熱點(diǎn)監(jiān)測(cè)系統(tǒng)
對(duì)互聯(lián)網(wǎng)上涉及茶葉全產(chǎn)業(yè)鏈的政策信息、消費(fèi)趨勢(shì)、敏感事件等信息進(jìn)行全面匯聚,開發(fā)輿情分析產(chǎn)品與服務(wù),包括茶葉輿情預(yù)警服務(wù)系統(tǒng)、茶葉互聯(lián)網(wǎng)輿情年度報(bào)告,為政府部門、生產(chǎn)經(jīng)營(yíng)者提供茶葉產(chǎn)業(yè)鏈社會(huì)關(guān)注焦點(diǎn),進(jìn)而為提前研判茶葉產(chǎn)業(yè)形勢(shì)提供依據(jù)。利用NLP(自然語(yǔ)言處理)技術(shù)對(duì)帶有情感色彩的主觀性文本數(shù)據(jù)進(jìn)行分析、處理、歸納和推理。可以將消費(fèi)者對(duì)產(chǎn)品的評(píng)價(jià)以數(shù)字的形式直觀地展現(xiàn),可以形成關(guān)鍵字云圖。

4. 茶葉消費(fèi)趨勢(shì)監(jiān)測(cè)系統(tǒng)
對(duì)互聯(lián)網(wǎng)上涉及茶葉消費(fèi)的電商平臺(tái),監(jiān)測(cè)主要茶類消費(fèi)流通端的銷售數(shù)據(jù),主要包括六大茶類銷售額數(shù)據(jù)、各省份茶葉銷量訂單、各月份茶葉銷量訂單、熱點(diǎn)城市茶葉銷量訂單、各茗茶銷量訂單以及各品牌銷售金額情況等等。
5. 茶病茶蟲數(shù)字標(biāo)本線上博物館
茶樹病蟲數(shù)字標(biāo)本館平臺(tái)將中國(guó)農(nóng)業(yè)研究院茶葉研究所標(biāo)本館藏的5目36科109種3000條標(biāo)本搬上了數(shù)字化平臺(tái),研究人員通過(guò)網(wǎng)絡(luò)查詢數(shù)字標(biāo)本館,不僅能跨越時(shí)空,全方位、多層次檢索研究標(biāo)本信息,還可以與自然因子、其他生物信息相結(jié)合探索生物多樣性及其保護(hù)的難點(diǎn)問題,為科學(xué)研究、多樣性保護(hù)決策及公眾查詢提供更優(yōu)質(zhì)、更高效的服務(wù)。

6. 數(shù)據(jù)挖掘應(yīng)用場(chǎng)景案例
針對(duì)茶產(chǎn)業(yè)研究的不同主題所需要用到的不同的計(jì)量模型或機(jī)器學(xué)習(xí)算法,大數(shù)據(jù)平臺(tái)也內(nèi)置了數(shù)據(jù)挖掘算法,實(shí)現(xiàn)常用算法的封裝,集成目前主流的計(jì)量統(tǒng)計(jì)分析模型,可簡(jiǎn)單便捷的進(jìn)行計(jì)量模型的抽取與運(yùn)算。
