北京2020年10月(yue)15日(ri) /美通(tong)社/ -- 近日(ri),“浪潮云數智中國行(xing)-重慶站”現場,重慶郵電(dian)大學(xue)(xue)計算機學(xue)(xue)院(yuan)/人(ren)工(gong)智能學(xue)(xue)院(yuan)執行(xing)院(yuan)長張(zhang)清華做了(le)題為(wei)《人(ren)工(gong)智能發(fa)(fa)展的(de)(de)內驅動力》的(de)(de)主題演講。張(zhang)清華院(yuan)長分享了(le)人(ren)工(gong)智能時代(dai)下(xia)數據(ju)、算法和算力的(de)(de)發(fa)(fa)展,尤(you)其對人(ren)工(gong)智能時代(dai)下(xia)的(de)(de)“數據(ju)科學(xue)(xue)”做了(le)精彩的(de)(de)解讀(du)。
隨著計算機、互聯網、移動互聯網與物(wu)聯網的發(fa)展,我(wo)們已經(jing)進入了以數據為(wei)主體的數字(zi)化進程(cheng)中,科(ke)學(xue)研(yan)究也(ye)已經(jing)走向(xiang)“數據科(ke)學(xue)”第四范式。數據是數字(zi)世界的基(ji)本要素,也(ye)是人工(gong)智(zhi)能的生產資料。然而,目前我(wo)們對(dui)數據的挖掘與探索仍然停(ting)留在表層,并(bing)未發(fa)現數據本身的新(xin)規(gui)律(lv)、新(xin)知識,并(bing)由此創造新(xin)的價值(zhi)。面對(dui)數據的挑戰,深化人工(gong)智(zhi)能發(fa)展,重大的科(ke)學(xue)基(ji)礎設施建設必不可少(shao)。
將(jiang)重(zhong)(zhong)慶(qing)(qing)郵電(dian)大(da)學建設為(wei)“重(zhong)(zhong)慶(qing)(qing)市大(da)數(shu)據智(zhi)能(neng)化(hua)的(de)(de)(de)一個(ge)實驗場所(suo)、人才高地、科(ke)技高地”,是重(zhong)(zhong)慶(qing)(qing)市的(de)(de)(de)重(zhong)(zhong)要戰略部(bu)署。目前,重(zhong)(zhong)慶(qing)(qing)郵電(dian)大(da)學正(zheng)加緊籌劃建設“大(da)數(shu)據試驗場”,推(tui)動(dong)科(ke)學基(ji)礎(chu)設施的(de)(de)(de)建設,為(wei)重(zhong)(zhong)慶(qing)(qing)市以大(da)數(shu)據智(zhi)能(neng)化(hua)為(wei)引領的(de)(de)(de)創(chuang)新(xin)(xin)驅(qu)動(dong)發展戰略提供強(qiang)有力的(de)(de)(de)基(ji)礎(chu)設施支撐(cheng)。2020年7月(yue),重(zhong)(zhong)慶(qing)(qing)郵電(dian)大(da)學與浪潮攜手打(da)造了計算(suan)性能(neng)達每秒千萬億次規模(mo)的(de)(de)(de)人工(gong)智(zhi)能(neng)創(chuang)新(xin)(xin)平臺,作為(wei)重(zhong)(zhong)郵的(de)(de)(de)核心算(suan)力底座,支撐(cheng)起重(zhong)(zhong)郵的(de)(de)(de)大(da)數(shu)據智(zhi)能(neng)化(hua)研究(jiu),切實推(tui)動(dong)重(zhong)(zhong)慶(qing)(qing)市的(de)(de)(de)智(zhi)慧(hui)新(xin)(xin)基(ji)建發展與國家新(xin)(xin)一代人工(gong)智(zhi)能(neng)創(chuang)新(xin)(xin)發展試驗區建設。
以下為張清華院長演講實錄(節選):
數字世界來臨,數據成為生產資料
人(ren)(ren)(ren)工智能(neng)(neng)的(de)(de)(de)(de)(de)(de)三大要(yao)素(su)是(shi)(shi)算(suan)法、算(suan)力和數(shu)(shu)據(ju)(ju)(ju)。其中(zhong),數(shu)(shu)據(ju)(ju)(ju)是(shi)(shi)人(ren)(ren)(ren)工智能(neng)(neng)時代的(de)(de)(de)(de)(de)(de)生(sheng)產(chan)資料(liao)。那么我(wo)們(men)為(wei)什么進入數(shu)(shu)字(zi)世界(jie),被數(shu)(shu)據(ju)(ju)(ju)包圍?首先(xian)要(yao)提(ti)到(dao)(dao)的(de)(de)(de)(de)(de)(de)是(shi)(shi)計(ji)算(suan)機(ji)的(de)(de)(de)(de)(de)(de)發(fa)(fa)展,計(ji)算(suan)機(ji)令一切數(shu)(shu)字(zi)化(hua)成(cheng)(cheng)(cheng)(cheng)為(wei)可(ke)能(neng)(neng),也讓高效(xiao)計(ji)算(suan)成(cheng)(cheng)(cheng)(cheng)為(wei)可(ke)能(neng)(neng),我(wo)們(men)已經身處數(shu)(shu)字(zi)化(hua)進程中(zhong),是(shi)(shi)抵擋不(bu)住(zhu)的(de)(de)(de)(de)(de)(de)潮流。第二,網(wang)(wang)絡(luo)的(de)(de)(de)(de)(de)(de)發(fa)(fa)明讓機(ji)器的(de)(de)(de)(de)(de)(de)互聯互通成(cheng)(cheng)(cheng)(cheng)為(wei)可(ke)能(neng)(neng),讓信息高效(xiao)匯聚(ju)(ju)成(cheng)(cheng)(cheng)(cheng)為(wei)可(ke)能(neng)(neng)。第三,移(yi)動互聯網(wang)(wang)的(de)(de)(de)(de)(de)(de)發(fa)(fa)展使得我(wo)們(men)的(de)(de)(de)(de)(de)(de)數(shu)(shu)據(ju)(ju)(ju)從固定(ding)終端(duan)轉移(yi)到(dao)(dao)移(yi)動終端(duan),變為(wei)我(wo)們(men)的(de)(de)(de)(de)(de)(de)手機(ji)、iPad。第四,物(wu)聯網(wang)(wang)通過傳感器,使人(ren)(ren)(ren)與人(ren)(ren)(ren)之(zhi)間(jian)、人(ren)(ren)(ren)與物(wu)之(zhi)間(jian)、物(wu)與物(wu)之(zhi)間(jian)構建(jian)起萬物(wu)互聯的(de)(de)(de)(de)(de)(de)數(shu)(shu)據(ju)(ju)(ju)世界(jie),讓現(xian)實世界(jie)精確映射到(dao)(dao)數(shu)(shu)字(zi)世界(jie)成(cheng)(cheng)(cheng)(cheng)為(wei)可(ke)能(neng)(neng)。實際上我(wo)們(men)每個人(ren)(ren)(ren)都是(shi)(shi)數(shu)(shu)字(zi)世界(jie)的(de)(de)(de)(de)(de)(de)最(zui)基本要(yao)素(su)和數(shu)(shu)據(ju)(ju)(ju)生(sheng)產(chan)者,每個人(ren)(ren)(ren)都在數(shu)(shu)字(zi)世界(jie)上對自(zi)己(ji)進行畫(hua)像,最(zui)后匯聚(ju)(ju)成(cheng)(cheng)(cheng)(cheng)一個數(shu)(shu)字(zi)海洋,也就是(shi)(shi)我(wo)們(men)今天所說的(de)(de)(de)(de)(de)(de)“數(shu)(shu)字(zi)世界(jie)”。
在(zai)(zai)人(ren)(ren)類社會(hui)誕(dan)生前,世(shi)界(jie)(jie)上我(wo)只(zhi)有(you)一維空(kong)(kong)(kong)間(jian)(jian)(jian)(jian)(jian),即物(wu)(wu)理空(kong)(kong)(kong)間(jian)(jian)(jian)(jian)(jian)。有(you)人(ren)(ren)類社會(hui)后(hou),我(wo)們說(shuo)形(xing)成了(le)包含社會(hui)空(kong)(kong)(kong)間(jian)(jian)(jian)(jian)(jian)在(zai)(zai)內(nei)的(de)二(er)維空(kong)(kong)(kong)間(jian)(jian)(jian)(jian)(jian),現在(zai)(zai)我(wo)們給自己構(gou)(gou)造了(le)一個第三空(kong)(kong)(kong)間(jian)(jian)(jian)(jian)(jian),就叫數(shu)(shu)(shu)字(zi)(zi)空(kong)(kong)(kong)間(jian)(jian)(jian)(jian)(jian)。在(zai)(zai)三維空(kong)(kong)(kong)間(jian)(jian)(jian)(jian)(jian)里,除(chu)了(le)物(wu)(wu)理空(kong)(kong)(kong)間(jian)(jian)(jian)(jian)(jian)、社會(hui)空(kong)(kong)(kong)間(jian)(jian)(jian)(jian)(jian),還有(you)虛擬的(de)數(shu)(shu)(shu)字(zi)(zi)空(kong)(kong)(kong)間(jian)(jian)(jian)(jian)(jian)。數(shu)(shu)(shu)字(zi)(zi)世(shi)界(jie)(jie)現在(zai)(zai)正在(zai)(zai)逐漸形(xing)成,其基(ji)本要素就是數(shu)(shu)(shu)據,數(shu)(shu)(shu)字(zi)(zi)世(shi)界(jie)(jie)就是我(wo)們現實世(shi)界(jie)(jie)的(de)基(ji)本映射(she),有(you)人(ren)(ren)提(ti)出是孿生世(shi)界(jie)(jie)。我(wo)個人(ren)(ren)認為(wei),這(zhe)個映射(she)空(kong)(kong)(kong)間(jian)(jian)(jian)(jian)(jian)目前還不是孿生,未來可能(neng)構(gou)(gou)建從物(wu)(wu)理世(shi)界(jie)(jie)到數(shu)(shu)(shu)字(zi)(zi)世(shi)界(jie)(jie)的(de)雙生,可能(neng)那時候提(ti)“數(shu)(shu)(shu)字(zi)(zi)人(ren)(ren)”會(hui)更為(wei)準確。
數據科學作為第四范式
2013年被稱為大數(shu)(shu)(shu)據(ju)(ju)元年,后來國家(jia)每年都在制定(ding)計劃推(tui)動大數(shu)(shu)(shu)據(ju)(ju)發展,我們如(ru)何治理數(shu)(shu)(shu)據(ju)(ju)世界,如(ru)何應(ying)用數(shu)(shu)(shu)據(ju)(ju)世界?對應(ying)的(de)就需要(yao)處(chu)理數(shu)(shu)(shu)據(ju)(ju)的(de)科學(xue),因此,大數(shu)(shu)(shu)據(ju)(ju)戰略推(tui)出后,“數(shu)(shu)(shu)據(ju)(ju)科學(xue)”應(ying)運而生。
什么是數據(ju)科學(xue),我查(cha)了很多資料(liao),但(dan)是沒有(you)很準確(que)的(de)(de)定(ding)義(yi)。有(you)人這樣說(shuo)過,要成為一門科學(xue),背后一定(ding)要有(you)基礎(chu)理(li)論支撐(cheng)。我們(men)的(de)(de)人工智能發展得非常繁(fan)榮,然而,繁(fan)榮主要是在(zai)(zai)應用端。可以(yi)說(shuo),治理(li)數據(ju)的(de)(de)模型、方法(fa)都還在(zai)(zai)路上。現在(zai)(zai),應用實踐已經倒(dao)逼我們(men)做理(li)論研(yan)究、基礎(chu)理(li)論分析。
科學(xue)(xue)(xue)研究的(de)第一范式(shi)(shi)是(shi)實驗科學(xue)(xue)(xue),第二范式(shi)(shi)是(shi)理論科學(xue)(xue)(xue),第三范式(shi)(shi)是(shi)計算科學(xue)(xue)(xue),第四范式(shi)(shi)就是(shi)數(shu)據(ju)(ju)密集型科學(xue)(xue)(xue),也(ye)即(ji)“數(shu)據(ju)(ju)科學(xue)(xue)(xue)”,它以(yi)數(shu)據(ju)(ju)挖掘為依據(ju)(ju),也(ye)就是(shi)數(shu)據(ju)(ju)世界形成后我們(men)希望從數(shu)據(ju)(ju)當(dang)中獲取其(qi)本身蘊(yun)含的(de)規律(lv)和價值。然而,目前我們(men)在數(shu)字世界中能還原現(xian)實世界的(de)規律(lv),但是(shi)還沒有(you)發(fa)現(xian),數(shu)據(ju)(ju)世界本身的(de)新規律(lv)。
“數(shu)(shu)據(ju)科學”的特征我主(zhu)要說三個。第一是(shi)不(bu)(bu)在意(yi)數(shu)(shu)據(ju)的雜亂,而在意(yi)數(shu)(shu)據(ju)的量;第二是(shi)不(bu)(bu)要求(qiu)數(shu)(shu)據(ju)精(jing)準,而強調數(shu)(shu)據(ju)面面俱到。面面俱到的含(han)義不(bu)(bu)是(shi)涵蓋所有(you)(you)數(shu)(shu)據(ju),而是(shi)各個方面都要有(you)(you)代表性數(shu)(shu)據(ju),這(zhe)就離不(bu)(bu)開概率論支持。第三是(shi)不(bu)(bu)追求(qiu)因果(guo)關系,但重視(shi)統計規律。這(zhe)意(yi)味著不(bu)(bu)只追求(qiu)因果(guo)關系,更多在于追求(qiu)關聯關系。
科學(xue)研究(jiu)的(de)前三種范式(shi)都(dou)屬于(yu)知(zhi)(zhi)識(shi)(shi)范式(shi),它們的(de)重要特(te)征就是從數(shu)(shu)據特(te)征里面挖掘(jue)(jue)出(chu)能夠(gou)被我(wo)們理(li)(li)解(jie)的(de)知(zhi)(zhi)識(shi)(shi)。數(shu)(shu)據科學(xue)范式(shi)下,有(you)一(yi)個不一(yi)樣的(de)思(si)維方(fang)式(shi):我(wo)們是否(fou)可(ke)以(yi)挖掘(jue)(jue)出(chu)客觀存在但人類無法(fa)理(li)(li)解(jie)的(de)知(zhi)(zhi)識(shi)(shi)呢?數(shu)(shu)據科學(xue)的(de)內涵知(zhi)(zhi)識(shi)(shi),是否(fou)可(ke)以(yi)通過數(shu)(shu)字世界(jie)的(de)特(te)殊方(fang)式(shi)直接解(jie)決問(wen)題?我(wo)認為(wei)數(shu)(shu)據科學(xue)范式(shi)下挖掘(jue)(jue)出(chu)來知(zhi)(zhi)識(shi)(shi),可(ke)能我(wo)們理(li)(li)解(jie)不了,但是機器能理(li)(li)解(jie),這種規律應該(gai)是數(shu)(shu)據范式(shi)下我(wo)們去探索和思(si)考的(de)。
建設大數據試驗場驅動數據科學發展
要(yao)探(tan)(tan)索數(shu)(shu)(shu)據(ju)(ju)(ju)世界、治理數(shu)(shu)(shu)據(ju)(ju)(ju)世界,就必須發展“數(shu)(shu)(shu)據(ju)(ju)(ju)科學”,這是(shi)一(yi)個重要(yao)前(qian)提。每一(yi)個科學都(dou)需(xu)要(yao)探(tan)(tan)索,在(zai)探(tan)(tan)索過程中都(dou)需(xu)要(yao)做(zuo)試(shi)(shi)(shi)驗(yan)或者(zhe)實驗(yan)。試(shi)(shi)(shi)驗(yan)是(shi)探(tan)(tan)索,實驗(yan)是(shi)驗(yan)證。我想,最重要(yao)的(de)事情(qing)就是(shi)做(zuo)“大(da)數(shu)(shu)(shu)據(ju)(ju)(ju)試(shi)(shi)(shi)驗(yan)場”。大(da)數(shu)(shu)(shu)據(ju)(ju)(ju)試(shi)(shi)(shi)驗(yan)場想做(zuo)的(de)就是(shi)驅動(dong)數(shu)(shu)(shu)據(ju)(ju)(ju)科學發展,探(tan)(tan)索數(shu)(shu)(shu)字世界的(de)奧(ao)秘,換一(yi)個角度看世界。
為什么要(yao)(yao)建大數(shu)(shu)據試(shi)驗場呢(ni)?因為數(shu)(shu)據孤島的(de)存(cun)在,我(wo)們(men)現在的(de)一(yi)些(xie)數(shu)(shu)據挖掘(jue)方法(fa),只能挖到(dao)一(yi)些(xie)很低端的(de)淺(qian)層(ceng)次(ci)的(de)數(shu)(shu)據,更深層(ceng)次(ci)的(de)怎樣進行挖掘(jue),需(xu)(xu)要(yao)(yao)新(xin)的(de)挖掘(jue)方法(fa)和新(xin)的(de)理論,就(jiu)需(xu)(xu)要(yao)(yao)建設試(shi)驗場。做(zuo)一(yi)個比較淺(qian)顯易懂的(de)對(dui)比方式,試(shi)驗場跟礦(kuang)場是類(lei)似的(de)。
目(mu)前,重郵正在(zai)(zai)建(jian)設“大數(shu)據試驗場”,我們建(jian)設大數(shu)據試驗場的目(mu)的是探索數(shu)據科學本身的內涵、探究數(shu)據科學本身規(gui)律,然后引導(dao)產業(ye)創新,引導(dao)行業(ye)的發(fa)展。我們在(zai)(zai)浪潮(chao)等一些知(zhi)名企業(ye)的指導(dao)下(xia),構(gou)建(jian)了千(qian)萬元(yuan)級(ji)的算力(li)(li)(li),但(dan)長期目(mu)標是打造示范性算力(li)(li)(li)基礎設施,構(gou)建(jian)大數(shu)據試驗場基礎設施,在(zai)(zai)高(gao)校中打造算力(li)(li)(li)平臺的典范,為(wei)重慶市實施大數(shu)據智能化(hua)發(fa)展作(zuo)出貢獻(xian)。
最后(hou),歡迎(ying)大家(jia)到(dao)重郵來,也對本次2020浪潮云數智峰會的召開(kai)表示祝賀,謝謝大家(jia)!