亚洲在线日韩伦理片,96精品国产AⅤ一区二区,青鸟影视网,yy黄色频道,国内精品久久久精品AV电影院

巔峰對決,獲獎選手經驗揭秘:強化學習創新創意大賽圓滿收官

南京(jing)2022年(nian)11月4日 /美通社/ --  近(jin)日,江蘇省人工智能學會上海數字大腦研究院南棲仙策共同發起的強化學習創新創意大賽結果出爐

賽事回顧

強(qiang)(qiang)化(hua)(hua)學(xue)習(xi)創新(xin)創意(yi)大賽,旨在激(ji)發(fa)強(qiang)(qiang)化(hua)(hua)學(xue)習(xi)技術的應用(yong)創新(xin),不設具體賽題(ti)。鼓(gu)勵選(xuan)手了解強(qiang)(qiang)化(hua)(hua)學(xue)習(xi)的機制(zhi)原理、掌握強(qiang)(qiang)化(hua)(hua)學(xue)習(xi)的任務建模、發(fa)掘強(qiang)(qiang)化(hua)(hua)學(xue)習(xi)落地場景、展(zhan)現強(qiang)(qiang)化(hua)(hua)學(xue)習(xi)的創新(xin)應用(yong)價(jia)值。

大賽自(zi)6月17日(ri)開賽以(yi)來吸引國內(nei)外高等院(yuan)校(xiao)、科研單位(wei)、企業單位(wei)負責人等數(shu)百(bai)人參與其中。

大賽經初(chu)賽、復(fu)賽兩輪,4個月的(de)激烈角逐(zhu)之后,最(zui)終經由(you)學術專(zhuan)家(jia)和(he)產業(ye)專(zhuan)家(jia)共同評選出12支獲(huo)獎(jiang)隊(dui)伍(wu)。其中4支隊(dui)伍(wu)分別斬獲(huo)"最(zui)佳(jia)(jia)項目獎(jiang)"、"最(zui)佳(jia)(jia)實踐獎(jiang)"、"最(zui)佳(jia)(jia)創意獎(jiang)"、"最(zui)佳(jia)(jia)社會價值獎(jiang)";8支隊(dui)伍(wu)獲(huo)得"優秀項目獎(jiang)"。

獲獎選手 Talk Time


獲獎(jiang)隊伍(wu)

最佳項目獎:止于至善隊

"基于強化學習,實現分布式能源系統的智能決策未來是可行的。"

"目前國內(nei)外的分布式(shi)能(neng)源管理(li)(li)平(ping)臺(tai),雖(sui)然在(zai)數據感知層(ceng)(ceng)大量使用了(le)人(ren)工智能(neng)技術,但在(zai)決策(ce)層(ceng)(ceng)還是基于(yu)傳統的優化(hua)算法。這些算法受限于(yu)計算精度和(he)實時(shi)性(xing)不能(neng)兼得(de),而且很(hen)難(nan)處理(li)(li)新能(neng)源帶來的波動性(xing)和(he)隨(sui)機性(xing)問題。而強化(hua)學習(xi)可以處理(li)(li)這些問題。"

隊長侯勝任來(lai)自(zi)荷(he)蘭代爾夫特(te)理工大(da)(da)學(xue),吳明賀、顏子恒來(lai)自(zi)東南大(da)(da)學(xue)。為(wei)應(ying)對全球(qiu)氣候變暖和能源(yuan)危機,這支隊伍將強化學(xue)習應(ying)用(yong)于新能源(yuan)沖(chong)擊下的(de)(de)能源(yuan)管理系(xi)統,實現分(fen)布式能源(yuan)系(xi)統的(de)(de)智能決策,使能源(yuan)系(xi)統運(yun)(yun)行在(zai)高效、經濟、安全、可靠的(de)(de)運(yun)(yun)行區間。在(zai)滿足用(yong)戶需求的(de)(de)前提下,大(da)(da)幅度降(jiang)低(di)公(gong)司系(xi)統運(yun)(yun)行成本,為(wei)客戶創造更多的(de)(de)收益。

最佳創意獎:Brain Control隊

"我一直認為強化學習方法會為生命科學領域里的一些問題帶來突破。"

"本次(ci)獲獎(jiang)項目是我們團隊(dui)將(jiang)強化學習方法應用大腦疾病治療(liao)的一次(ci)嘗試,目的是為了更(geng)好地幫助醫生和病人選擇(ze)更(geng)合適的治療(liao)策略(lve),這不僅(jin)可以為病人帶來(lai)更(geng)優的治療(liao)效(xiao)果(guo),更(geng)可以釋放大量(liang)的醫療(liao)資源(yuan)。"

這是來自復旦大學的兩位博士生,李巖和權昭宇,他們將強化學習應用于自動化腦深部電刺激的參數調節。也就是通過強化學習自動尋找個性化的最優刺激參數,產生最優的疾病治療方案。
這項技(ji)術(shu)在(zai)未(wei)來(lai)將有(you)機會在(zai)面(mian)向帕金森、癱(tan)瘓、癲癇和抑(yi)郁癥等的疾(ji)病治療中(zhong)發揮(hui)巨大作(zuo)用。減(jian)輕病人的痛苦,減(jian)少醫(yi)生(sheng)的工作(zuo)量。

最佳社會價值獎:Traffic Go隊

"作為交通從業者,我非常渴望能夠攻堅克難,打造適用于我國的先進城市交通優化控制與緩堵平臺。"

這是來自同濟大(da)學(xue)的博士(shi)后王一喆,他(ta)對被稱為"交通(tong)工程(cheng)領域王冠(guan)上的明珠"的世界性(xing)難題(ti):交通(tong)控制和緩解擁堵 發起挑戰(zhan)。

基于(yu)強(qiang)化(hua)學習的交(jiao)通控(kong)制(zhi)算(suan)法及(ji)機制(zhi),他通過構建可(ke)復用性(xing)強(qiang),自(zi)動化(hua)程度高的關鍵(jian)特征提取程序(xu);搭建層次分明,易于(yu)查詢的數(shu)據結構,即使(shi)面(mian)對隨機性(xing)強(qiang),波(bo)動性(xing)大且呈非線性(xing)變(bian)化(hua)的復雜(za)城市道路交(jiao)通狀況,也可(ke)以(yi)獲(huo)得更(geng)高的可(ke)測性(xing)和可(ke)控(kong)制(zhi)性(xing)。

最佳實踐獎:穿梭在銀河的火箭隊

"希望能幫助更多人縮減決策時間,讓人們將時間用在有更有價值的地方。"

"通過(guo)本次比賽,我們更加堅信了強化(hua)學(xue)習在決(jue)策領(ling)域(yu)巨大的(de)潛力,希望能將學(xue)到的(de)知識應用(yong)于實踐,同時幫助大家理(li)解機器決(jue)策過(guo)程(cheng)中(zhong)每一步的(de)含義,也就(jiu)是為什么這樣做,能夠(gou)帶(dai)來(lai)更高的(de)收(shou)益。"

這支隊伍的陳濤,史晨佳(jia)和(he)任智軍老師來自(zi)于上海商學院,他(ta)們(men)聚焦個體(ti)(ti)投(tou)(tou)資者和(he)機構(gou),提供完整高效可行的投(tou)(tou)資交(jiao)(jiao)易策(ce)略(lve)。他(ta)們(men)的項目對中(zhong)國(guo)的A股(gu)市(shi)場的環境和(he)數(shu)據進行建模,將(jiang)深(shen)度強化(hua)學習應用到金融領域,使用智能體(ti)(ti)模擬(ni)交(jiao)(jiao)易員,在A股(gu)市(shi)場中(zhong)進行選股(gu)和(he)擇時交(jiao)(jiao)易,讓決策(ce)更優越、更簡(jian)單。

在(zai)項(xiang)目(mu)進(jin)行(xing)到中后(hou)期,為了(le)節省(sheng)算(suan)力和時間,他們在(zai)REVIVE平臺(tai)(tai)進(jin)行(xing)了(le)多智能(neng)體模型(xing)的訓練(lian)。"不(bu)得(de)不(bu)說,「仙啟」的表(biao)現真的遠超團隊(dui)預期,只需要少量的代碼(ma)便可以進(jin)行(xing)實操,這也極(ji)大的彌補了(le)團隊(dui)在(zai)多智能(neng)體模型(xing)上(shang)編碼(ma)能(neng)力不(bu)足的缺陷(xian),早點使用該平臺(tai)(tai)也許(xu)項(xiang)目(mu)進(jin)度會快很(hen)多。"

該項(xiang)目(mu)在(zai)"東方財富杯(bei)"全國大學(xue)生金融挑戰賽 進行(xing)了落地驗證,以總收益20.93%戰勝了全國98%的選手。為他們高(gao)興!

在實際場景中的落地

南棲向(xiang)參賽選手們提供(gong)了REVIVE [仙啟](//revive.cn/)在實際場景中的(de)落地。

南棲向參賽選(xuan)手們提供了REVIVE「仙(xian)啟(qi)」幫助選(xuan)手還(huan)原現實場(chang)(chang)景,構建無限接近真實的虛(xu)擬環境,在(zai)這個(ge)環境中進行策略(lve)驗證和(he)對比,獲(huo)得最(zui)(zui)終(zhong)可(ke)遷移(yi)到(dao)實際應用(yong)中的最(zui)(zui)佳策略(lve)。)幫助選(xuan)手還(huan)原現實場(chang)(chang)景,構建無限接近真實的虛(xu)擬環境,在(zai)這個(ge)環境中進行策略(lve)驗證和(he)對比,獲(huo)得最(zui)(zui)終(zhong)可(ke)遷移(yi)到(dao)實際應用(yong)中的最(zui)(zui)佳策略(lve)。


仙(xian)啟官(guan)網://revive.cn/

此(ci)外(wai),感謝張偉楠、安波(bo)、張哲(zhe)先、俞揚等教授和老師,抽出(chu)寶貴時間,為選手們提供(gong)了(le)一對(dui)一的指(zhi)導(dao)和講座。

為了(le)讓更多對強化(hua)學(xue)習應用感(gan)興趣(qu)的人(ren)從本(ben)次大(da)賽中獲益(yi),主(zhu)辦方在南棲仙策(ce)B站官方賬號上公開了(le)部分(fen)講座(zuo)內容,點擊觀看講座(zuo)視頻。

大賽還涌現出了一批精彩的應用場景和項目,讓我們一起來看(kan)看(kan)獲獎名單。


優秀項目

誠(cheng)如張偉楠老師在講座中所言,強(qiang)化學習所對(dui)標的決策智能擁有非常(chang)廣闊的市(shi)場,因(yin)為(wei)在任何一個行業,一旦(dan)有決策優化的需求(qiu),就有可能使(shi)用到強(qiang)化學習技術。

讓我們共同期待,在未來,更多的人能夠借助強化學習的力量改變世界。

消息來源:南棲仙策(南京)科技有限公司
能動
微信公眾號“能動”發布全球能源、化工、采礦、動力、新能源車企業最新的經營動態。掃描二維碼,立即訂閱!
collection