深(shen)(shen)圳2020年7月15日 /美通社/ -- 近期,大巖(yan)資(zi)(zi)本成立七周年慶在深(shen)(shen)圳成功(gong)舉辦。周年慶上量化投資(zi)(zi)基金經理黃鉑博士結合生活實踐中的案例,深(shen)(shen)入淺出闡釋了最優(you)化算(suan)法的前(qian)世今生。
從實際生活中(zhong)最(zui)基礎的應(ying)用(yong)(yong)切入(ru),黃鉑(bo)博士將抽象的算法(fa)概(gai)念生動化,解釋(shi)了什么叫(jiao)最(zui)優(you)化問題、凸優(you)化及算法(fa)分(fen)類、機器學習與人(ren)工(gong)智能應(ying)用(yong)(yong)。
黃博(bo)士的分享內容(rong)較長,我(wo)們將分上(shang)、中、下三篇(pian)連載推(tui)出,本文(wen)為上(shang)篇(pian)。
最優化問題及基礎應用
人生不如意之事十之八九,想達到我們想要達到的目標時,通常都有各種各樣的限制。那么所謂最優化問題,就是指用最優的方式去平衡理想與現實之間的關系。以簡(jian)單的(de)(de)郵差送(song)信(xin)問題(ti)為(wei)例,郵差從A出發,送(song)信(xin)到BCD,最后(hou)回(hui)到A。郵差每(mei)(mei)天必(bi)須經(jing)過(guo)BCD,而且每(mei)(mei)個(ge)點每(mei)(mei)天只能(neng)經(jing)過(guo)一次,在這(zhe)樣(yang)的(de)(de)約束條件下,他的(de)(de)目標函數是盡可能(neng)以最短的(de)(de)時(shi)間(jian)(jian)完成送(song)信(xin)。這(zhe)個(ge)問題(ti)非常簡(jian)單,只要(yao)把所有的(de)(de)路徑(jing)枚(mei)舉出來,然后(hou)取(qu)最短時(shi)間(jian)(jian)的(de)(de)方式即可。
根據(ju)前面的(de)(de)例(li)子,我們(men)嚴格的(de)(de)將目標函數分為兩(liang)大類。第一類是最大化(hua),包括最大化(hua)盈利,最大化(hua)效率(lv)。另一類是最小(xiao)(xiao)化(hua),包括最小(xiao)(xiao)化(hua)費(fei)(fei)用、時間和錯(cuo)誤(wu)率(lv)。在(zai)金融行業,我們(men)可(ke)以(yi)(yi)(yi)最大化(hua)預測(ce)股價的(de)(de)正確率(lv),也可(ke)以(yi)(yi)(yi)最小(xiao)(xiao)化(hua)費(fei)(fei)用、最小(xiao)(xiao)化(hua)時間和錯(cuo)誤(wu)率(lv)。當然,我們(men)可(ke)以(yi)(yi)(yi)同時最大化(hua)盈利,最小(xiao)(xiao)化(hua)費(fei)(fei)用和時間。所以(yi)(yi)(yi)通常(chang)在(zai)很多的(de)(de)優化(hua)問題中,這兩(liang)種任(ren)務(wu)可(ke)以(yi)(yi)(yi)組合起來(lai)出現(xian)在(zai)同一個問題框架下(xia),這就是對于目標函數的(de)(de)定義。
最優化問題的兩大類:連續優化與離散優化
關于(yu)(yu)約束條(tiao)件,理想很美好(hao),現實很骨感,在現實生活(huo)中(zhong),我們(men)會遇到比如(ru)預算有限、時(shi)間(jian)有限、外(wai)部強制(zhi)性條(tiao)件等各(ge)種各(ge)樣的問題(ti),與目標函數(shu)一(yi)(yi)樣,這(zhe)些(xie)限制(zhi)條(tiao)件不是(shi)單(dan)(dan)一(yi)(yi)存在的,也可(ke)能同(tong)時(shi)存在同(tong)一(yi)(yi)個問題(ti)里,對于(yu)(yu)某一(yi)(yi)個優(you)(you)化(hua)(hua)問題(ti)來(lai)講,限制(zhi)條(tiao)件越(yue)復雜(za),求解就越(yue)困(kun)難。基于(yu)(yu)此,我們(men)簡單(dan)(dan)根據它的約束條(tiao)件以(yi)及目標函數(shu)變量(liang)類型將最優(you)(you)化(hua)(hua)問題(ti)分(fen)成兩大(da)類,連續優(you)(you)化(hua)(hua)和離散優(you)(you)化(hua)(hua)。
連(lian)續優(you)(you)化(hua)正如(ru)(ru)圖上所畫,線中間沒(mei)有(you)斷點,而(er)離(li)散優(you)(you)化(hua)的變量(liang)取值,是(shi)一(yi)(yi)個不連(lian)續的記錄,就如(ru)(ru)同一(yi)(yi)開始講的郵差送信問題。兩類相較而(er)言,離(li)散優(you)(you)化(hua)會更難解決,因(yin)為離(li)散優(you)(you)化(hua)多(duo)(duo)了一(yi)(yi)條限制條件 -- 不連(lian)續的集(ji)合(he)。很多(duo)(duo)時候,我們要(yao)求我們的變量(liang)是(shi)一(yi)(yi)個整數,或(huo)者來自(zi)一(yi)(yi)個給定的區間,所以說(shuo)離(li)散優(you)(you)化(hua)會比(bi)連(lian)續優(you)(you)化(hua)更難解,而(er)兩種算法也會有(you)非常大的不一(yi)(yi)樣。
從學(xue)術角度而(er)言,連(lian)續(xu)優化與離散(san)優化對應的是兩個比較獨立(li)的學(xue)科,離散(san)優化可能更多的應用于統(tong)計、大數據相(xiang)關的場景,連(lian)續(xu)優化則會跟計算機(ji)密碼學(xue)相(xiang)關,更多的與我們現實生活中的運(yun)籌優化應用相(xiang)關。
從(cong)目標函數出發,它的最(zui)優(you)(you)(you)(you)值(zhi)也分(fen)為兩類(lei),局(ju)部(bu)(bu)最(zui)優(you)(you)(you)(you)和(he)全局(ju)最(zui)優(you)(you)(you)(you)。我(wo)們(men)看(kan)圖中(zhong)黃(huang)色的點(dian)(dian),在(zai)局(ju)部(bu)(bu)區域內是(shi)(shi)最(zui)低的,我(wo)們(men)管這個(ge)(ge)值(zhi)叫做(zuo)局(ju)部(bu)(bu)最(zui)優(you)(you)(you)(you)值(zhi),但是(shi)(shi)當我(wo)們(men)看(kan)整個(ge)(ge)圖時,紅色的點(dian)(dian)才是(shi)(shi)最(zui)低的,所以這個(ge)(ge)點(dian)(dian)我(wo)們(men)叫全局(ju)最(zui)優(you)(you)(you)(you)值(zhi)。通常來說,取局(ju)部(bu)(bu)最(zui)優(you)(you)(you)(you)值(zhi)是(shi)(shi)相較容易的,因(yin)(yin)為基本(ben)上你(ni)只需要看(kan)它臨近一小部(bu)(bu)分(fen)的信息就可以準確判斷是(shi)(shi)否局(ju)部(bu)(bu)最(zui)優(you)(you)(you)(you),而在(zai)現(xian)實(shi)應用中(zhong),其實(shi)僅(jin)僅(jin)知道(dao)局(ju)部(bu)(bu)最(zui)優(you)(you)(you)(you)值(zhi)就足以解決很多問(wen)題(ti)。而更(geng)難的問(wen)題(ti)在(zai)于全局(ju)最(zui)優(you)(you)(you)(you)值(zhi),因(yin)(yin)為前提是(shi)(shi)你(ni)需要看(kan)到(dao)整個(ge)(ge)畫面。
所以,對(dui)于這(zhe)一(yi)類(lei)問題(ti),我們目前(qian)沒(mei)有(you)一(yi)個(ge)特別(bie)好(hao)的解決方法。現(xian)實生(sheng)活中,我們會有(you)比較多的方法去(qu)求局(ju)部(bu)(bu)最優(you)值,而(er)往(wang)往(wang)我們找(zhao)到的幾乎跟(gen)實際上的全(quan)局(ju)最優(you)值不(bu)一(yi)樣。但有(you)一(yi)個(ge)問題(ti)是例外,這(zhe)類(lei)問題(ti)它(ta)具有(you)比較好(hao)的性質,只(zhi)要找(zhao)到局(ju)部(bu)(bu)最優(you)值,它(ta)就肯(ken)定是全(quan)局(ju)最優(you)值,這(zhe)類(lei)問題(ti)就叫凸優(you)化。(未完待續)