讀博后降維打擊數(shù)學(xué)建模!
文章來自知乎提問:如何評(píng)價(jià) 2021 年美國大學(xué)生數(shù)學(xué)建模競(jìng)賽?今年賽情如何?
來湊個(gè)熱鬧降維打擊美賽了,寫一寫前兩題的思路。2018年讀大二的時(shí)候拿了一次美賽H,現(xiàn)在已經(jīng)讀PhD了,再看當(dāng)時(shí)做的跟屎一樣。看了幾個(gè)回答發(fā)現(xiàn)很多人甚至對(duì)題目的理解都是錯(cuò)的,私以為比賽最重要的是解決問題,而不是堆砌一堆花里胡哨的很Fancy的方法。
A題
第一問:描述 breakdown of ground litter and woody fibers 在 ?fungal activity in multiple species of fungi 下的情況
要解決這個(gè)問題首先要搞明白用什么來量化分解情況?有什么影響分解的情況?fungal activity真菌活動(dòng)是什么?多種真菌到底是哪幾種?
介于我們不是養(yǎng)蘑菇專家,我們能獲取的信息基本都來源于A trait-based understanding of wood decomposition by fungi 這篇文章,下載下來看看有哪些信息。雖然我們不能抄襲論文里面的方法,但可以幫助我們了解一些基本概念。
在Introduction里面我們發(fā)現(xiàn)一句話:
Models traditionally used microbial biomass as a proxy of decomposer activity (3, 6), treating the microbial community as a single homogeneous group or a small number of functionally distinct pools (7).
傳統(tǒng)方法一般使用 microbial biomass 生物量來代表分解者活動(dòng),這個(gè)問題里面顯然fungi就是decomposer, 所以fungi的量應(yīng)該就代表這個(gè)問題里面的真菌活動(dòng)狀況。閱讀文章后,我們發(fā)現(xiàn)實(shí)驗(yàn)中的hyphal density(菌絲密度) 應(yīng)該就是對(duì)應(yīng)這個(gè)生物量。
To characterize the growth of each isolate, we quantified its hyphal extension rate and hyphal density (presented in ref. 34)
那么用什么來量化分解情況呢?論文里面是這樣說的:
Here, we explore which fungal characteristics predict wood decomposition rate across a range of common wood decomposer fungi.
就是wood decomposition rate。具體的,這個(gè)根據(jù)木塊被真菌吃掉的數(shù)量來計(jì)算的。
we measured the mass loss of wood blocks when colonized by each fungus to estimate a standardized wood decomposition rate
下一個(gè)問題是多種真菌到底有哪幾種? 從第二題要求往模型里面加入Fungi不同種類之間的相互作用,我們可以大體推測(cè)第一問不需要考慮多種fungi的內(nèi)部作用。
OK 第一問我們的思路已經(jīng)清楚了,題目想讓我們建立一個(gè)數(shù)學(xué)模型(回歸模型)來刻畫自變量(真菌的量fungi biomass)和因變量(分解率wood decomposition rate)的關(guān)系,這就是傳統(tǒng)方法的做法。我覺得在下面兩個(gè)文章有可能找到關(guān)于兩個(gè)變量之間關(guān)系的一些基本假設(shè)。
K. L. McGuire, K. K. Treseder, Microbial communities and their relevance for ecosystem models: Decomposition as a case study. Soil Biol. Biochem. 42, 529–535 (2010)
S. Manzoni, A. Porporato, Soil carbon and nitrogen mineralization: Theory and models across scales. Soil Biol. Biochem. 41, 1355–1379 (2009).
第二問:考慮不同真菌間的相互作用,在模型里面加入Fig1和Fig2的信息
首先搞明白上一問中的遺留問題,真菌到底有哪些類型? 在文章中我們發(fā)現(xiàn):
First, we use a database of 22 fungal traits previously measured in each of 34 wood rot fungi collected from a wide geographic range across North America (25, 34–36) to identify potential drivers of wood decomposition.
這里作者用了22種真菌特性進(jìn)行研究,那真菌特性是什么東西?為什么里面沒有出現(xiàn)真菌的類型?我們繼續(xù)從論文中探索,發(fā)現(xiàn)這么一句話:
However, in recent years, the development of traitbased approaches has begun to transform our understanding of broad-scale functional patterns. By linking traits to ecosystem functioning, these approaches have been used in plant and animal ecology to infer the functioning of novel communities without prior knowledge of the taxa that are present.
大概就是現(xiàn)在一種新的 traitbased 研究方法,在僅知道一群真菌的特性的情況下(不需要考慮他們的種類),就可以代替知道真菌的種類進(jìn)行研究。所以我們這一題的核心或許是不考慮具體的species,而是考慮一堆具有相同traits的不同類真菌(例如長得快的菌,抗凍的菌……等等),用他們的common trait作為種類的依據(jù)。
那么這些traits又是啥呢?從論文里我們發(fā)現(xiàn)這22種(2+11+9)traits可以分為三大類:
Hyphal extension rate and hyphal density reflect hyphal morphology and growth strategy,? ecological performance traits (11 in total) relate to combative ability.tolerance of a range of temperature and moisture conditions (25),? and finally, the production of oxidative and hydrolytic enzymes (9 traits) promotes nutrient acquisition from organic resources (26).
但要注意問題里面說了,我們只關(guān)注growth rate和moisture tolerance就好:
For this MCM Problem you should focus on just two traits of a fungus: the growth rate of the fungus and the fungus’ tolerance to moisture.
OK 那么問題明確了,這里我們需要加入growth rate和moisture tolerance到我們?cè)诘谝粏栔薪⒌囊辉貧w模型中,把它變成一個(gè)多元回歸模型,相當(dāng)于是在原來的傳統(tǒng)方法上,引入這篇論文里的方法,因此需要使用這篇文章的數(shù)據(jù):
https://www.pnas.org/lookup/suppl/doi:10.1073/pnas.1909166117/-/DCSupplemental
要注意你最后模型的結(jié)果,要對(duì)比一下原始論文里的Fig.3,看跟這個(gè)圖是不是一致。
第三問,分析模型,并刻畫不同種類真菌之間長期與短期的關(guān)系
第二問建完模型之后,分析下幾個(gè)自變量之間的關(guān)系(相關(guān)性和獨(dú)立性),看一看大概有什么關(guān)系,根據(jù)這些關(guān)系做一些統(tǒng)計(jì)分析。例如是否發(fā)現(xiàn)自變量之間存在此消彼長的情況,可以用不同菌之間的競(jìng)爭(zhēng)來解釋等等……
重要的是注意這幾點(diǎn):
長期與短期的動(dòng)態(tài)關(guān)系,要考慮他們的變化趨勢(shì)(可以參考時(shí)間序列中提取趨勢(shì)的方法)。考慮他們之間的競(jìng)爭(zhēng)關(guān)系,作者進(jìn)行了pair wise的競(jìng)爭(zhēng)對(duì)比在這篇文了的Combative ability數(shù)據(jù)里面。 檢驗(yàn) rapid fluctuations 對(duì)各個(gè)變量影響的sensitivity (引入噪聲進(jìn)行假設(shè)檢驗(yàn)) 分析氣候變化帶來的影響。此時(shí)再加入自變量溫度、濕度等指標(biāo)。要用到這篇論文里的Temperature and moisture niche數(shù)據(jù)。
……
后面兩問也需要用到前三問建立的回歸模型做一些預(yù)測(cè)。把基本概念搞清楚以后,思路就有了。
B題
B題看了半天,直接看不懂,先說說我對(duì)于題目的理解。
題目中出現(xiàn)了幾種對(duì)象:
EOC:理解為救援指揮中心,應(yīng)該是一些固定位置的站點(diǎn),但是Google沒搜到位置,也不知道是一個(gè)還是好多個(gè)。 SSA drones:帶攝像頭和傳感器的無人機(jī),用來監(jiān)視救火隊(duì)的,理解為在救火隊(duì)附近使用的無人機(jī)(理解為0距離,攝像頭一般看不了很遠(yuǎn)) Radio Repeater drones:帶中繼器的無人機(jī),用來幫助EOC和救火隊(duì)交流的無人機(jī),可以離救火隊(duì)遠(yuǎn)一點(diǎn)(20KM) Firefighters :救火隊(duì)
我搜了搜SSA是啥,下面有個(gè)解釋。情景感知是happening around you, at or near your physical location,應(yīng)該是觀測(cè)很近的那種。我覺得就像是美國特戰(zhàn)隊(duì)那種,自己拿著的小型無人機(jī)。
Situational Awareness is a concept closely involved with physical security information management (PSIM, see the white papers on this subject). It is usually defined as being aware of what is happening around you, at or near your physical location, or at some other location where you are supposed to be or where there are assets or people that you must protect.?
ref: https://www.titan-vision.com/pages/hot-topics/total-situational-awareness.html
幾個(gè)很疑惑的問題:
兩種無人機(jī)之間有沒有交流?在問題里面沒看到。 無人機(jī)從哪里開始飛? 是救火隊(duì)拿著到時(shí)候飛,還是從EOC飛過去?我覺得應(yīng)該是救火隊(duì)拿著飛,而且從下面的飛機(jī)懸停也可以大概推測(cè)。
大概推測(cè)一下情景是這樣的,K個(gè)帶中繼器的無人機(jī)懸停在距離EOC固定距離(20km)的圓內(nèi),保證加上救火隊(duì)的交流半徑(5km平地,2km市區(qū))能夠跟EOC交流。因?yàn)槊總€(gè)救火隊(duì)拿著一個(gè)SSA無人機(jī),所以直接把救火隊(duì)小組抽象為SSA,SSA是需要跟著救火隊(duì)移動(dòng)的。
你要買很多SSA無人機(jī),以及少量的帶中繼器的無人機(jī)。問題說帶中繼器和遙感的無人機(jī)一萬美金很貴,應(yīng)該是那種大型的用來運(yùn)輸東西的,SSA的小型無人機(jī)用來監(jiān)視的帶攝像頭那種,類似大疆的,Amazon搜搜應(yīng)該很便宜?
Akme Corporation's prototype WileE–15.2X hybrid drone is projected to cost approximately $10,000 (AUD) when equipped with either a radio repeater or video & telemetry capability.
損失函數(shù)可以定義一個(gè) 【失聯(lián)的SSA(救火隊(duì))數(shù)量】【沒有及時(shí)被救援的火場(chǎng)面積】 與 【買兩種無人機(jī)花的錢】的加權(quán),正好體現(xiàn)題目中要求的:
Your model should 【balance capability and safety】 with 【economics】,
你可以改變這三個(gè)權(quán)重去做trade-off,看看情況是什么樣。
然后我想到的約束有下面幾個(gè):
救火隊(duì)(SSA)的距離(5km平地,2km市區(qū))+ ?中繼器的距離(20km) 小于與EOC的距離 每個(gè)火點(diǎn)的多少距離內(nèi)需要至少1個(gè)救火隊(duì) (SSA)救火隊(duì)(SSA)趕到火點(diǎn)的時(shí)間需要小于K分鐘
這些約束不需要完全滿足,用拉格朗日松弛一下去求一個(gè)下界。
關(guān)于是不是SSA和中繼器都用一種無人機(jī),我傾向于不是使用一種無人機(jī),否則第一問balance經(jīng)濟(jì)和安全就沒法做了,只需要關(guān)注安全就好了。B題的思路是基于我理解正確的情況下,如果我理解的不對(duì),那么思路就是不對(duì)的,大家參考下吧。
第二問我的理解是,去隨機(jī)生成一些極端的大火情況,然后看第一問種哪些約束被打破了。根據(jù)那些打破的約束,看應(yīng)當(dāng)如何進(jìn)行調(diào)整。
……
我知道美賽對(duì)于沒有經(jīng)過系統(tǒng)科研訓(xùn)練的本科生很難很頭痛,但這也是這類比賽的意義所在,能夠在三天的時(shí)間內(nèi)專心獨(dú)自解決一個(gè)實(shí)際問題,是很痛苦但結(jié)束后會(huì)覺得很享受的事情。貼一句我很喜歡的爆裂鼓手的一句話:"If you want the fucking core part, earn it! "

推薦閱讀
歡迎長按掃碼關(guān)注「數(shù)據(jù)管道」
