初步嘗試:力學和數據科學的融合

初步嘗試:力學和數據科學的融合

當今是數據的時代,數據科學居於顯赫地位。力學學者該如何順應這個時代,而不是置身時代之外,這是一個值得我們思考的問題。投身於時代之中,可能大展宏圖;遊離於時代之外,必將喪失難逢的機遇。

近期,浙江大學王永副教授和亞利桑那州立大學薑漢卿教授課題組共同發展瞭一種新的數據驅動方法,該方法通過離散噪聲數據直接獲得經典物理及力學問題的變分律。這項工作剛發表於Journal of Mechanics and Physics of Solids. 下面就對其基本思路、實現方法做一簡單介紹。

數據科學的核心是算法,或者說是優化方法。將數據科學成果應用於指導力學學科的研究已經取得瞭一些最新的研究成果。例如:貝葉斯機器學習指導下的超材料設計方法1,異質材料塑性特性的數據驅動模型2,以及應用遞歸神經網絡的歷史和路徑依賴現象預測方法3 等。同時,也有一些工作利用數據來識別物理系統的代數不變量和微分方程,主要包括符號回歸和稀疏回歸兩類方法。

一般而言,在數據科學中,為瞭能較好地描述已有數據,特別是能給出較準確的預測數據,需要大量數據以作訓練和檢驗之用。那麼依據數據所建立的模型如果過於簡單,其模型外延性存疑;如果模型過於復雜則會過擬合。這是基於數據且僅基於數據的方法的本質缺陷,所以很難在數據科學的自身范疇內解決。

和數據方法對立的是理論方法。與數據方法追求結果的有效性不同,理論方法追求體系的完美性和結果的可解釋性。在這項工作中,作者試圖用理論指導的數據方法4(如圖1所示),將理論知識與數據相結合,從而不再是盲目的數據分析,而是部分地有目的的數據分析。

初步嘗試:力學和數據科學的融合

圖1. 數據與理論知識的關系4

具體做法是:將變分原理(知識)與數據方法(數據)相結合,在變分原理的框架下應用數據驅動方法,識別出物理系統的變分律。這種從時域和空間域離散數據出發,識別物理系統變分律的方法,與從物理系統變分律出發,計算時域和空間域離散數據的有限元方法,構成瞭互逆過程。因此該方法也可被視為“逆有限元方法”5(如圖2所示)。

初步嘗試:力學和數據科學的融合

圖2. 有限單元方法 vs. 變分框架下的數據驅動方法

圖3給出瞭該方法的具體操作步驟5。

初步嘗試:力學和數據科學的融合

圖3. 物理變分律自動化識別的數據驅動方法流程圖

概言之,針對具體物理系統,作者在變分框架下設定變分模式(知識I),其中待定的時域積分式則通過數據方法給出(數據)。進一步地,結合量綱匹配原則(知識II),從具有不同物理屬性值的同一系統的離散數據出發,應用數據方法可給出顯式包含物理屬性的積分式表達式。得到瞭具不同參數值的同一物理系統的時域積分式後,亦可通過符號回歸方法,得出顯式包含物理屬性的積分式。該方法成功識別瞭自由落體、電場中的相對論粒子、van del Pol系統、Duffing 系統、二自由度耗散系統和連續體系統的變分律5(如圖4所示)。文中也討論瞭這種方法對數據量的敏感性,對數據質量(即噪聲)的魯棒性。由於該方法在處理時域積分時,可以在滿足時域端點變分為零的前提下任意選取變分模式,因此,在不需要大數據量和有一定噪聲的情況下,也可以得到令人滿意的識別結果。

初步嘗試:力學和數據科學的融合

圖4. 數據驅動方法識別的變分律匯總

這項工作以理論指導的數據方法重做瞭開普勒等科學巨匠做的工作。科學巨匠們以天分和勤奮識別出物理律;而理論指導的數據方法則舍棄瞭對天分的要求,經由規范的步驟給出瞭一致的結果。具體到力學變分律,Landau物理學力學卷就是從變分框架開始,而其中的時域積分式則通過伽利略變換從理論上逐步導出6;Feynman在其物理學講義中則指出,確定此時域積分式需應用試錯方法,不斷測試直至滿意7。這項工作則擯棄瞭其中最難的部分,在變分框架下以規范的方式解決瞭問題。

這項工作嘗試瞭將力學原理與數據科學相結合的可能性。作者寄望這個初步的工作能夠聯接力學和數據科學兩個學科:不僅是將數據科學成果用於力學問題研究,同樣也可以由力學理論來指導數據科學的研究。

參考資料

1. Bessa, M.A., Glowacki, P., Houlder, M. (2019). Bayesian machine learning in metamaterial design: Fragile Becomes Supercompressible. Advanced Materials, 31(48), 1904845.

2. Liu, Z., Bessa, M.A., Liu, W.K. (2016). Self-consistent clustering analysis: an efficient multi-scale scheme for inelastic heterogeneous materials. Computer Methods in Applied Mechanics and Engineering, 306, 319-341.

3. Mozaffar, M., Bostanabad, R., Chen, W., Ehmann, K., Cao, J., Bessa, M. A. (2019). Deep learning predicts path-dependent plasticity. Proceedings of the National Academy of Sciences, 116(52), 26414-26420.

4. Karpatne, A., Atluri, G., Faghmous, J.H., Steinbach, M., Banerjee, A., Ganguly, A., Shekhar, S., Samatova, N., Kumar, V. (2017). Theory-guided data science: a new paradigm for scientific discovery from data. IEEE Trans. Knowl. Data Eng., 29, 2318-2331.

5. Huang, Z.L., Tian, Y.P., Li, C.J., Lin, G., Wu, L.L., Wang, Y., Jiang, H. (2020). Data-driven automated discovery of variational laws hidden in physical systems. Journal of the Mechanics and Physics of Solids. 137, 103871.

6. Landau, L.D., Lifshitz, E.M. (2000). Mechanics. Butterworth-Heinemann, Oxford.

7. Feynman, R.P., Leighton, R.B., Sands, M. (2010). Lectures in Physics. Basic Book, New York.

點擊https://www.sciencedirect.com/science/article/pii/S0022509619306246?via%3Dihub查看論文原文。

Published in News by Awesome.

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *