「邊際實驗室」機器學習的金融應用第一講:概述

概述

投資公司越來越多地在投資管理各個步驟中使用前沿技術,不論是從提高對客戶的認知程度、發現市場新的Alpha來源,還是更高效地進行二級市場交易。機器學習是這些技術的核心部分,這類技術於1990年代首次出現在金融領域,此後隨著數據爆炸性增長和計算能力的提升而發生瞭蓬勃發展。

我們在後續的一系列課程中將會對機器學習進行講解,主要包括一些關鍵的機器學習算法及其投資應用。作為金融從業者,我們應該具備對機器學習的基本理解,瞭解相關的算法原理以及可以與機器學習和數據專傢交流的詞匯。盡管金融從業者無需掌握機器學習的細節和相關數學知識,但如果你想成為投資領域的專傢,你應當熟悉模型的算法,瞭解模型輸入和模型輸出的原理,並知道如何將輸出轉換為投資操作。

「邊際實驗室」機器學習的金融應用第一講:概述

機器學習與投資管理

數據量的爆炸性增長,以及這些數據所帶來的經濟價值不斷提高,激發瞭數據科學的快速發展。這個新晉的發展領域結合瞭數學、計算機科學和業務分析等方面。它還會朝著機器學習的新方向發展:從映射變量之間關系的基礎學習到模仿吸收、排序和適應等過程的高級神經網絡。

機器學習對投資管理具有理論和實踐意義。例如,機器學習可能會重塑人們對資產風險溢價的認知,並重新配置投資管理的業務流程。

目前,大型數據集和學習模型已經在影響投資管理實踐,從客戶分析、資產分配、股票選擇、投資組合構建、風險管理到交易等各個流程。

機器學習貫穿資產和財富管理價值鏈的每個步驟。聊天機器人從與投資者的互動中學習到基本的儲蓄等問題。機器學習方法生成alpha信號,通過創建單個時間序列的非線性預測,或者從一組預定義因子中派生出預測,甚至從現有或新發現的數據中自行選擇輸入信號。例如,使用文本分析的研究人員發現,年度和季度財務報告的同比變化,尤其是管理層討論或風險部分的一些負面變化,可以對股票的收益帶來強烈的負效應。

機器學習方法可以根據客戶限制計算目標投資組合的權重,還可以通過使用主成分分析減少可解釋變量的數量。研究表明,機器學習在構建投資組合中的表現優於均方差優化。機器學習技術已經可以使用非線性交易算法創建更好的訂單流管理工具,從而降低瞭實施投資組合決策的成本。這些發展同時導致瞭自動化工具、自動化流程和算法自動化業務(如機器人咨詢)的發展。

機器學習的定義

統計方法和機器學習技術都是通過對結果的分析觀察揭示一些內在的過程。但是,兩者的假設、術語和分析過程是不同的。統計方法依賴於基礎假設和明確的模型,例如觀察到的樣本被假設為服從指定的概率分佈。但是這些先驗的限制性假設在現實中可能會失效。

相反,機器學習沒有這種限制。機器學習通過對大量數據的分析,從中提取有用的知識。機器學習算法的目標是通過對已知示例進行概括(即“學習”)來確定數據中的基礎結構,從而使決策過程自動化。這其中的重點在於該算法無需任何人工幫助即可從數據中生成結構或預測的能力。機器學習的基本方法可以概括為“找到模式,應用模式”。

與統計方法相比,機器學習技術能夠更好地處理具有多個變量(高維)或高度非線性的問題。機器學習算法特別擅長檢測變化,即使在高度非線性的系統中也是如此,因為它可以檢測模型中斷的前提條件或預測狀態轉換的可能性。

機器學習大致分為三類技術:監督學習,無監督學習和深度學習。我們會在第二講介紹。

「邊際實驗室」機器學習的金融應用第一講:概述

Published in News by Awesome.

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *