机器学习在量化投资中的趋势和应用

 admin   2022-09-01 00:47   136 人阅读  0 条评论

起源SSRN
做者Sophie Emerson, Ruairi Kennedy, Luke O’Shea, and John O’Brien
机械学习是人-工智能的一位子领域,他运用统计技术为盘算机模子供应从数据集学习的才气,允许模子在有无展现编程的情形下实行特定任-务吖。近些年来,机械学习技术激增,人们对其在金融领域的运用也越发感兴趣吖。在投资治理中,已被运用于新闻的心情份析.趋向剖析.投资组合优化.危害建模等吖。那么,机械学习在量化投资中有哪些隐藏运用吗?
1.罕见的机械学习算法
机械学习算法主要有三种监视学习.无监视学习和美化学习吖。监视学习是在已知输入和输入的情形下训练出一位模子,将输入映照到输入吖。无监视学习是运用无记号的数据,从中觉察潜伏的形式信息吖。美化学习是使算法依照以前经验的反映,通过试错进前学习吖。美化学习与无监视学习一样,没必-要要记号数据吖。半监视学习,则结合了监视学习和无监视学习,运用了有记号的数据和无记号的数据来训练模子,这在数据有限或者运用有记号数据的历程中应该有误差的情形下十分有利益吖。
监视学习的主要钻研领域是回归和分类,这类办法平时运用于开拓预料模子吖。回归技术运用线性回归.决定树和人-工神经网络(ANN)之类的算法来预料连续照应啊;分类技术则运用思维回归.支持向量机(SVM)或者K-最近几天邻(KNN)等算法来预料分散照应吖。无监视学习的主要钻研领域是聚类,聚类是根据给定的相似性将数据分组,使得同组数据相互相似,而区别组数据不相似吖。
人-工神经网络(ANN)已变成机械学习进展的主要技术吖。首次提出仍然在七十多年前,灵感来源于人类脑袋的运做吖。你们是在神经元层面复制动物脑袋历程的算法会合吖。
人-工神经网络有许多种,包罗卷积神经网络(CNN).重复神经网络(RNN)和递归神经网络等吖。卷积神经网络(CNN)是图像分类和视频处置的理想选择,由于你们能通过聚焦图像片断来识别形式吖。重复神经网络(RNN)则更适合处置语音或者文本剖析之类的,由于你们使用时刻序列信息,比如使用每一月股价数据来预料下个月的数据吖。变成式反抗网络(GAN)自2014年头次推出以来,引起了人们极大的兴趣吖。变成式反抗网络(GAN)由两个相互竞赛的神经网络组成,一位神经网络变成与训练数据集相似的数据,另一位神经网络则分辨数据是来源训练数据集仍然变成网络吖。
除神经网络外,另有其他人-工智能算法,包罗SVM.KNN吖。这个内里,SVM用于分类和回归剖析,追求n纬空-间中差异超平面最近几天的一组数据点吖。贝叶斯网络是依照几率疏散构建的,运用几率规则举行预料和十分检测吖。KNN则选择训练数据会合最近几天的数据点,算法以相似的办法对以后的数据输入举行分类吖。主要的是,评价算法的有用性,可帮-助你在以后的运用和钻研中选择适合的算法吖。
2.量化投资的演化
1929时光尔街崩盘后,Graham and Dodd 著做的《证券剖析》(Security Analysis)于1934年出书,是关于基本面投资的首创性著做,至今仍在出书吖。他是刚最先将投资与投契举行分辩的书籍,提议运用体制的证券剖析框架来选股吖。
1952年出书的《投资组合选择》(Portfolio Selection),提出了投资组合构建微危害剖析的体制办法吖。书中,Markowitz将危害的界说为收益的标-准差吖。该办法偏重于通过优化危害和谢之中的权衡来最大化投资组合收益,这是当代投资组适当-论的基本,为投资组合的构建和剖析供应了框架吖。
随着盘算机技术的提高,搜集和剖析大量市场数据变成应该,市场剖析的量化办法也越发受迎接吖。这使得市场模子的开拓和检查到达了亘古未有一些范围,对领会金融市场做出了重-大奉献,包罗资源资产订价模子(CAPM)和有用市场假说(EMH)吖。
1973年,Fama 和 MacBeth 使用证券价钻研中心(CRSP)的金融数据集(首批这类数据集)对CAPM举行了实证剖析吖。剖析讲明,CAPM在为市场数据的实证横截面剖析设定标-准的同时,为证券价的行-动供应了一位很好的定量相似值吖。
从Markowitz投资组合优化到CAPM.EMH和因子模子,量化投资者已讲明你们愿意吸收新的技术和计谋吖。将机械学习技术运用于金融的主亮点是,机械学习办法捕捉了数据中的非线性关系吖。在输入与输入不行正比的情形下,必-要运用非线性办法对数据举行建模,许多传统的剖析办法假设线性关系,或者能够简化为线性模子的非线性模子吖。典型的非线性机械学习办法包罗KNN和ANN吖。
机械学习已运用于量化投资的多个领域,包罗投资组合优化.因子投资.债券危害可预料性.衍生品订价.对冲和拟合和回测,都获取了很好的成就吖。
3.罕见的机械学习案例和算法(学术文献在文末)
表1展现了学术报-告中重复出-现的主题,出-现次数最多的是谢预料.投资组合构建.危害建模吖。
表2展现了在这三个主题下区别机械学习算法出-现的频率吖。

(1)投资组合构建
投资组合构建是结合谢预料微危害模子,在给定投资者约束条件的情形下建立最优投资组合的历程吖。种种ANN办法被运用于投资组合优化,平时优于传统的优化技术吖。在投资组合构建的布景下,深度学习在这次寻找中频频出-现吖。深度学习是指由非线性信息处置的多个层或者阶段组成的模子(比如,拥有许多潜伏层的神经网络)吖。运用条理聚类和美化学习来改良投资组合多样化吖。多篇论文还讨论了运用马尔可夫(Markov)模子预料股体现的办法吖。马尔可夫模子是一种对随时刻随机转变得变量举行建模的机械学习办法吖。全世界市场的繁杂性使得运用这类形式变成一种可行的选择吖。
(2)谢预料
谢预料,即预料资产或者资产种别的投资谢,是投资治理的焦点,在文献中占领重要职位吖。尝试了许多种别的ANN预料收益的才气吖。深度神经网络.CNN.LSTM都被运用于收益预料吖。第一种,新的机械学习技术被运用于改良传统输入预料(如基本会计数据或者技术指-标)吖。第两种,运用机械学习从可选数据中提取新的输入,比如从新闻数据中提取情感吖。最终,做者在市场层面而不-是在单个证券层面预料消息,比如运用机械学习来识别吖。
(3)危害建模
在危害的大题目下一定了三个区别的主题吖。第一位主题尝试运用机械学习来改良均值方差框架中运用的传统危害器量吖。第两个主题是追求有失约或者倒闭危害的公司,自-然语言处置等技术用于识别表现较高危害的词语吖。最终一位主题则是运用机械学习来开拓对冲计谋,一些做者着眼于一定哪种机械学习办法的选择最适合危害建模疑吖。
随着新器械和技术的出-现,种种机械学习办法已普遍运用于量化投资领域,最盛行的办法是MLP,次要是SVM和LSTM吖。机械学习已运用于谢预料.投资组合构建微危害建模等领域吖。这些机械学习办法使用传统的金融数据,和新种别的替换数据吖。大数据现在供应必-要剖析的新数据,而机械学习技术能够或者者对繁杂(非线性)关系建模并剖析新数据吖。
值得注重的是,传统对冲基金雇佣越发多的STEM结业生负-责投资组合构建职位,由于你们具有繁杂剖析和盘算机建模所需的数学技术吖。因此,对机械学习的认知,和构建繁杂模子所需的语言和框架,对量化投资来说全是有益的吖。

案例剖析援用的文献


本文地址:http://51ac.top/post/8996.html
版权声明:本文为原创文章,版权归 admin 所有,欢迎分享本文,转载请保留出处!

 发表评论


表情

还没有留言,还不快点抢沙发?