量化投资是数据科学在金融行业的应用。
2023 年,量化行业的超额收益开始收敛,量化私募如何形成自身核心竞争力?
和鲸拜访客户鲲山科技(深圳),揭示其“弯道超车”的独家秘诀。
年初至今,鲲腾投资(鲲山科技全资子公司)在各类实盘大赛上屡屡上榜,漂亮的收益率曲线也让鲲腾成为了业内令人瞩目的一匹黑马。
但 CEO 刘亮告诉我们,没太大必要关注收益率,因为根据马尔科维茨的理论,想做多高的收益使用对应的杠杆就行,收益率的本质是杠杆。对于鲲腾的发展,刘亮觉得过去做得最正确、未来也要继续坚持的,是采取“集中优势兵力的群狼战术”。
“狼从来不是单独出击,而是群体作战,头狼统一指挥,团队互相配合。”刘亮如是说。按照“投资就是投人”的标准搭建团队,迄今为止,鲲腾已荟聚超 40+ 名优秀成员,海内外顶尖院校的学历背景对于量化行业而言确实只能算敲门砖,鲲腾对于成员的要求是——除了智商高,也要能证明自己能很好地利用智商解决现实中的问题。
除了人才招募,刘亮同时关注人才的培育,“校企合作是量化领域的常见模式,我们只是给这种模式的落地提供了更多形式”。成立至今,鲲腾与国内一众 985 高校、双一流高校建立了长期合作,从定期的量化讲座到量化实战课堂,从量化实验室的共建到人才联合培养,在助力量化行业构建人才生态的同时,也能为企业内部注入源源不断的“新鲜血液”。
头狼定义组织的深度,狼群定义组织的广度,策略亦然。商品期货、股票量化主流策略全覆盖,不断拓宽策略的广度,同时增加研究的深度,刘亮说,这是鲲腾面对问题的措施,也是发展的路径。
广度上,CTA 策略与股票策略协同发力、齐头并进,目前鲲腾的策略体系包括了核心优势的 CTA 策略、指数增强策略、市场中性策略,还有具有特色的混合策略(CTA+股票),策略的丰富度保证了收益来源的多元化,也能在风险可控的前提下创造更高收益。
深度上,单策略的精细程度一部分取决于 IT 团队的质量和规模,另一部分取决于投研团队的经验。目前,鲲腾稳健创新的 IT 团队已建立起集回测、实盘、算法交易、风控、监控于一体的完善系统,精英管理的投研团队也具备高效率的策略迭代优势,可以有预见性地避免大部分实盘的坑。
策略的优势使得鲲腾的产品在近期获得了多家实盘大赛的奖项。仅 2023 年 8 月的一个月,所获奖项便包括「广发证券私募实盘大赛-指数增强(新锐组)」冠军、「第十八届-中国私芽基金风云榜-管理期货」冠军、「第一届“星云杯”私募大赛-其他策略10-20亿管理规模」冠军等的总计 6 个冠军、4 个亚军、3 个季军及 19 个榜单十强。随着8月底政策组合拳带来的市场反弹,刘亮也表示期待下半年能有更亮眼的超额表现。
附:【喜报】鲲腾投资产品荣获多家实盘大赛 2023 年 8 月和最新季度奖项
“超额的收敛是历史的必然,就是这个过程有点快。” 针对市场近况,刘亮如是说。长期看,市场有效性提升、量化超额下降是大趋势,但管理人的策略迭代可以在这个趋势的各个阶段,以合适的方式,最大限度地实现超额收益。所有私募都在做迭代更新,让自己的策略不断适应市场的变化,在此背景下,鲲腾与和鲸展开了合作。
效率的提升可以增厚产品的超额收益,前提是要走过数据这段“坎坷路”。当前,越来越多大型量化私募机构正效仿券商与银行做法,想要构建自己的量化数据中台。数据的完备性、准确性,数据的存储、应用都会直接对优化量化投资算法模型起到关键作用。
引入和鲸的数据科学协同平台 ModelWhale 以后,鲲腾做的第一件事就是让数据更快地流动起来。
首先做的是提高数据预处理的效率。多源头数据统一汇入 ModelWhale 后,数据接口与数据的清洗、处理、分析实现了统一,既能降低系统复杂度也能增强数据加工能力。数据需要每日更新,ModelWhale 会每日定时获取数据库新产出的数据,然后员工可按照业务逻辑对数据进行预处理,当然这一步还是更依赖于业务理解,需要在保证数据质量的同时提高效率。对此,员工可以将较为成熟的数据预处理或数据分析的步骤封装为标准工作流,尤其是具有投资决策参考价值的“中间指标”或“常用指标”,利用离线任务每日定时运行并推送,方便投研团队与交易风控团队更快了解行情。
其次便要提高数据使用的效率。预处理后的数据既可以写回数据库,也能保存在平台的共享空间,供特定的投研人员随取随用(此处涉及的权限管理将在后文作具体说明)。为了便于因子挖掘以及后期对历史行情数据进行二次加工,平台上的每一个数据集都配备了数据文档记录数据标签及数据说明,并可回溯到任一历史版本。ModelWhale 兼顾数据管理与数据应用,之后不管是通用的数据还是需要喂给特定模型的数据,投研人员都能更便捷地使用。
策略的迭代分为两个维度,一是日常的渐进式创新,二是跨越式创新,但迭代的频次总是不固定的,为了保持策略在市场上的领先地位,最有效的方法就是不断测试,就像挖矿一样不断探索。为了进一步提高测试的效率,鲲腾将部分策略回测与策略分析的工作迁移至了 ModelWhale 平台。
投研人员完成策略的开发后,即可在 ModelWhale 平台上选择相应的回测框架进行回测。除了数据外,快速回测验证还需要大量 GPU 、CPU 、内存资源,ModelWhale 将鲲腾本地的计算硬件接入云端,投研人员可以根据需求拆分算力共享使用或将多机多卡的 GPU 组成集群算力使用。
回测过程中,大家通常都会希望在一定时间内作更多尝试,因此围绕相似的回测可能需要跑很多遍。在平台的加持下,投研人员既可以针对同一模型配置多组参数同时去跑,也可以同时运行多个回测任务并行计算,任务之间相互独立、互不影响。这样一来,原本运行多个回测任务的总时间被压缩到了单个最大任务的时间,效率得到指数倍的提高。
新旧策略交替,一边维护老策略一边开发新策略是常态。鲲腾的研究总监栾峰教授曾提出:“相较于用 Git 管理策略,ModelWhale Notebook 的项目管理方式才是对于策略人员更加友好的。”
不管是修改了挂载的数据、文件还是策略代码,总之项目内的任何调整都可以生成新的版本,但并不妨碍投研人员随时查看历史版本或回溯到历史版本重新做,不同版本间可以相互对比了解“增、删、改”情况。部分新策略的开发可能需要多人合作进行策略研究、编程实现和模型优化,利用 ModelWhale 的版本管理,投研人员间也能减少低效率的相互确认——已与他人分享的数据和项目若有修改,对方会同步获得更新;未与他人共享的则仍属于自己的私密“财产”(此处涉及的权限管理亦在后文作具体说明)。另外,数据、标准的工作流、策略,或是团队待学习的项目都可以存储在团队的共享空间,方便大家随时使用。
保密工作对于量化行业来说几乎是首要考虑的问题。多一个人使用同样的算法策略,利润空间就少一分,因此任何有可能曝光算法的信息渠道都应被严加看管。
外部合作方面,鲲腾长期协助高校开展人才联合培养工作,在校内表现优异的学生将有机会到鲲腾短期实习,在投研团队的带教下通过实战快速锻炼选股、研究、策略开发等多方面能力。从一开始普遍做数据处理工作,到后面随着能力的积累慢慢接触到新因子的挖掘、新模型的开发等更深层的工作内容,相关权限需要逐级开放。
接触到 ModelWhale 平台后,投研团队发现通过基础设施的配置可以更便捷地实现这一需求,数据、策略、模型等各种资产也能得到多重保障。数据方面,管理员可以同时管理数据的访问权限(管理单位至个人)和数据的下载权限,也就是可以实现数据仅在平台处理而无法下载至本地,既提高效率也保障数据不外泄。策略方面,承载策略的 Notebook 同样可以“开启访问权限”的形式分享,但访问并不等于可复制/可将代码下载至本地。简而言之,任何涉及权限的行为在平台上都有对应的管理动作加以监控。
权限相关的管理还涉及到了算力资源、镜像环境等,鲲腾内部的各类权限也都基于平台进行了优化。
从 2022 年与鲲腾合作至今,和鲸最大的感受就是务实而进取,CEO 刘亮对公司发展的每一步都做好了规划,踏实地走好每一步,一直努力在路上。“就像我们爬珠穆朗玛峰,你爬到顶上之后,四面望一下,会发现无论是从哪个面爬上去,看到的风景都是一样的。所以市场最终一定会寡头化,我相信我们每家头部量化在这个过程中,能力都是不断地跟上市场节奏。”
量化 4.0 时代,什么样的量化公司能够持续具备竞争力,鲲腾的答案是:尊重科学、追求效率、敬畏市场。作为一款先进的数字化基础设施,和鲸 ModelWhale 数据科学协同平台希望能为每一位从事数据创新研究的开拓者及其团队提供支持。
任何相关需求,都欢迎您搜索并进入 ModelWhale 产品官网注册体验,您也可以联系产品顾问了解更多案例(添加时请备注“鲲山案例”)。