职位描述
岗位职责:
1、利用强化学习方法构建可交易策略,包括状态设计、奖励函数、训练与回测。
2、搭建或改进市场模拟环境,提高策略在真实市场中的稳定性。
3、引入并实现主流 RL 算法(如 PPO、SAC、DQN 等),不断优化策略表现。
4、与量化研究员合作,将 RL 模型与市场特征、传统因子或交易执行流程结合。
5、跟踪强化学习与序列决策领域的新技术,并探索在交易中的应用。
任职要求:
1、计算机、人工智能、数学、统计、自动化等相关专业硕士及以上学历。
2、熟悉强化学习基础概念(MDP、策略梯度、值函数等),有相关项目经验。
3、熟练使用 Python 和 PyTorch,具备良好的工程实现能力。
4、有真实场景(如游戏、推荐、控制、交易)中训练 RL 模型的经历优先。
5、具备良好的逻辑能力、自驱力和数据分析能力。
加分项:
1、有量化策略研究、回测框架或市场微结构相关经验
2、对 RL 开源框架有实践经验(如 Stable Baselines3、RLlib 等)
3、有论文、比赛、开源项目等可展示成果
福利待遇:
双休+提供住宿+六险一金+股权激励+年终奖+部门奖金+节假日福利+生日福利+员工体检+员工旅游+电话补贴+交通补贴