强化学习工程师 - 职位详情

威瑞投资(青岛)有限公司

| 20人以下

点击查看企业详情 >

职位描述

岗位职责：
1、利用强化学习方法构建可交易策略，包括状态设计、奖励函数、训练与回测。
2、搭建或改进市场模拟环境，提高策略在真实市场中的稳定性。
3、引入并实现主流 RL 算法（如 PPO、SAC、DQN 等），不断优化策略表现。
4、与量化研究员合作，将 RL 模型与市场特征、传统因子或交易执行流程结合。
5、跟踪强化学习与序列决策领域的新技术，并探索在交易中的应用。

任职要求：
1、计算机、人工智能、数学、统计、自动化等相关专业硕士及以上学历。
2、熟悉强化学习基础概念（MDP、策略梯度、值函数等），有相关项目经验。
3、熟练使用 Python 和 PyTorch，具备良好的工程实现能力。
4、有真实场景（如游戏、推荐、控制、交易）中训练 RL 模型的经历优先。
5、具备良好的逻辑能力、自驱力和数据分析能力。

加分项：
1、有量化策略研究、回测框架或市场微结构相关经验
2、对 RL 开源框架有实践经验（如 Stable Baselines3、RLlib 等）
3、有论文、比赛、开源项目等可展示成果

福利待遇：
双休+提供住宿+六险一金+股权激励+年终奖+部门奖金+节假日福利+生日福利+员工体检+员工旅游+电话补贴+交通补贴

工作地址

山东青岛市市南区岛市南区香港中路26号远雄国际广场908室

查看地图