职位描述
我们期待聪明、乐观、皮实、自省、追求卓越和自我驱动的优秀人士加入优酷,共同开创视觉技术的新格局。需要你具有计算机视觉检测、理解相关基础知识和视觉生成、扩散模型等方面的实践经验。
具体职责包括但不限于:
1、负责图像/视频的分析、诊断、理解、编辑等方面的算法研究,多模态大语言模型的有监督微调等;
2、负责图像/视频/物理世界大模型相关算法的前沿技术探索,包括图像/视频/3D生成和可控编辑领域的联合创新。
职位要求
1. 研究和探索可控的视觉内容生成技术,负责视觉内容生成模型等相关算法的研发和落地,结合公司业务场景进行相关策略迭代。
2. 探索时空内容可控生成技术,包括图片/视频风格迁移、镜头控制、空间一致性控制等。
3. 持续跟踪图像和视频理解、生成领域的最新技术动态,评估并实施前沿技术,推动技术在公司产品中的应用与创新。