logo
登录 / 注册
比亚迪公司logo

比亚迪

已上市 · 1万人以上 · 汽车制造/维修/零配件·汽车生产制造·整车制造业
6.6w 关注304 职位9.4w 员工在脉脉
公司介绍发现动态发现人脉工商信息公司相册招聘职位
公司介绍
比亚迪成立于1994年11月18日, 总部位于广东省深圳市, 是在香港和深圳两地上市的世界500强企业,业务横跨电子、汽车、新能源、轨道交通四大产业,从能源的获取、存储,再到应用,全方位构建零排放的新能源整体解决方案,致力于用技术创新,满足人们对美好生活的向往,助力为地球降温1°C。
动态
查看更多
头像
企业号
与风同驰正当时 足球少年们 无论前路如何 向前就是了 踢出点名堂来!
头像
企业号
比亚迪11月销售480186辆,创年内新高! 海外销售突破13万辆,创历史新高! 2025年1-11月累计销售4182038辆 新能源累计销售超1470万辆
头像
企业号
比亚迪第五代DM技术 创新运用AI大模型,油耗低至2.6L 荣获2024年度广东省科技进步奖特等奖 权威大奖认证,超百万用户信赖 17 年技术积累,定义全球插混标杆
发现人脉
头像
s先生

比亚迪 · 算法工程师

影响力287 访客4439北京
个人简介:交通设备制造业研发,任职比亚迪算法工程师职位,常驻北京;近期有4439位访问者,在脉脉形成影响力287;在2024-12至今,任比亚迪公司算法工程师职位;在2021-1至2024-7,任轻舟智航公司运动规划工程师职位;在2018-3至2020-12,任京东公司算法工程师职位;在2017-3至2017-9,任驭势科技公司算法工程师职位;在2016-3至2016-9,任清华大学公司猛狮智能车团队职位。
个人简介
交通设备制造业研发,任职比亚迪算法工程师职位,常驻北京;近期有4439位访问者,在脉脉形成影响力287;在2024-12至今,任比亚迪公司算法工程师职位;在2021-1至2024-7,任轻舟智航公司运动规划工程师职位;在2018-3至2020-12,任京东公司算法工程师职位;在2017-3至2017-9,任驭势科技公司算法工程师职位;在2016-3至2016-9,任清华大学公司猛狮智能车团队职位。
职业标签
工作经历
company_logo
算法工程师

比亚迪

2024.12 - 至今(1年)
C++
company_logo
运动规划工程师

轻舟智航

2021.01 - 2024.07(3年6个月)
OKR管理
company_logo
算法工程师

京东

2018.03 - 2020.12(2年9个月)
company_logo
算法工程师

驭势科技

2017.03 - 2017.09(6个月)
company_logo
猛狮智能车团队

清华大学

2016.03 - 2016.09(6个月)
展开更多
工作经历
职业标签
company_logo
算法工程师

比亚迪

2024.12 - 至今(1年)
C++
company_logo
运动规划工程师

轻舟智航

2021.01 - 2024.07(3年6个月)
OKR管理
company_logo
算法工程师

京东

2018.03 - 2020.12(2年9个月)
company_logo
算法工程师

驭势科技

2017.03 - 2017.09(6个月)
company_logo
猛狮智能车团队

清华大学

2016.03 - 2016.09(6个月)
暂无内容
展开更多
头像
J先生

比亚迪有限股份公司 · 算法工程师

影响力529 访客1856北京海淀区
个人简介:大数据/人工智能研发,任职比亚迪有限股份公司算法工程师职位,常驻北京;近期有1856位访问者,在脉脉形成影响力529;在2024-12至今,任比亚迪有限股份公司公司算法工程师职位;在2022-3至2024-12,任地平线公司算法工程师职位;在2020-7至2022-3,任滴滴出行公司算法工程师职位。
个人简介
大数据/人工智能研发,任职比亚迪有限股份公司算法工程师职位,常驻北京;近期有1856位访问者,在脉脉形成影响力529;在2024-12至今,任比亚迪有限股份公司公司算法工程师职位;在2022-3至2024-12,任地平线公司算法工程师职位;在2020-7至2022-3,任滴滴出行公司算法工程师职位。
职业标签
工作经历
company_logo
算法工程师

比亚迪有限股份公司

2024.12 - 至今(1年)
自动驾驶
company_logo
算法工程师

地平线

2022.03 - 2024.12(2年9个月)
Python
company_logo
算法工程师

滴滴出行

2020.07 - 2022.03(1年8个月)
Python
展开更多
工作经历
职业标签
company_logo
算法工程师

比亚迪有限股份公司

2024.12 - 至今(1年)
自动驾驶
company_logo
算法工程师

地平线

2022.03 - 2024.12(2年9个月)
Python
company_logo
算法工程师

滴滴出行

2020.07 - 2022.03(1年8个月)
Python
暂无内容
展开更多
头像
靳先生

比亚迪 · 分布式存储研发工程师

影响力445 访客2648北京
个人简介:IT系统集成研发,任职比亚迪分布式存储研发工程师职位,常驻北京;近期有2648位访问者,在脉脉形成影响力445;在2020-12至今,任比亚迪公司分布式存储研发工程师职位;在2014-1至2021-4,任搜狗公司软件工程师职位。
个人简介
IT系统集成研发,任职比亚迪分布式存储研发工程师职位,常驻北京;近期有2648位访问者,在脉脉形成影响力445;在2020-12至今,任比亚迪公司分布式存储研发工程师职位;在2014-1至2021-4,任搜狗公司软件工程师职位。
职业标签
工作经历
company_logo
分布式存储研发工程师

比亚迪

2020.12 - 至今(5年)
company_logo
软件工程师

搜狗

2014.01 - 2021.04(7年3个月)
展开更多
工作经历
职业标签
company_logo
分布式存储研发工程师

比亚迪

2020.12 - 至今(5年)
company_logo
软件工程师

搜狗

2014.01 - 2021.04(7年3个月)
暂无内容
展开更多
工商信息
企业法人王传福
注册资本2,911,142,855元人民币
成立日期1995-02-10 00:00:00
公司名称比亚迪股份有限公司
公司类型-
工商注册号440301501127941
统一社会信用代码91440300192317458F
公司相册
职位
查看更多
主任高效通信库工程师(GPU集群高性能通信)50k以上 · 16薪
北京硕士及以上5-10年
主任高效通信库工程师(GPU集群高性能通信) 岗位职责 1. 负责AI研发平台中网络通信性能的优化,包括分布式训练数据传输的优化和通信效率的提升。 2. 研究和优化高效通信库(如NCCL、MPI、HCCL)的性能,以提高分布式计算和训练的速度。 3. 优化和改进通用通信框架(如UCX)的性能,确保其在多种底层网络协议下的高效运行。 4. 设计和实现高效的数据汇总与分发机制,提升跨GPU节点的数据同步和共享效率。 5.协调内部研发团队,确保网络性能优化需求的准确定义和高质量交付。 6.阅读行业前沿论文,并进行市场调研和行业趋势分析,提出网络性能优化的改进方案。 7. 编写技术文档,组织内部技术分享,确保知识传递和团队技能提升。 招聘要求 1. 计算机科学、网络工程、信息技术或相关专业硕士及以上学历。 2. 至少5年网络性能优化相关经验,具备分布式系统、GPU通信等领域的深厚知识。 3. 熟悉高效通信库(如NCCL、MPI、HCCL)和通用通信框架(如UCX),有相关优化经验。 4. 具备优秀的项目管理能力和跨团队协调能力。 5. 出色的沟通和领导能力,能够有效推动团队协作和项目进展。
大模型算法副总工程师(前沿研究)75k以上 · 15薪
北京硕士及以上5-10年
大模型算法副总工程师(前沿研究) 岗位职责 1. 探索可用于自动驾驶/机器人场景VLA的、有3D感知能力和物理世界常识VLM基座技术 2. 通过重写、扩充和生成等方法合成大规模、高质量的数据;如指令调优、偏好对齐、模型优化以提高LLM在各个阶段(预训练、SFT、RLHF)的能力 3. 开展大模型算法研究,包括但不限于:多模态LLM/VLM的预训练/监督微调/强化后训练、LoRA/P-Tuning等高效微调,模型量化、分布式部署算法,实现大模型算法研究与应用 4. 研究和实施稳健的评估方法,以评估大模型在各个阶段的表现,揭示其能力的潜在机制和来源,并利用这种理解来推动模型改进 5. 跟踪打磨领域最新的技术发展和研究成果,提出新的技术创新和改进方案 6. 参与以实习生为主体的大模型方向的开源研究体系,对外在学术界顶会发表研究成果 招聘要求 1.计算机相关专业,硕士及以上学历; 2.具备72B以上规模的LLM训练经验,至少担任过预训练/监督微调/强化学习后训练其中一个方向的负责人 3.具备算法工程能力,能进行算法与软硬件协同设计,精通量化、TP/EP/DP/PP等并行方法的,作为加分项 4.有学术背景资源,自身担任过顶级学会reviewer的,或者在相关顶级学会发表过多份研究的,作为加分项
智能座舱数据分析师30k-50k · 14薪
北京本科及以上5-10年
1. 负责智能座舱业务核心指标体系的建设、监控与分析,确保数据能客观、公正地评估业务健康度。 2. 深入理解智能座舱产品逻辑,构建覆盖用户行为、产品功能、系统性能、内容服务等多维度的指标监控看板和报表。 3. 通过数据分析,洞察用户行为模式,识别业务增长点和潜在风险,为产品、运营和算法优化提供数据支持和决策依据。 4. 主导或参与专项数据分析项目,如下钻分析负反馈率、重说率等关键指标,定位问题根源,并提出改进建议。 5. 跟进业界领先的数据分析方法和工具,提升团队数据驱动决策的效率和科学性。
主任/高级AI算子优化工程师60k以上 · 16薪
北京硕士及以上5-10年算子优化分布式训练
主任/高级AI算子优化工程师 岗位职责: 1. 负责AI算子的适配、优化和性能调优,支持复杂模型在多种异构硬件平台上的极致高效运行。 2. 深度挖掘并优化关键算子的性能瓶颈,推动模型整体性能的跨代提升。 3. 开发高性能、可扩展的自定义算子,满足业务场景及前沿研究需求。 4. 确保算子在CPU、GPU、NPU等多种硬件架构上的兼容性、稳定性与鲁棒性。 5. 跟踪并分析最新硬件架构及算子技术发展趋势,提出具备前瞻性的优化及创新方案。 6. 主导与算法团队、工程团队及硬件厂商的深度协作,高效解决算子在实际应用中的复杂问题。 7. 编写高质量技术文档,总结并分享行业领先的优化经验,为团队提供技术赋能。 任职要求: 1. 计算机、电子、数学或相关专业硕士及以上学历,博士优先。 2. 至少 5 年 AI算子开发及优化经验,深入理解深度学习框架(如 TensorFlow、PyTorch、ONNX)的底层实现原理。 3. 精通主流深度学习算法,包括但不限于 Transformer、Diffusion、GNN、强化学习等,熟悉其计算模式及优化要点。 4. 掌握 C/C++,具备多线程、并行计算及内存优化经验,对高性能计算库(如 CUDA、OpenCL等)有深刻理解。 5. 熟悉主流硬件架构(GPU、NPU、TPU等),对新兴硬件加速器有深入研究,并具有跨架构优化经验。 6. 具备丰富的性能调优经验,能够快速定位和解决复杂系统的性能瓶颈。 7. 发表过顶级会议或期刊相关论文,或主导过大型算子库或框架开发者社区贡献者优先。 其他 工作地点:深圳坪山、北京清河、上海虹桥
主任/高级端到端算法模型开发工程师(规划模型&强化模型&场景理解)40k-70k · 15薪
北京硕士及以上5-10年
岗位职责 1.负责端到端算法研发,端到端模型设计、实现与评测; 2.负责城区NOA项目的量产交付,打造安全舒适的用户体验产品; 3.负责撰写高水平论文、申请专利、参加国际竞赛等扩大影响力。 任职要求 1.硕士及以上计算机、机器人等相关专业,熟练使用 C++/Python语言及常见的数据结构; 2.对以下至少一个方面有实际经验:Neural Planner、轨迹预测、IL/ RL; 3.有自动驾驶/智能驾驶/机器人方向的落地经验,具备优秀的算法探索及工程实现能力。 工作地点:北京/上海/深圳
高级端到端算法架构工程师40k-60k · 15薪
北京本科及以上5-10年高速NOA城区NOA
岗位职责 1.作为系统架构和研发系统角色,采用端到端方案量产高速和城区NOA,提升研发效率; 2.紧跟行业趋势,采用端到端、VLA方案进行系统架构设计、需求拆解、方案设计及接口定义; 3.作为算法接口人,承接项目、应用层及对手件的需求,与项目、研发、测试团队保持高效沟通,确保产品的按时保质交付; 4.协同各模型负责人,对产线提出训练数据需求。识别模型训练卡点和风险,协同项目推进和解决训练数据问题; 5.负责路试或用户反馈问题原因聚类,牵头拉动上下游模块制定解决方案,做到需求和方案闭环,持续提升产品性能和完善产品功能; 6.负责试驾、走查、发版等重要问题分析、第一时间定位问题原因和模块,协同项目、研发快速解决问题,提升试驾和走查效率。 任职要求 1.本科以上学历,车辆工程、机械工程、电子电器、自动化、计算机等相关专业; 2.2年以上汽车行业相关工作经验。对高速和城区NOA有深刻的了解,有1个及以上高速NOA量产经验,有城区NOA量产经验或端到端量产经验优先; 3.对BEV感知、PNP、规控后处理等模块有深入理解者优先; 4.熟悉目前主流的智驾驶解决方案(ADAS/DMS/HDM等)及相关法规和标准,了解车载网络通讯、智驾传感器、Autosar、V模型软件开发基本流程等; 5.热爱创新,有责任感,善于独立思考,优秀的沟通及团队协作能力。 工作地点:深圳/上海/北京
主任/高级训练推理优化工程师40k-80k · 15薪
北京硕士及以上5-10年
主任/高级训练推理优化工程师 岗位职责 1. 进行通用的大模型/自动驾驶/机器人等场景模型训练及推理优化的技术研发和积累,包含形成工具链和文档化的训推优化方法论; 2. 持续跟进瓶颈分析、网络优化、文件IO优化、计算图优化、算子优化、DP/TP/PP/EP前沿训推优化技术,探索创新的结合自建AI超算集群的训推优化技术; 3. 对接包括自动驾驶训练优化业务在内的多个业务线和部门内部算法研发业务的训练推理优化。 1.3年以上工作经验,计算机/数学/物理/电子工程/自动控制专业,硕士及以上学历; 2.优秀的代码能力,熟练掌握C/C++或Python; 3.具备CUDA开发经验,熟悉Nsight等profiling工具,熟悉TVM/TensorRT/Triton/Cutlass等推理框架优先; 4.熟悉DeepSpeed/Meqatron-LM等训练框架,熟悉PD分离、kvcache等大模型推理优化技术;熟悉GPTQ/AWQ等量化技术;熟悉MLIR/MegaKernel等AI Compiler技术优先; 5.熟悉计算机体系结构,对GPU、NPU等有比较深刻的理解; 6.熟悉CNN/Transformers/DETR等主流模型原理; 7. 良好的团队协作能力:创新性强,有良好的动手实现能力,对技术有热情。
后训练算法工程师(VLM)45k-75k
北京硕士及以上3-5年
主导或参与具有视觉大模型(VLM)大模型的继续训练或后训练工作,依据业务需求对模型进行精细微调,以提升模型在特定领域的表现和适应性。​ 负责后训练数据的收集、整理与预处理,确保数据质量满足模型训练要求,构建高质量的后训练数据集。​ 深入分析模型训练过程中的各项指标,运用数据分析手段诊断模型性能问题,并提出针对性的优化策略。​ 探索创新的后训练技术与方法,跟踪学术前沿进展,将最新研究成果应用于实际项目,提升模型的竞争力。​ 与跨部门团队紧密协作,包括算法工程师、数据科学家、产品经理等,共同推动大模型在业务场景中的落地应用。​ 岗位要求:​ 学历背景:数学、统计、计算机科学、人工智能等相关专业,硕士及以上学历。​ 技术能力:​ 深入理解主流VLM的 post-train 技术原理,具备丰富的数据分析与处理经验。​ 精通至少一种深度学习框架,如 PyTorch 或 TensorFlow,能够熟练运用框架进行模型训练与调试。​ 熟悉常见的模型评估指标与方法,能够准确评估模型在不同任务和数据集上的性能表现。​ 经验要求:​ 具有VLM等相关领域的实践经验者优先考虑。​ 具备测评数据集开发经验,或在数据集质量要求管理方面有实际经验者优先录用。​ 加分项:​ 在顶级 AI 学术会议上发表过大模型相关研究论文者优先。​ 拥有开源项目开发经验,且在相关领域有一定影响力者优先考虑。
具身智能/自动驾驶算法工程师(前沿研究)40k-80k · 15薪
北京硕士及以上3-5年
具身智能/自动驾驶算法工程师(前沿研究) 岗位职责 1. 进行基于VLA/世界模型/闭环强化学习的自动驾驶下一代算法方案研发; 2. 进行机器人场景VLA/世界模型/闭环强化学习的模型技术研发,为下一代自动驾驶方案提供技术储备和可跨域迁移的技术方案; 3. 跟踪自动驾驶/机器人领域最新的技术发展和研究成果,提出新的技术创新和改进方案; 4. 参与以实习生为主体的自动驾驶/机器人方向的开源研究体系,对外在学术界顶会发表研究成果。 任职要求 1.计算机、模式识别等相关专业硕士/博士; 2.具备自动驾驶端到端/世界模型/LA算法研发经验,熟悉自动驾驶常用的BEV方案、动静态算法、端到端、VLA等算法或具备机器人世界模型/LA算法研发经验; 3.了解pi3/GR-3/BridgeVLA/DiffusionVLA等前沿方法; 4.具备较强代码能力,熟练C/C++或Python编程; 5.具有在计算机视觉及模式识别领域顶会;(CVPR/ICCV/ECCV/ICML/NeurIPS)或顶刊(TPAMI/IJCV/TIP)者优 先;有顶级学术比赛成果或实际工程项目经验者优先; 6.具备良好的团队协作能力,能够突破技术难题,推动项目的高效实施。
主任/高级算法工程师(前沿重建与生成模型)40k-80k · 15薪
北京硕士及以上3-5年
主任/高级算法工程师(前沿重建与生成模型) 岗位职责 1. 探索可用于自动驾驶/机器人等业务场景世界模型的前沿4D重建与生成模型技术 2. 跟踪重建与生成技术领域最新的技术发展和研究成果,提出新的技术创新和改进方案 3. 参与以实习生为主体的重建与生成方向的开源研究体系,对外在学术界顶会发表研究成果 任职要求 1.计算机、模式识别等相关专业硕士/博士; 2.熟悉NERF/3DGS/Diffusion/Flow Matching等生成式模型技术; 3.有自动驾驶/机器人场景4D重建/世界模型经验者优先; 4.较强代码能力,熟练C/C++或Python编程; 5.有计算机视觉及模式识别领域顶会(CVPR/ICCV/ECCV/ICML/NeurIPS)或顶刊(TPAMI/IJCV/TIP)者优 先;有顶级学术比赛成果或实际工程项目经验者优先 6.具备良好的团队协作能力,能够突破技术难题,推动项目的高效实施
自动驾驶算法副总工程师(前沿研究)75k以上 · 15薪
北京硕士及以上10年以上
自动驾驶算法副总工程师(前沿研究) 岗位职责 1. 负责基于VLA/世界模型/闭环强化学习的自动驾驶下一代算法方案研发; 2. 负责机器人场景VLA/世界模型/闭环强化学习的模型技术研发,为下一代自动驾驶方案提供技术储备和可跨域迁移的技术方案; 3. 跟踪自动驾驶/机器人领域最新的技术发展和研究成果,提出新的技术创新和改进方案; 4. 参与以实习生为主体的自动驾驶/机器人方向的开源研究体系,对外在学术界顶会发表研究成果. 任职资格 1.需在头部智能驾驶公司中,担任过端到端算法、世界模型算法或 LA 算法的核心研发人员或项目负责人;或在头部机器人公司中,担任过世界模型算法、VLA 算法的核心研发人员或项目负责人。 加分项 1.具备对应方向(端到端 / 世界模型 / LA/VLA 算法)的数据闭环链路搭建或评测体系构建经验,且担任过相关负责人; 2.拥有深厚学术背景资源,如担任过顶级学术学会审稿人,或在相关领域顶级学会发表多篇研究成果。
主任/高级自动驾驶算法工程师(前沿研究)40k-80k · 15薪
北京硕士及以上5-10年
自动驾驶主任算法工程师(前沿研究) 岗位职责 1. 进行基于VLA/世界模型/闭环强化学习的自动驾驶下一代算法方案研发; 2. 进行机器人场景VLA/世界模型/闭环强化学习的模型技术研发,为下一代自动驾驶方案提供技术储备和可跨域迁移的技术方案; 3. 跟踪自动驾驶/机器人领域最新的技术发展和研究成果,提出新的技术创新和改进方案; 4. 参与以实习生为主体的自动驾驶/机器人方向的开源研究体系,对外在学术界顶会发表研究成果。 任职要求 1.计算机、模式识别等相关专业硕士/博士; 2.具备自动驾驶端到端/世界模型/LA算法研发经验,熟悉自动驾驶常用的BEV方案、动静态算法、端到端、VLA等算法或具备机器人世界模型/LA算法研发经验; 3.了解pi3/GR-3/BridgeVLA/DiffusionVLA等前沿方法; 4.具备较强代码能力,熟练C/C++或Python编程; 5.具有在计算机视觉及模式识别领域顶会;(CVPR/ICCV/ECCV/ICML/NeurIPS)或顶刊(TPAMI/IJCV/TIP)者优 先;有顶级学术比赛成果或实际工程项目经验者优先; 6.具备良好的团队协作能力,能够突破技术难题,推动项目的高效实施。
高性能通信技术专家(GPU 集群方向)50k以上 · 16薪
北京硕士及以上5-10年
高性能通信技术专家(GPU 集群方向) 岗位职责 1.负责 GPU 集群通信体系的架构设计与技术选型,涵盖节点内(NVLink/PCIe)、节点间(InfiniBand RDMA / 以太网)通信链路的方案设计,确保通信性能匹配 AI 训练 / 推理场景需求。 2.主导高性能通信核心技术攻坚,包括但不限于:端到端延迟优化(显存→链路→远端 GPU 全链路调优)、大规模并行通信(all-to-all/broadcast)效率提升、通信 - 计算异步重叠机制实现。 3.优化底层通信库与硬件的适配能力,如基于 NCCL/RCCL 进行二次开发、定制 RDMA 网卡驱动参数、优化 NVLink Peer-to-Peer 通信策略,解决异构链路协同问题。 4.与 AI 框架团队(如 PyTorch/TensorFlow)协作,设计适配大模型场景的通信接口(如支持 MoE 专家通信、分布式 checkpoint 数据传输),降低上层业务使用高性能通信的门槛。 5.负责大规模 GPU 集群通信系统的稳定性保障,设计故障检测、自动重连、数据重传方案,解决链路故障导致的通信中断问题,支撑长周期训练任务稳定运行。 6.跟踪行业前沿通信技术(如 CXL 4.0、DPU 加速通信、光互连),评估其在 GPU 集群中的应用价值,推动通信技术的迭代升级与落地。 任职要求 1.计算机科学与技术、电子信息工程等相关专业硕士及以上学历,5 年以上高性能计算 / 分布式系统通信领域工作经验,有 GPU 集群(≥100 卡规模)通信优化经验者优先。 2.深入理解 GPU 架构(如 NVIDIA Hopper/Ampere、华为昇腾)的通信特性,熟悉 NVLink、PCIe(5.0/6.0)、InfiniBand RDMA(RoCEv2)等通信链路的原理与调优方法。 3.精通至少一种底层通信库的开发与优化,如 NCCL、OpenMPI、UCX,具备基于 CUDA C/C++ 开发定制化通信内核(如 all-to-all、reduce-scatter)的能力。 4.掌握通信协议栈原理,熟悉 TCP/IP、RDMA(RoCEv2/iWARP)、NVLink P2P 等协议,能独立分析并解决协议层的性能瓶颈(如丢包、延迟抖动)。 5.具备扎实的操作系统知识,熟悉 Linux 内核网络子系统(如内核态驱动、Socket 优化)、内存管理(如 GPU 显存与主机内存的高效交互)。 6.有大模型分布式训练通信优化经验(如 MoE 专家并行、万亿参数模型梯度同步),或参与过开源通信项目(如 NCCL、DeepEP)贡献者优先。 7.具备较强的问题分析与攻坚能力,能通过性能监控工具(如 nvidia-smi、ibstat、tcpdump)定位通信瓶颈,并提出可落地的优化方案。 良好的跨团队协作能力,能与硬件工程师(网卡 / 交换机选型)、AI 算法工程师(模型通信需求对接)高效配合,推动技术方案落地。 加分项 1.具备 DPU(如 NVIDIA BlueField)、IPU 等异构加速芯片的通信优化经验,熟悉硬件卸载通信任务的实现逻辑。 掌握低精度通信技术(如 FP8/BF16 数据压缩传输)、稀疏通信(如梯度稀疏化后传输)的优化方法。 2.有跨地域 GPU 集群通信方案设计经验(如基于 SD-WAN 优化跨机房通信延迟)。 3.拥有通信技术相关专利或在顶会(如 SC、HPCA)发表过高性能通信领域论文。
主任/高级 AI 训练推理工程师40k-80k · 15薪
北京硕士及以上3-5年强化学习、TensorFlow、PyTorch、python、C++
岗位职责 1. 负责AI模型训练和推理流程的深度优化,包括多机多卡分布式训练方案,保障高效稳定的训练速度和推理性能,熟悉并应用TP/PP/DP/EP/ZeRO等分布式或并行优化策略,充分挖掘硬件性能; 2. 优化并行训练策略与分布式训练框架,提高模型可扩展性和集群资源利用率,解决分布式训练中的负载均衡、同步机制、通信瓶颈等问题; 3. 研究并实践模型压缩、量化(包括量化KV cache)、剪枝、FlashAttention等加速技术,缩短推理时延,降低部署成本,与算法团队合作,针对应用场景进行模型结构的裁剪和定制化; 4. 对接基础设施团队,优化集群算力、显存和带宽等资源的调度与使用效率,分析并持续降低训练和推理的总体计算成本; 5. 与算法、平台、应用等多团队紧密协作,提供从模型设计到部署落地的全流程优化支持,基于场景需求定制技术方案并完成落地; 6. 关注AI加速领域最新研究进展及产业动态,对新技术进行可行性评估与引入,主动探索并落地新型训练优化策略或加速引擎。 任职要求 1. 计算机科学、人工智能或相关专业硕士及以上学历,博士优先; 2. 至少3年AI模型训练与推理加速相关经验,熟悉分布式训练和并行计算,有大规模项目实战背景; 3. 3. 精通主流深度学习算法,包括但不限于 Transformer、Diffusion、GNN、强化学习等,熟悉其计算模式及优化要点; 4. 编程基础扎实,熟练掌握Python、C/C++等语言,具备良好的架构设计及编码规范; 5. 熟悉主流深度学习框架(如TensorFlow、PyTorch)及分布式训练框架(如DeepSpeed、NeMo Megatron等),熟悉推理框架(如vLLM、TensorRT等),对多进程、多线程、MPI等并行计算有深入理解; 6. 熟悉模型压缩、量化、剪枝等模型加速方法,并具备相关项目实践经验; 7.具备独立工作和解决问题能力,沟通顺畅,能够带领或协调跨团队合作,善于总结分享,对新技术保持高度热情并喜欢动手实践。
主任/高级大模型算法工程师(前沿研究)40k-80k · 15薪
北京硕士及以上5-10年
主任/高级大模型算法工程师(前沿研究) 岗位职责 1. 探索可用于自动驾驶/机器人场景VLA的、有3D感知能力和物理世界常识VLM基座技术 2. 通过重写、扩充和生成等方法合成大规模、高质量的数据;如指令调优、偏好对齐、模型优化以提高LLM在各个阶段(预训练、SFT、RLHF)的能力 3. 开展大模型算法研究,包括但不限于:多模态LLM/VLM的预训练/监督微调/强化后训练、LoRA/P-Tuning等高效微调,模型量化、分布式部署算法,实现大模型算法研究与应用 4. 研究和实施稳健的评估方法,以评估大模型在各个阶段的表现,揭示其能力的潜在机制和来源,并利用这种理解来推动模型改进 5. 跟踪打磨领域最新的技术发展和研究成果,提出新的技术创新和改进方案 6. 参与以实习生为主体的大模型方向的开源研究体系,对外在学术界顶会发表研究成果 任职要求 1.计算机相关专业,硕士及以上学历; 2.熟练掌握RL、LLM、NLP、机器人、CV、搜索推荐系统的研究或应用经验,有72B以上规模的LLM训练的工作经验; 3.熟练掌握数据结构和算法基础技能,熟练掌握C/C++或Python,有ACM/ICPC、IOI、TopCoder等大 赛获奖者优先; 4.有RL、NLP、深度学习等有影响力的项目或论文经验者优先(包括ICML、NeUrIPS、ICLR、CVPR ICRA、EMNLP、KDD等);具有相关实习经验或ACM竟赛获奖者优先; 5.优秀的问题分析和解决能力,能够在大型模型训练和应用中深度解决问题: 6.具有良好的沟通协作能力,能够与团队一起探索新技术,推动技术进步