岗位职责:
1. 负责语言及视觉大模型(如LLaVA等)的量化技术研究、开发与优化。
2. 设计并实现高效的量化算法,降低模型存储占用和计算开销,提升推理速度,同时尽可能保持模型精度。
3. 跟踪学术界和工业界前沿量化技术(如FP8、INT8、INT4、混合精度量化等),推动技术落地。
4. 编写量化工具链,支持主流框架(PyTorch、ONNX等)的量化部署。 5. 针对芯片特性(如高通8295/8255系列及MTK8676/8678系列NPU)进行量化方案定制化优化,提升硬件利用率。
6. 技术调研和编写文档,性能评估与调优,以及跨平台适配。
任职资格:
1.计算机科学、电子工程、数学或相关专业,硕士及以上学历。
2. 扎实的编程能力,精通Python,熟悉C++/CUDA等高性能计算语言。 3. 熟练大模型推理框架(Deepseed、vLLM、Llama.cpp等)以及模型量化工具链(如ONNX、TensorRT~LLM、AIMET、LLMC等)。
4. 深入理解量化技术原理(如PTQ、QAT、混合精度量化),熟悉主流量化算法(如GPTQ、AWQ、SmoothQuant)与其他模型压缩技术(剪枝、稀疏化)的协同优化。
5. 有Transformer类大模型NPUd端量化及部署经验(必须项),熟悉LLM/VLM架构及推理流程优化。
6. 良好的沟通能力,能与算法、硬件团队高效协作。
深圳-福田区 深圳市福田区沙头街道上沙社区滨河大道9285号中洲滨海商业中心二期1栋A座二十五层
· 新华英才提示每一位求职者:我们严禁企业做出损害求职者合法权益的行为,包括但不限于传销、扣押证件/财物、付费培训、贷款、集资入股等行为!
· 如有此类信息,可通过网页底部的客服电话进行投诉操作!
深圳佑驾创新科技股份有限公司
在招5个职位 >
企业行业:电子/通信/硬件
企业规模:500-999人
企业简介: 佑驾创新MINIEYE(2431.HK)成立于2014年,是中国领先的智能驾驶及智能座舱解决方案供应商。凭借卓越的研发和商业化能力,为智能汽车全方位赋能,在推动汽车自动化的同时,提升安全与驾驶体验。 佑驾创新秉持渐进式战略,逐步开发L1至L4级智能驾驶解决方案,并创新性战略布局智能驾驶、智能座舱及车路协同三大业务线,响应多样化的应用场景和需求。目前,佑驾创新的解决方案已合作众多国内主流车企,并已搭载多款车型出口欧盟、澳大利亚和英国等地。 公司公众号:佑驾创新MINIEYE 公司主页:https://www.minieye.cc
企业地址:深圳市福田区沙头街道上沙社区滨河大道9285号中洲滨海商业中心二期1栋A座二十五层