NAME

联系方式

Email TEL GitHub (373 followers)
charl3s.xu@gmail.com TEL github.com/the0demiurge

REGION

教育经历

时间 学校 学历 专业
TIME UNIVERSITY DEGREE MAJOR
TIME UNIVERSITY DEGREE MAJOR

技能

  • 数学 / 算法
    • 深度学习: 系统性掌握 强化学习,了解检测跟踪、NLP、推荐系统;熟练使用 PyTorch,熟悉深度学习优化算法原理
    • 机器学习: 掌握或了解监督(树模型、Logistic 回归)、无监督(聚类、关联分析)、半监督、概率图模型、对比学习;熟练使用数据分析工具(pandas, numpy, matplotlib
    • 数据结构与算法,复杂性理论,A-star 等
  • 专业技能
    • 运筹优化: MILP (ortools),启发式优化 (GA/SA/CEM),凸优化 (cvxpy)
    • 控制论:线性系统,系统辨识,最优控制
  • 工程技能
    • 编程语言: 精通Python,熟悉C/C++、bash、MATLAB、Makefile
    • Linux:从2016年至今使用ArchLinux/Ubuntu作为主力系统,管理过7台深度学习服务器,拥有一台VPS
    • 软件工程(git, CI, Dockerfile, 代码规范性),计算机网络(http, OSI), 数据中间件(Kafka)

工作经历

COMPANY POSITION TIME

基于深度强化学习的交通控制算法研究与落地

  • S: 目前学术界基于 AI 的信号灯控制算法大多基于强假设,没有考虑到感知范围、感知精度、感知延迟等等问题,难以落地。研究使用强化学习落地信号灯控制的可能性,在现实条件多种场景超越传统方法。
  • A: 1. 设计和开发与现实一致的 RL 环境 (state, action, reward);2. 实现传统控制算法作为 专家经验;3. 实现并优化多种 RL 算法(Rainbow,SAC,PPO),使得 RL 的性能超越传统方法;4. 使用信息熵理论解决专家经验中样本分布不平衡问题,使 RL 成功模仿专家经验预训练,显著提升训练效率;5. 设计并实现可泛化的 RL 模型,解决 SOTA 基于 RL 的交通控制模型无法跨场景泛化的问题。
  • R: 已发表:ITSC 2021: Adaptive Coordinated Traffic Control for Arterial Intersections based on Reinforcement Learning; 另有提升泛化性的论文已投,在审稿中。

基于最优控制(运筹优化)的车路协同-协作式车速引导

  • S: 协作式车速引导是自动驾驶 L2 到 L4 车路协同中的一项重要应用。
  • A: 1. 实现多种车辆能耗模型作为优化目标函数和评价指标;2. 复现 SOTA 车速优化算法,进行纵向车辆轨迹规划;3. 设计基于最优控制的控制策略,使用序列二次规划(SQP)启发式算法求解,综合考虑多方博弈从而达到整体最优。
  • R: 单车能耗降低 12%;渗透率 10% 时,自动驾驶车能耗降低 9%。

基于机器学习与运筹优化的大规模智慧交通控制系统

  • S: 在大数据时代,多交通信号灯的智能控制可以大幅提升交通运行效率,减少拥堵。
  • A: 1. 使用聚类算法(K-Means, DBSCAN)对交通流数据自动聚类并打标,作为数据集训练有监督模型(KNN);2. 使用有序聚类(谱聚类,Fisher)对交通数据自动时段划分;3. 使用混合整数规划(MILP)、启发式算法对大规模交通控制问题分层次建模求解;4. 设计并实现整体算法工程化架构。
  • R: 集成到 PRIVATE 产品线中,在PRIVATE实地评测中达到显著优于人类专家手动调整的结果。
  • 发表专利PRIVATE。

学校项目

基于强化学习的智能参数优化算法研究TIME

  • S: 材料学的反应力场求解是一个很困难的参数优化问题,传统方法常用遗传算法求解,耗时很长。
  • A: 提出相似材料具有相似优化目标函数假说,设计并实现 RL 环境,包括多种特征与优化模式,实现并改进多种RL算法(DQN,A3C,DDPG)和多种传统最优化算法(共轭梯度法,模拟退火等),设计实验并证明了 RL 做参数优化的有效性。
  • R: 1. 在相似材料的优化性能上取得了与专业反应力场优化软件GarfField相当的水平,大幅超越共轭梯度法、模拟退火算法;2. 取得软件著作权。

实习经历

基于机器学习的自动核保系统COMPANY TIME

  • S: PRIVATE 金融大数据项目中与百度、IBM 等公司竞标,使用人工核保数据构建可靠的自动核保系统,替代人工工作量。
  • A: 深入理解客户需求,设计特征、评测指标、模型结构,使用Logistic Regression, Random Forest、LightGBM等模型训练、微调;bad case 分析并改进特征;用 C++ 将模型封装为 sdk。
  • R: 1. 完成 PoC,赢得竞标;2. 完成项目一期,在 53 万条数据集上以 95% 精度减少 15% 人工工作量。
  • PRIVATE

业余项目

量化交易回测 demoTIME

  • S: 存在验证自用基金交易策略在实际市场中的有效性的需求。
  • A: 使用 yfinance 获取NASDAQ、贵州茅台上市以来日交易数据,使用 python 编写简易交易成本计算逻辑、自用交易策略(累计上涨5%则买入,下跌5%则卖出),控仓策略(触发买入或卖出后每日交易K%仓位),并与原始股价对比。
  • R: 本策略与买入后持续持仓相比,收益率略低,但显著降低了方差,验证了该方法在实践中的可行性。

爬虫网站项目:ShadowSocksShareTIME

  • S: 项目创建时互联网上还没有免费的 ss 订阅服务,需要手动从免费分享站中查找 ss 信息并填写到软件中,复杂度较高。
  • A: 自学爬虫、HTML、Javascript 等,使用正则表达式等方法筛选并解析在线网站内容,并编写网站前后端,部署到 Heroku、OpenShift、GAE 等平台。
  • R: 本项目获得 350 次共计 ¥1871.91 捐款,并在 GitHub 开源获得 3.1k Star1.1k Fork
  • 项目链接:ss.pythonic.life

自我评价

  • 身体强壮,有锻炼习惯,有条件时常组织远足和骑行。
  • 合作能力: 1. 与实习生合作完成RL利用专家经验和泛化性研究;2. 信号控制项目与产品侧沟通产品设计,与工程侧联调,确保整个项目流程走通;3. 车路协同项目协调上下游关系,打通端到端整体链路。
  • 学习能力: 自学网站建设、材料学、交通工程理论、自动驾驶等,快速上手并逐渐深入掌握多种领域
  • 善于总结,在线笔记: notes.pythonic.life
  • Geek 精神,使用编程改善生活:CharlesScripts, 本项目获得 981 Star731 Fork; 包括本简历也是使用这个工具生成。
  • 个人博客: the0demiurge.blogspot.com
  • Google Scholar: PRIVATE

results matching ""

    No results matching ""