• 第五章 百度Apollo规划技术介绍(3)


    5.optimization inside motion planning

    约束问题的核心有三点:
    1.目标函数的定义
    2.约束。如路网约束、交规、动态约束等
    3.约束问题的优化。如动态规划、二次规划等

    牛顿迭代法:研究导数变化,一阶导、二阶导、考虑斜率变化率,然后再用binary search去逼近。
    核心思想:泰勒展开
    收敛次数:指数平方,二次收敛

    求解全局最优解:分块,求局部最优解,再综合
    启发式搜索:用动态规划初步了解,计划二次规划方案
    模拟退火等等。

    quadratic programming

    • 解决有约束条件的问题:

    Lagrangian Method

    KKT condition

    solve nonlinear optimization problem

    分两步:
    1.DP。初步进行规划
    2.QP。在初步规划的基础上找到最优解

    6.understand more on the MP difficulty

    约束:

    1.traffic regulations Hard Code regulations
    2.Decisions From hard code to DP
    3.Best Trajectory Spline Based QP

    Apollo EM Planner Framework

    path speed iterative的核心:类似于贪心的算法

    具体的nonlinear 决策规划问题做法:

    DP path:

    planning path DP

    path QP

    speed DP

    解决逆行问题:

    7.reinforcement learning and data driven approaches

    rule based->optimization->data driven
    Reforce learning: create mapping
    不断的实现更好的目标,最终希望通过一个mapping能够优化处理所有的问题

    imitation learning

    直接的、模仿的过程,然后做出mapping
    本质上可以说是一种supervised learning

    • reward functional design

    手动调整

    • RL的步骤
      通过当前的最优结果去生成一些sample。估计和optimal reward 之间的差距,然后对policy进行一些调整
    你将不再是道具,而是成为人如其名的人
  • 相关阅读:
    call/cc 总结 | Scheme
    用call/cc合成所有的控制流结构
    词法作用域 vs 动态作用域
    数论部分第二节:埃拉托斯特尼筛法
    1022: [SHOI2008]小约翰的游戏John【Nim博弈,新生必做的水题】
    C++面向对象作业1
    数论部分第一节:素数与素性测试【详解】
    基数排序与桶排序,计数排序【详解】
    计蒜客:百度的科学计算器(简单)【python神解】
    优质免费在线学习网站【自用】
  • 原文地址:https://www.cnblogs.com/wsl-lld/p/13442657.html
Copyright © 2020-2023  润新知