无人驾驶lecture3_Deep Reforcement Learning

1星
2018-03-23
7.16MB
需要2积分
81次下载

文档简介
文档解析
猜您喜欢
推荐下载
用户评论0

标签：人工智能汽车电子

文档内容节选

Lecture 3 Deep Reinforcement Learning For the full updated list of references visit httpsselfdrivingcarsmitedureferences MIT 6S094 Deep Learning for SelfDriving Cars MIT 6S094 Deep Learning for SelfDriving Cars httpsselfdrivingcarsmitedu httpsselfdrivingcarsmitedu Lex Fridman Lex Fridman lexmitedu lexmitedu January January 2018 2018 Environment Sensors Sensor Data Feature Extraction Representation Machine Learning Knowledge Reasoning Planning Action Effector Open Question What can we not do wi......

展开预览

文档解析

这份文档是MIT课程6.S094：自动驾驶汽车深度学习（Deep Learning for Self-Driving Cars）的第三讲，主题为深度强化学习（Deep Reinforcement Learning），由Lex Fridman主讲。课程内容涵盖了自动驾驶汽车中深度学习的应用，特别是强化学习在自动驾驶决策过程中的重要性。文档详细介绍了环境与传感器、传感器数据、特征提取、表示、机器学习、知识、推理、规划、行动和效应器等概念，并探讨了深度学习在这些领域的应用。文档中提出了一些开放性问题，例如深度学习在自动驾驶汽车中能做什么，以及人工智能栈的哪些部分可以被学习。同时，还讨论了不同类型的深度学习，包括监督学习、半监督学习和无监督学习，以及它们在自动驾驶汽车中的应用。此外，文档还介绍了深度强化学习（Deep RL）的多个组成部分，如策略、价值函数和模型，并提供了强化学习在不同领域的应用实例，如Atari游戏、Cart-Pole平衡、Doom游戏和Bin Packing任务。文档解释了马尔可夫决策过程（Markov Decision Process, MDP）和强化学习中的关键概念，如奖励、状态和动作。文档中还提到了DeepTraffic，这是一个深度强化学习竞赛，旨在通过深度神经网络减少交通拥堵。DeepTraffic提供了一个平台，让参与者可以提交他们的模型，并在模拟环境中测试和评估这些模型的性能。最后，文档强调了深度学习和强化学习的结合，以及它们在实现通用人工智能方面的潜力。同时，也提到了AlphaGo和AlphaGo Zero，这两个程序分别在2016年和2017年击败了人类围棋冠军，展示了深度强化学习在复杂决策任务中的有效性。整个文档提供了对自动驾驶汽车中深度强化学习应用的全面概述，并探讨了其在实际应用中的潜力和挑战。

猜您喜欢

上传者

: crazyjackson; 查看他的其他资源

举报人：
被举报人：	crazyjackson
举报的资源分：	2
* 类型：
	请您提供公司营业执照和软件相关版权到service@eeworld.com.cn
* 详细原因：

无人驾驶lecture3_Deep Reforcement Learning

文档简介

评论