剑桥大学人工智能与数据科学AlphaGo的算法原理科研项目:强化学习与图神经网络(GNN)研究

招生状态:招生中

课时安排:7周在线小组科研+5周论文辅导,教授全程参与

适合专业

适合计算机科学、人工智能、数据科学、电子与计算机工程等专业,软件工程、自动化等相关专业或者希望掌握强化学习的学生;对人工智能、大数据以及交叉学科和方向感兴趣的学生;

学生需要具备线性代数及概率论与数理统计基础,至少会使用一门编程语言实现神经网络,有过强化学习开发经验的申请者优先。

项目收获

1. 7周在线小组科研学习+5周论文指导学习 共125课时

2. 学术报告

3. 优秀学员获主导师Reference Letter

4. EI/CPCI/Scopus/ProQuest/Crossref/EBSCO或同等级别索引国际会议全文投递与发表指导(可用于申请)

5. 结业证书

6. 成绩单

项目介绍

项目内容涉及强化学习核心理论和技能,具体包括遗传算法、强化学习框架、Q-learning、行动者-批评(actor-critic;AC)模型、马尔可夫决策过程、优化控制、图神经网络(graph neural networks; GNN)、自动机器学习(Auto ML)等。学生通过项目了解如何开发基于强化学习的生产力软件,在结束时提交项目个性化研究课题报告,进行成果展示。

个性化研究课题参考:

强化学习在博弈论中的应用:类alpha算法开发

利用经验留存解决强化学习所需样本太多问题的可行性分析

强化学习中的机器奖励设置方法迭代

为强化学习过拟合的特定场景重新建模的自动过程研究

具有精确尺度估计的动作-评价网络结构与强化学习优势函数

项目大纲

强化学习:项目将聚焦遗传算法和强化学习框架

环境:强化学习由智能体和环境两部分构成。项目将探讨离策略、无模型强化学习算法 Q-learning、行动者-批评(actor-critic;AC)模型、马尔可夫决策过程等

优化:项目将深入学习强化学习与优化控制集成与控制

集成:项目将进一步探讨图神经网络、(graph neural networks; GNN)、自动机器学习(Auto ML)等

项目回顾与成果展示

论文辅导

导师介绍

Pietro剑桥大学计算机科学与技术终身正教授

Pietro教授是意大利国家认定Top100科学家,研究兴趣为人工智能图神经网络建模,在国际知名学术期刊发表论文多篇,曾荣获欧盟委员会未来与新兴技术(FET;迄今欧盟规模最大、资助力度最强的科研资助项目之一)会展三等奖。 H-index64被引用次数35,000+。2021年连中三篇计算机顶会ICML,其论文还曾发表在包括世界级学术期刊 《Nature》。

外,教授还持有欧洲学习和智能系统实验室(Ellis;欧洲大型跨国人工智能研究所,目前拥有千位全球顶尖计算机工程师、数学家和其他领域科学家,旨在重构欧洲人工智能前沿研究)席位、剑桥大学大数据研究指导委员会席位。

【竞赛报名/项目咨询请加微信:mollywei007】

上一篇

美国文理学院Liberal Arts College怎么样?

下一篇

斯坦福 EE电子工程-BME生物医学工程专题:探秘“电子皮肤”,智能触觉传感器的原理、设计及应用

你也可能喜欢

  • 暂无相关文章!

评论已经被关闭。

插入图片
返回顶部
Baidu
map