直播预告 | 逐步公平性约束下的强化学习

点击蓝字

直播预告 | 逐步公平性约束下的强化学习_第1张图片

关注我们

AI TIME欢迎每一位AI爱好者的加入!

直播预告 | 逐步公平性约束下的强化学习_第2张图片

哔哩哔哩直播通道

扫码关注AI TIME哔哩哔哩官方账号预约直播

直播预告 | 逐步公平性约束下的强化学习_第3张图片

11月10日 10:00—11:00

直播预告 | 逐步公平性约束下的强化学习_第4张图片

直播预告 | 逐步公平性约束下的强化学习_第5张图片

讲者简介

吴志威(Steven Wu)

现任职卡内基梅隆大学计算机学院教授。2017年博士毕业于宾夕法尼亚大学,2017到2018年在微软研究所(纽约)担任博士后,2018到2020年在明尼苏达大学担任助理教授。主要研究机器学习和算法设计,特别关注对隐私数据的保护,算法的公平性,博弈论和强化学习等方向。他的工作发表于Science, PNAS, ICML, NeurIPS, ICLR, STOC, FOCS, COLT, EC等顶级期刊和会议。曾获得宾夕法尼亚大学Morris and Dorothy Rubinoff最佳毕业论文奖 (2017), Facebook/Meta Research Award (2018, 2021, 2022), Okawa Foundation Research Grant (2021), Google Faculty Research Award (2019), J.P. Morgan Faculty Award (2019, 2022)等奖项。

个人主页:https://zstevenwu.com/

直播预告 | 逐步公平性约束下的强化学习_第6张图片

讲者简介

邓准:

现任职哥伦比亚大学博士后研究员, 同时也是西蒙斯学院算法公平性理论合作组的一员。此前毕业于哈佛大学计算机专业,师从Cynthia Dwork。他目前的研究兴趣是理论计算机和社会科学的交叉领域,以及机器学习。

个人主页:https://www.zhundeng.org

报告题目

逐步公平性约束下的强化学习

报告简介

现代社会中,人工智能算法无处不在,被应用于信贷,就业和住房分配等领域。对于人工智能的广泛应用,为算法决策方面提供公平性至关重要。此外,许多应用场景包含了动态反馈:政策制定影响个人的状态分布,而状态分布反过来又影响下一步的政策决定。基于此,我们介绍了逐步公平性约束下的强化学习 (RL) ,要求每一步的决策都需要保证算法公平性。我们为此种强化学习提供了算法,并提供了关于策略最优性和违反公平性的惩罚的理论保证。我们的框架提供了有用的工具来研究公平约束在动态决策中的影响,并为强化学习领域提出了新的挑战。

大家可以在群内进行提问,请添加“AI TIME小助手(微信号:AITIME_HY)”,回复“RL”,拉您进群”!

直播预告 | 逐步公平性约束下的强化学习_第7张图片

AI TIME微信小助手

直播预告 | 逐步公平性约束下的强化学习_第8张图片

主办单位:国际科技信息中心

承       办AI TIME

往期精彩文章推荐

直播预告 | 逐步公平性约束下的强化学习_第9张图片

记得关注我们呀!每天都有新知识!

 关于AI TIME 

AI TIME源起于2019年,旨在发扬科学思辨精神,邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索,加强思想碰撞,链接全球AI学者、行业专家和爱好者,希望以辩论的形式,探讨人工智能和人类未来之间的矛盾,探索人工智能领域的未来。

迄今为止,AI TIME已经邀请了800多位海内外讲者,举办了逾400场活动,超400万人次观看。

直播预告 | 逐步公平性约束下的强化学习_第10张图片

我知道你

在看

~

b1555caf9298b82653ef99d132e79cbe.gif

点击 阅读原文 预约直播!

你可能感兴趣的:(直播预告 | 逐步公平性约束下的强化学习)