跳转到主要内容
移动世界。
强化学习的机器人

主导图片©BublikHaus / Adobe Stock

Treats-for-tricks工作训练狗显然,人工智能机器人,太。

这是一个新的研究在约翰霍普金斯大学,研究人员已经开发了一种新的训练系统,通过模仿狗学习新技巧的方式,可以让机器人在现实世界中快速学习如何做多步任务。

强化学习

有一天,人工智能机器人可以打扫我们的房间,照顾长者做所有枯燥、肮脏和危险的事工作我们不想这样做。

但现实世界是复杂的。开发人员将需要训练机器人在工作中学习——例如,让一个洗碗机器人识别每一个可能的脏盘子是不可能的,但当水槽里出现一个不熟悉的盘子时,它仍然需要知道该怎么做。

开发人员培训ai的一种方法是让他们探索虚拟世界,并在他们做了正确的事情时“奖励”他们。这技术被称为强化学习,这和我们训练狗狗的方式很像——它们耍把戏,就能得到奖励。

虽然强化学习可能是有效的,但它也可能是耗时的——人工智能可能会尝试很多东西,然后才会得到值得奖励的技巧。

为了克服这个限制,JHU团队开发了一种新的强化学习框架,他们称之为积极任务计划(SPOT)。

“这里的问题是我们如何让机器人学习一种技能?”主要作者安德鲁·亨特说他在新闻发布会上说。“我养过狗,所以我知道奖励的作用,这也是我设计学习算法的灵感来源。”

看到现货堆栈

在SPOT框架中,机器人的“奖励”不是美味的食物,而是数字点数。与此同时,“诀窍”是将多个块堆叠在一起。

研究人员发现,加快训练时间的一种方法是在人工智能完成“子任务”时给予奖励。这就相当于试着训练一只狗坐下,如果它开始放下它的屁股——这只狗并没有做你想要的事情,但它走在了正确的道路上。

“以前需要一个月才能达到100%的准确率。我们两天就完成了。”

安德鲁Hundt

如果人工智能因为做了否定其之前进度的事情而丢分,比如在堆叠砖块后推倒砖块,这也会有所帮助——这被称为“进度逆转”。

他们还在AI中编写了一些常识,根据直觉预编程,以避免在死胡同中浪费时间,并更快地意识到应该做什么。

“对着空气说话不值得机器人花时间,但是机器人通过试错来学习,直到现在,他们通常不会有这种直觉,”Hundt告诉自由思考。“我们已经开发出一种实用的方法,让机器人把这些常识应用到安全检查中,它会跳过那些绝对不值得一试的动作。”

SPOT框架的未来

总的来说,他们的框架允许他们训练一个实际的机器人——而不仅仅是虚拟世界中的人工智能——精确地完成多步骤任务,比另一个常见的强化学习要快得多方法

Hundt在新闻发布会上说:“(机器人)能很快学会正确的行为以获得最好的奖励。”“事实上,机器人需要一个月的练习才能达到100%的准确率。我们两天就完成了。”

他的希望是,SPOT框架可能有一天会帮助人工智能开发者训练机器人做比堆叠积木更复杂的事情。

“我们相信,随着技术的进一步发展,从家庭护理、外科手术到仓储,甚至是自动驾驶汽车,这项技术有可能让各种行业变得更好,”他告诉Freethink。

我们很乐意收到你的来信!如果你对这篇文章有意见,或者你对未来自由思考的故事有建议,请发邮件到(电子邮件保护)

下一个

人工智能
训练家用机器人的视觉和听觉
家庭机器人
人工智能
训练家用机器人的视觉和听觉
Facebook的人工智能实验室为其嵌入式人工智能训练平台发布了新工具,包括训练家用机器人对声音做出反应的工具。

Facebook的人工智能实验室为其嵌入式人工智能训练平台发布了新工具,包括训练家用机器人对声音做出反应的工具。

未来的探索
机器人能读懂你的扑克脸
情感智能
未来的探索
机器人能读懂你的扑克脸
情绪检测技术可能是下一个个性化前沿。但这对隐私意味着什么呢?

情绪检测技术可能是下一个个性化前沿。但这对隐私意味着什么呢?

错误的
机器人会抢走我们的工作吗?
机器人会抢走我们的工作吗?
看现在
错误的
机器人会抢走我们的工作吗?
自工业革命开始以来,对自动化的恐惧一直在上升。从织布机到汽车……
看现在

自工业革命开始以来,对自动化的恐惧一直在上升。从编织机器到汽车再到电脑,关于机器人将抢走我们工作的呼声越来越高。但如果机器人抢走了我们的工作——它们的确是!-那为什么工作似乎比以往任何时候都多?我们哪里错了?

机器人
这个人工智能机器人可能会成为你最喜欢的同事
人工智能机器人
机器人
这个人工智能机器人可能会成为你最喜欢的同事
欧洲研究人员开发出了一款人工智能机器人,可以与人类安全共事,能够预测人类的需求,并为人类提供一双强壮的双手。

欧洲研究人员开发出了一款人工智能机器人,可以与人类安全共事,能够预测人类的需求,并为人类提供一双强壮的双手。

环境
机器人比赛研究南极洲的巨大冰融化
机器人比赛研究南极洲的巨大冰融化
环境
机器人比赛研究南极洲的巨大冰融化
一艘名为“冰之鳍”(Icefin)的半自动考察船正在执行一项任务,寻找斯韦茨冰川(Thwaites Glacier)的线索。斯韦茨冰川是非洲大陆融化速度最快的冰川之一。
通过莎拉·威尔斯

一艘名为“冰之鳍”(Icefin)的半自动考察船正在执行一项任务,寻找斯韦茨冰川(Thwaites Glacier)的线索。斯韦茨冰川是非洲大陆融化速度最快的冰川之一。

农业
这个巨大的农业机器人正在帮助确保未来的食物安全
农业机器人
农业
这个巨大的农业机器人正在帮助确保未来的食物安全
一个大型农业机器人正在分析亚利桑那州的农作物,帮助识别能够在更热的气候下生长的作物,以确保未来的食物安全。

一个大型农业机器人正在分析亚利桑那州的农作物,帮助识别能够在更热的气候下生长的作物,以确保未来的食物安全。

起义
建筑机器人建造太空殖民地
建设机器人
起义
建筑机器人建造太空殖民地
将建筑机器人送入外太空将有助于为人类的探索铺平道路,但前方还有一些真正的挑战。
通过Tien阮

将建筑机器人送入外太空将有助于为人类的探索铺平道路,但前方还有一些真正的挑战。

机器人
水下机器人可能是深海采矿的未来
机器人
机器人
水下机器人可能是深海采矿的未来
科技需要原材料,有些还需要海底铺设。水下机器人会成为深海采矿的未来吗?

科技需要原材料,有些还需要海底铺设。水下机器人会成为深海采矿的未来吗?