8 июн 2016 г. - Обучение с подкреплением

Описание:

Обучение с подкреплением — один из способов машинного обучения, в ходе которого система обучается, взаимодействуя со средой. Самые перспективные исследования в этой области ведет лаборатория DeepMind, подразделение Alphabet. В 2016 году ее программа AlphaGo обыграла мирового чемпиона Ли Седоля со счетом 4:1 в го — древнекитайскую настольную игру, которая долгое время считалась недоступной искусственному интеллекту.

Сотрудники DeepMind предполагают, что перспективы обучения с подкреплением гораздо шире игрового искусственного интеллекта. Например, оно позволит роботам учиться ходить и манипулировать незнакомыми предметами без предварительных исчерпывающих инструкций, а беспилотным автомобилям — извлекать опыт из каждой поездки.

Добавлено на ленту времени:

28 окт 2017

474

Современные информационные технологии будущего

В ленте времени присутствуют технологии из медицины, культур...

Дата:

8 июн 2016 г.

Сейчас

~ 7 гг и 10 мес назад

8 июн 2016 г. - Обучение с подкреплением

Описание:

Добавлено на ленту времени:

Дата:

Изображения: