8 июн 2016 г. - Обучение с подкреплением
Описание:
Обучение с подкреплением — один из способов машинного обучения, в ходе которого система обучается, взаимодействуя со средой. Самые перспективные исследования в этой области ведет лаборатория DeepMind, подразделение Alphabet. В 2016 году ее программа AlphaGo обыграла мирового чемпиона Ли Седоля со счетом 4:1 в го — древнекитайскую настольную игру, которая долгое время считалась недоступной искусственному интеллекту.
Сотрудники DeepMind предполагают, что перспективы обучения с подкреплением гораздо шире игрового искусственного интеллекта. Например, оно позволит роботам учиться ходить и манипулировать незнакомыми предметами без предварительных исчерпывающих инструкций, а беспилотным автомобилям — извлекать опыт из каждой поездки.
Добавлено на ленту времени:
Современные информационные технологии будущего
В ленте времени присутствуют технологии из медицины, культур...
Дата:
Изображения: