33
/fr/
AIzaSyAYiBZKx7MnpbEhh9jyipgxe19OcubqV5w
August 1, 2025
Public Timelines
Menu
Public Timelines
FAQ
Public Timelines
FAQ
For education
For educational institutions
For teachers
For students
Cabinet
For educational institutions
For teachers
For students
Open cabinet
Créer
Close
Create a timeline
Public timelines
Library
FAQ
Télécharger
Export
Créer une copie
Premium
Intégrer dans le site Web
Share
New timeline
Category:
Autre
mise à jour avec succès:
15 mai 2023
0
0
121
Auteurs
Created by
MorK
Attachments
Comments
First Timeline
By
MorK
14 mai 2023
0
0
95
Les événements
Deep Blue выигрывает чемпиона мира по шахматам (устройство разработано компанией: IBM)
ALE: Arcade Learning Environment (под авторством: Марка Беллемаре и других)
Публикация статьи "Playing Atari with Deep Reinforcement Learning" (под авторством: Владимира Мниха и других, компания: DeepMind)
Генеративно-состязательная сеть (GAN) (разработана: Яном Гудфеллоу из компании Google)
AlphaGo побеждает чемпиона мира по го (программа разработана компанией: DeepMind)
Monte Carlo Go (под авторством: Бернда Брюгмана)
TD-Gammon (разработана Джеральдом Тезауро в IBM)
Выход статьи "A fast learning algorithm for deep belief nets" (под авторством: Джеффри Хинтона и других)
Публичная бета-версия OpenAI Gym (разработана компанией: OpenAI)
OpenAI Five одерживает победу в игре Dota 2 в формате 1 на 1 против профессиональных игроков (разработана компанией: OpenAI)
Статья «Human-level performance in first-person multiplayer games with population-based deep reinforcement learning» (под авторством Макс Ядерберг и других, компания: DeepMind)
Статья "Attention Is All You Need" (под авторством: Ашиш Васвани и других)
Статья «Evolving Reinforcement Learning Algorithms»
Périodes
1. AlphaStar достигает высшего игрового ранга - грандмастера; 2. Победа OpenAI Five над чемпионами The International 2018 в серии игр до трех побед; 3. Pluribus эффективно противостоял элитным профессиональным игрокам в покер; 4. Технология OpenAI в Hide and Seek.
1. Generative Pre-trained Transformer 3 (GPT-3); 2. MuZero для го, шахмат, сёги и игр Atari; 3. Рост использования BERT.
Научная литература: 1. "Глубокое обучение с подкреплением: теория и практика на языке Python"; 2. "Мультиагентное обучение с подкреплением"; 3. "Transformers for Machine Learning: A Deep Dive"; 4. "Natural Language Processing with Transformers"; 5. "Applying Reinforcement Learning on Real-World Data with Practical Examples in Python"; 6. "PRIMA 2022: Principles and Practice of Multi-Agent Systems"; 7. "Offline Meta-Reinforcement Learning for Industrial Insertion" и так далее.
Технологии: 1. ChatGPT от OpenAI; 2. GPT-4 от OpenAI; 3. Bard от Google; 4. Bing со встроенным ChatGPT от Microsoft; 5. GigaChat от Сбера.
About & Feedback
Un accord
Confidentialité
Bibliothèque
FAQ
Support 24/7
Cabinet
Get premium
Donate
The service accepts bank transfer (ACH, Wire) or cards (Visa, MasterCard, etc). Processed by Stripe.
Secured with SSL
Comments