26 dic 2024 anni - deepseek v3
Descrizione:
2024年12月26日
DeepSeek-V3是由中国AI初创公司杭州深度求索人工智能基础技术研究有限公司于2024年12月26日发布的AI大模型。 [1] [9]
DeepSeek-V3为自研 MoE 模型,671B参数,激活37B,在 14.8Ttoken上进行了预训练。
软件名称DeepSeek-R1
上线时间2025年1月20日
DeepSeek-R1,是幻方量化旗下AI公司深度求索(DeepSeek)研发的推理模型 [1]。DeepSeek-R1采用强化学习进行后训练,旨在提升推理能力,尤其擅长数学、代码和自然语言推理等复杂任务 [4-6]。
2025年1月20日,幻方量化旗下AI公司深度求索(DeepSeek)正式发布DeepSeek-R1模型,并同步开源模型权重 [6]。
Aggiunto al nastro di tempo:
Data:
~ 5 months and 27 days ago