技术栈详情
🎨
前端技术
1 项React
⚙️
后端技术
2 项Python
C++ / CUDA
底层优化使用CUDA
🤖
AI 技术
2 项DeepSeek-V3
MoE架构大模型,671B参数
DeepSeek-R1
推理强化学习模型,媲美o1
☁️
基础设施
1 项自建GPU集群
架构概述
DeepSeek 技术架构
DeepSeek是深度求索推出的AI产品,以极低的API价格和强大的推理能力著称。DeepSeek-R1采用强化学习方法训练推理链能力,在数学、编程等任务上表现优异。
核心技术亮点:MoE(混合专家)架构、纯强化学习训练路径、极致的推理成本优化。模型已完全开源。
数据来源
最后更新:2025-02-01 · 数据仅供参考,可能随时间变化