返回首页
DeepSeek

DeepSeek

深度求索出品,高性能开源大模型,推理能力突出

免费国内DeepSeek-V3 / R1
官方网站 发布者:深度求索 (DeepSeek) · 中国浏览量:9.5w
DeepSeek 截图1

技术栈详情

🎨

前端技术

1 项
React
⚙️

后端技术

2 项
Python
C++ / CUDA

底层优化使用CUDA

🤖

AI 技术

2 项
DeepSeek-V3

MoE架构大模型,671B参数

DeepSeek-R1

推理强化学习模型,媲美o1

☁️

基础设施

1 项
自建GPU集群

架构概述

DeepSeek 技术架构

DeepSeek是深度求索推出的AI产品,以极低的API价格和强大的推理能力著称。DeepSeek-R1采用强化学习方法训练推理链能力,在数学、编程等任务上表现优异。

核心技术亮点:MoE(混合专家)架构、纯强化学习训练路径、极致的推理成本优化。模型已完全开源。

标签

国产AI深度求索开源大模型推理能力低成本

数据来源

官方
查看
GitHub
查看

最后更新:2025-02-01 · 数据仅供参考,可能随时间变化