DeepSeek,全称杭州深度求索人工智能基础技术研究有限公司 [41]。DeepSeek 是一家创新型科技公司 [3],成立于2023年7月17日 [41],使用数据蒸馏技术 [42],得到更为精炼、有用的数据 [42]。由知名私募巨头幻方量化孕育而生 [3],专注于开发先进的大语言模型(LLM)和相关技术 [41]。注册地址 [6]:浙江省杭州市拱墅区环城北路169号汇金国际大厦西1幢1201室 [6]。法定代表人为裴湉 [6],经营范围包括技术服务、技术开发、软件开发等 [6]。
2024年1月5日,发布DeepSeek LLM(深度求索的第一个大模型) [9]。1月25日,发布DeepSeek-Coder [9]。2月5日,发布DeepSeekMath。 [9]3月11日,发布DeepSeek-VL [9]。5月7日,发布DeepSeek-V2 [9]。6月17日,发布DeepSeek-Coder-V2 [9]。9月5日,更新 API 支持文档,宣布合并 DeepSeek Coder V2 和 DeepSeek V2 Chat ,推出 DeepSeek V2.5 [7]。12月13日,发布DeepSeek-VL2 [9]。12月26日晚,正式上线DeepSeek-V3首个版本并同步开源 [1-2]。2025年1月31日,英伟达宣布DeepSeek-R1模型登陆NVIDIANIM。同一时段内,亚马逊和微软也接入DeepSeek-R1模型。英伟达称,DeepSeek-R1是最先进的大语言模型。 [50]2月5日消息,DeepSeek-R1、V3、Coder 等系列模型,已陆续上线国家超算互联网平台。 [66]2月6日消息,澳大利亚政府以所谓“担心安全风险”为由,已禁止在所有政府设备中使用DeepSeek。
全网最好用、最专业的 PPT 设计插件