據Deepseek官方公眾號消息,今日(12月1日),DeepSeek發布兩個正式版模型:DeepSeek-V3.2和DeepSeek-V3.2-Speciale。官方網頁端、App和API均已更新為正式版DeepSeek-V3.2。Speciale版本目前僅以臨時API服務形式開放,以供社區評測與研究。
據官方介紹,DeepSeek-V3.2的目標是平衡推理能力與輸出長度,適合日常使用,例如問答場景和通用Agent任務場景。DeepSeek-V3.2-Speciale的目標是將開源模型的推理能力推向極致,探索模型能力的邊界。
DeepSeek是2023年成立于杭州的人工智能公司,由幻方量化孵化。創始團隊由梁文鋒領銜,成員來自頂尖高校與國際機構技術專家。
今年1月20日,該公司正式發布推理大模型DeepSeek-R1。該模型以極低的成本實現了與OpenAI o1相當的性能,被認為是大模型行業的最大“黑馬”。