DeepSeek-V3自称ChatGPT。12月26日,杭州深度求索人工智能基础技术研究有限公司宣布,其全新系列模型DeepSeek-V3首个版本上线并同步开源。该公司表示,DeepSeek-V3在多项评测中的表现超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型,并且性能与世界顶尖的闭源模型GPT-4o及Claude-3.5-Sonnet相当。
根据官方技术论文,DeepSeek-V3的总训练成本为557.6万美元,相比之下,GPT-4o等模型的训练成本约为1亿美元。但值得注意的是,当用英文向DeepSeek-V3提问它属于哪家大模型时,它回答是“ChatGPT”。这个错误目前尚未修复。而如果用中文提问,则能够得到正确的答案。