News list for "Deepseek"

DeepSeek-V3 calls itself ChatGPT? The truth or points to "AI pollution"

On December 30th, "DeepSeek-V3 surpassed all open-source models to date." This is the conclusion reached after testing DeepSeek-V3 by Artificial Analysis, a foreign independent evaluation agency. More importantly, the model used NVIDIA H800 GPU to train DeepSeek-V3 in just two months, at a cost of only about 5.58 million US dollars. However, during use, the reporter found that DeepSeek-V3 actually claimed to be ChatGPT. For a time, there were doubts about "whether DeepSeek-V3 is training with Ch...

clock
2024-12-30 05:46:50
DeepSeek-V3自称ChatGPT?真相或指向“AI污染”

12月30日讯,“DeepSeek-V3超越了迄今为止所有开源模型。”这是国外独立评测机构Artificial Analysis测试了DeepSeek-V3后得出的结论。更重要的是,该模型使用英伟达H800 GPU在短短两个月内就训练出了DeepSeek-V3,仅花费了约558万美元。然而,在使用过程中,记者发现,DeepSeek-V3竟然声称自己是ChatGPT。一时间,“DeepSeek-V3是否在使用ChatGPT输出内容进行训练”的质疑声四起。TechCrunch猜测称,深度求索可能用了包含GPT-4通过ChatGPT生成的文本的公共数据集。“如果DeepSeek-V3是用这些数据进行训练的,那么该模型可能已经记住了GPT-4的一些输出,现在正在逐字反刍它们。”不过,DeepSeek-V3也并非是第一个错误识别自己的模型,谷歌的Gemini等有时也会声称是竞争模型。例如,Gemini在普通话提示下称自己是百度的文心一言聊天机器人。造成这种情况的原因可能在于,AI公司在互联网上获取大量训练数据,但是,现如今的互联网本就充斥着各种各样用AI生产出来的数据。

clock
2024-12-30 05:46:50