在2025年1月底,技术世界对单个名称的节奏的氛围:DeepSeekr1。自1月20日发行以来,这位中国对话助理被推向了美国应用商店的下载量,这是一种令人着迷的媒体迷人的主题。我们必须将他与他的伟大美国竞争对手进行比较。
标题是链接的,Dithyrambics:”中国人的兴趣使一切感到不安»,«DeepSeek革命»,«l'ia使硅谷颤抖»。这个胜利的叙述但是,神秘的现实是更细微的现实,谁应该更靠近它。
面对技术悖论的媒体欣快
媒体对DeepSeek的热情是基于一个有吸引力的承诺:表演与Chatgpt的表演相等对于必要的计算资源的一小部分。与NVIDIA生产的16,000多名H100 GPU的竞争对手不同,这家中国初创企业仅使用2,000个培训其模型。
通过技术媒体在合唱中进行的这种断言通常比进行批判性分析更迅速地怀疑,这将需要更深入的检查。
这种宣称的效率是一场技术革命,实际上提出了一系列令人不安的问题。一家公司如何在2023年在杭州创建前Nihilo,由某些Liang Wenfeng领导,其路线仍然奇怪地不透明,她会在几个月内完成哪些具有巨大资源和数十年专业知识的技术巨头仍在努力实现?
因为事实存在:这家初创企业已经从DeepSeekr1免费制作了几种模型,以帮助研究人员进行基准。其中一些特别有效,甚至超过了Openai的GPT O1米尼。山姆·奥特曼本人赞扬了Deepseek的表演。
金融市场的暴力反应 - 在一次会议上对10亿美元的历史纠正 - 一种系统的关注,超出了简单的股票市场估值。这次冲击波特别影响(-17%)和其他美国技术支柱,翻译对模型的深入质疑西方人工智能的发展。
的确,如果DeepSeek确实通过减少消费来匹配ChatGpt的表现,这将意味着美国巨头进行的大量投资 - 数百亿美元在基础设施和研究方面 - 将基于错误的基础。
开源,不透明机制的透明度
与其他大型LLM不同,DeepSeek是开源的。具有透明度保证的特征。但是,这种类型的架构从网络的角度来看,必然会使其更加脆弱。潜在的漏洞,用户数据收集,持续学习的目的仍然不确定。
从理论上讲,DeepSeek的架构以其分布性质可以将每个应用程序得出的每个应用程序转变为潜在的收集点。因此,开发人员受到可访问技术的承诺所吸引,因此将成为非自愿链接庞大的数据采集网络。
众所周知,聊天机器人倾向于政治中立,直到有时非常无聊(我们特别想到双子座)。关于DeepSeek,它不止于此。面对与中国历史或政治有关的问题,明显的助手系统地与北京的官方立场保持一致。
记者的记者监护人将Deepseek推到了这个小游戏中,并将结果带入了这个项目。蒂安曼(Tiananmen)的事件,香港的局势,台湾的地位:如此多的主题忠实地再现中国共产党的言论。
就我们而言,我们还试图对敏感主题进行挑剔,并我们遇到了相同的结论。关于维格尔人的棘手问题,DeepSeek Botte通过回答联系:”对不起,这超越了我的技能。让我们谈谈其他事情»。
DeepSeek发现很难说出真相?
另一个例子,更多的问题:西藏的情况。在这里,我们几乎有印象直接听到中国聚会;而是看到。
最后一句话很冷。 ©屏幕截图 / DeepSeek
DeepSeek通过该文章的这一部分的复制和粘贴回答:“”关于与中国相关的敏感主题,例如蒂安曼人的事件,香港的局势,台湾的地位或维利格尔人的问题,DeepSeek与中国政府的官方立场保持一致,同时寻求提供平衡和尊重回答»。它具有清晰的优点。
但是,DeepSeek仍然存在相当有效的语言模型,免费(从货币的角度来看),哪个掌握了所有好的LLM必须知道该怎么做的事情。 IT代码,写作,合成,数学计算等。让我不要忘记,这种显而易见的自由可能会被隐藏得更高的成本:我们的智力和信息自主权。
- DeepSeek的效率和迅速采用给人留下了深刻的印象,但其闪电发展使人们对其透明度和真正的野心产生了怀疑。
- 他对敏感学科的反应的取向反映了明确的政治影响,质疑该模型的客观性。
- 除了技术能力外,该模型还体现了围绕数据控制和智力独立性的战略问题。
i -nfo.fr- iphon.fr官方应用
平等:Ag Tescience