【AI软件DeepSeek为什么会火?】萍聚社区-德国热线-德国实用信息网人工智能

我爱免费 发表于 2025-1-29 14:45

AI软件DeepSeek为什么会火?

作者：微信文章
昨天，终于见证历史，deepseek登顶美区苹果的AppStore 应用商店，超越了 ChatGPT。

昨晚直接干崩了英伟达、台积电。DeepSeek-R1 的横空出世，在 AI 圈掀起了一阵狂潮。

这款号称“中国版 o1”的模型，其强大的能力令人瞩目，特别是在数学和编程领域，更是展现出了碾压级的优势。

这款AI软件，不仅性能卓越而且成本低。DeepSeek的AI模型R1性能可与OpenAI的顶级模型比肩，在数学、代码等任务上更出色。其训练成本仅557万美元，用2048块英伟达“阉割版”芯片H800，两个月就完成训练，而OpenAI训练类似模型需上亿美元。每百万次查询成本仅0.14美元，相比OpenAI的7.5美元，便宜了98%。

技术性能优势。DeepSeek的最新模型DeepSeek-R1在逻辑推理、数学推理和实时问题解决方面表现出色，其在数学500测试中准确率达97.3%，与OpenAI的O1相当。并且，它通过强化学习训练，无需监督微调，采用组相对策略优化提升推理能力，还极大降低了推理所需的处理能力，能在较低性能硬件上有效运行，扩大了用户群体.

成本效益显著。训练DeepSeek-R1仅花费约660万美元，相比之下，训练GPT-4据说成本超1亿美元。其模型API价格也比顶级提供商低90%，可大幅降低大规模应用AI的成本，对预算有限的开发者和企业极具吸引力.

开源可定制性强。与基于商业技术的ChatGPT和闭源的Claude 3不同，DeepSeek完全开源，开发者可根据自身需求对模型进行修改、扩展和个性化定制，为企业和研究人员提供了更大的灵活性.

语境窗口大。ChatGPT-4的语境窗口最多为8k tokens，专业版为32k tokens，而DeepSeek提供了128k token的语境窗口，更适用于处理如研究论文、法律文件、复杂编码项目等大量文本分析工作，可实现更长的对话和更好的记忆保留.

应用效果出色。比如在为药学研究生提供AI辅助药物设计学习建议时，能给出详细且有条理的回答，包括编程基础、课程学习、实战入门等内容；还能为婚礼摄影行业编写选片程序，展现出其在不同领域的强大应用能力.

Deepseek产生的影响是多方面的。

技术研发层面

引发技术反思。Deepseek以低成本、低算力实现与西方顶尖AI模型媲美的性能，让西方科技界反思高成本、大规模硬件投入的研发模式是否最优，促使其探索更高效、经济的技术路径。

激发技术竞争。为西方AI企业带来竞争压力，迫使其加快技术创新，提升模型性能和效率，如OpenAI、谷歌等可能会进一步加大在算法优化、模型架构改进等方面的投入。

拓展技术思路。其开源模式为西方开发者提供了新的技术思路和代码资源，可在其基础上进行二次开发和创新，推动AI技术的多元化发展。

市场格局层面

冲击科技股市场。Deepseek的成功引发美国科技股暴跌，英伟达、博通等芯片企业以及相关科技巨头股价大幅下跌，市值蒸发巨大，使投资者对西方科技公司的AI投资前景产生疑虑。

改变市场竞争格局。在应用商店超越ChatGPT等西方主流AI应用，表明西方AI产品在市场上的优势地位受到挑战，市场份额可能会被分流。

影响产业经济结构。其低成本、高效率的模式若广泛推广，会使AI技术普及速度加快，降低行业对高端计算资源的依赖，更多中小企业能参与AI开发应用，重塑西方AI产业经济结构。

人才与创新层面

吸引人才流动。展现出的创新能力和发展潜力，可能吸引部分西方AI领域人才关注，甚至流向中国或与中国企业合作，影响西方科技人才格局。

推动创新机制变革。西方科技企业可能借鉴Deepseek背后的创新机制，如政府支持、资本注入、开放合作等，优化自身创新生态，以提升创新能力和效率。

战略与政策层面

调整科技战略。使西方政府和企业重新评估自身在AI领域的战略布局，可能加大对AI研发的投入和政策支持，以维持技术领先地位。

引发政策调整。可能促使西方国家调整对中国科技企业的政策，如进一步加强技术封锁，或在某些领域寻求合作与竞争并存的新策略。

页: [1]

萍聚社区-德国热线-德国实用信息网's Archiver

AI软件DeepSeek为什么会火?