AI软件DeepSeek为什么会火?
作者:微信文章昨天,终于见证历史,deepseek登顶美区苹果的AppStore 应用商店,超越了 ChatGPT。
昨晚直接干崩了英伟达、台积电。DeepSeek-R1 的横空出世,在 AI 圈掀起了一阵狂潮。
这款号称“中国版 o1”的模型,其强大的能力令人瞩目,特别是在数学和编程领域,更是展现出了碾压级的优势。
这款AI软件,不仅性能卓越而且成本低。DeepSeek的AI模型R1性能可与OpenAI的顶级模型比肩,在数学、代码等任务上更出色。其训练成本仅557万美元,用2048块英伟达“阉割版”芯片H800,两个月就完成训练,而OpenAI训练类似模型需上亿美元。每百万次查询成本仅0.14美元,相比OpenAI的7.5美元,便宜了98%。
技术性能优势。DeepSeek的最新模型DeepSeek-R1在逻辑推理、数学推理和实时问题解决方面表现出色,其在数学500测试中准确率达97.3%,与OpenAI的O1相当。并且,它通过强化学习训练,无需监督微调,采用组相对策略优化提升推理能力,还极大降低了推理所需的处理能力,能在较低性能硬件上有效运行,扩大了用户群体.
成本效益显著。训练DeepSeek-R1仅花费约660万美元,相比之下,训练GPT-4据说成本超1亿美元。其模型API价格也比顶级提供商低90%,可大幅降低大规模应用AI的成本,对预算有限的开发者和企业极具吸引力.
开源可定制性强。与基于商业技术的ChatGPT和闭源的Claude 3不同,DeepSeek完全开源,开发者可根据自身需求对模型进行修改、扩展和个性化定制,为企业和研究人员提供了更大的灵活性.
语境窗口大。ChatGPT-4的语境窗口最多为8k tokens,专业版为32k tokens,而DeepSeek提供了128k token的语境窗口,更适用于处理如研究论文、法律文件、复杂编码项目等大量文本分析工作,可实现更长的对话和更好的记忆保留.
应用效果出色。比如在为药学研究生提供AI辅助药物设计学习建议时,能给出详细且有条理的回答,包括编程基础、课程学习、实战入门等内容;还能为婚礼摄影行业编写选片程序,展现出其在不同领域的强大应用能力.
Deepseek产生的影响是多方面的。
技术研发层面
引发技术反思。Deepseek以低成本、低算力实现与西方顶尖AI模型媲美的性能,让西方科技界反思高成本、大规模硬件投入的研发模式是否最优,促使其探索更高效、经济的技术路径。
激发技术竞争。为西方AI企业带来竞争压力,迫使其加快技术创新,提升模型性能和效率,如OpenAI、谷歌等可能会进一步加大在算法优化、模型架构改进等方面的投入。
拓展技术思路。其开源模式为西方开发者提供了新的技术思路和代码资源,可在其基础上进行二次开发和创新,推动AI技术的多元化发展。
市场格局层面
冲击科技股市场。Deepseek的成功引发美国科技股暴跌,英伟达、博通等芯片企业以及相关科技巨头股价大幅下跌,市值蒸发巨大,使投资者对西方科技公司的AI投资前景产生疑虑。
改变市场竞争格局。在应用商店超越ChatGPT等西方主流AI应用,表明西方AI产品在市场上的优势地位受到挑战,市场份额可能会被分流。
影响产业经济结构。其低成本、高效率的模式若广泛推广,会使AI技术普及速度加快,降低行业对高端计算资源的依赖,更多中小企业能参与AI开发应用,重塑西方AI产业经济结构。
人才与创新层面
吸引人才流动。展现出的创新能力和发展潜力,可能吸引部分西方AI领域人才关注,甚至流向中国或与中国企业合作,影响西方科技人才格局。
推动创新机制变革。西方科技企业可能借鉴Deepseek背后的创新机制,如政府支持、资本注入、开放合作等,优化自身创新生态,以提升创新能力和效率。
战略与政策层面
调整科技战略。使西方政府和企业重新评估自身在AI领域的战略布局,可能加大对AI研发的投入和政策支持,以维持技术领先地位。
引发政策调整。可能促使西方国家调整对中国科技企业的政策,如进一步加强技术封锁,或在某些领域寻求合作与竞争并存的新策略。
页:
[1]