新闻 发表于 2025-1-25 05:13

AI时代的变革者:重估数据价值,塑造互联网新格局

作者:微信文章
核心结论:

国内投资者对AGI的三大核心分歧:(1) 技术是否突破;(2) 数据价值有多大;(3) 国内应用能否跟上。实际使用ChatGPT的感受表明机器对表面文字以及上下文的联系通用AGI已经可以扮演人和机器沟通的翻译官。应用发展缓慢的原因是基于对话框的AGI应用门槛极高,阻碍了应用的推广和用户的感知,同时方法论数据的缺失导致AGI在数据完备的情况下执行效率较低。现阶段闭源和开源并不是完全的竞争关系,闭源大模型更像是开源大模型的导师。大模型存在商业化悖论,高复杂度高算力消耗场景商业化难度较高。国内垂直开源大模型的研发结合自身数据和本地化需求的优势也能在商业化过程中保持全球同步。

AI时代数据价值重估,C端流量入口重构。C端场景的推广和普及才能在算力和应用两方面同时产生共振效应并带动整体AI市场的发展热度。AGI首先在知识库搜索和开发工具两个方向上落地。AI开发工具作为行业底层的技术基石应该最先落地,比如图像视频编辑软件。企业数字化转型和移动用户线上化过程产生数据资产,通用AGI能够对文本数据进行有效阅读和分析成为数据价值放大的核心功能点。C端场景下投资上需要关注的方向:1)公司业务恢复的确定性强,AI技术能加速业务拓展,例如教育;2)移动互联网高粘性场景但商业化变现缺失,例如知识付费;3)超级入口的流量重构,AI Agent使用代替APP入口,例如电商。

B端管理软件通过企业数据库的内容搜索为客户提供更高效的解决方案。海外SaaS软件三季度显示以客户关系管理和流程管理为代表的两大AI应用产品开始进入落地期,AI带动底层数据需求开始明显加速。国内软件公司整体进展比海外慢1-2个季度的时间,国内软件公司的挑战在于企业统一数据库建立和付费方式的落地。国内管理软件代表性的两个细分领域OA和ERP相关AI助理的产品已经开始发布进入客户试用阶段。

01

国内投资者对通用AGI的三大核心分歧

1)AGI底层技术是否真的实现质的突破?

语言是人类沟通最底层和精准的信息交换工具,大模型的语义理解已经发生质变。实际使用ChatGPT的感受表明机器对表面文字以及上下文的联系已经问题不大,出现错误理解的时候基本上是因为背景知识欠缺和场景理解不到位的问题。在内容生成方面,通过文字对图像、视频及语音的生成进行精确控制成为一大功能亮点。与此前通过软件或程序进行图像和视频生成的方式相比,语言控制不仅大幅降低了生产成本,也降低了使用门槛。通用AGI已经可以扮演人和机器沟通的翻译官,自动化执行的场景例如IT开发,工业控制和无人驾驶叠加对话机器人之后可以实现完全的自动化。

基于对话框的AGI应用门槛极高,阻碍了应用的推广和用户的感知。ChatGPT用户活跃度遇到瓶颈,实际使用门槛高是核心问题,大部分人在空白对话框面前很难问出有效问题,问题本身就是自身知识结构的专业性体现。专业的人通过分解问题可以有效使用大模型的能力,大模型对于普通用户来说基本上就是个玩具。基于Transform模型的AGI技术重点在于数据集范围内的模仿和推理,大模型本身更多按照概率运算的方式生成人类潜在行为的预测,提示语和背景知识的描述对生成结果的影响巨大。用户对AGI底层技术质变感受不明显核心还是受制于应用场景提示语工程不够完善,无法将专业知识库赋能给机器人的原因。

原生多模态的迭代将是AGI应用放大的核心技术节点。原生多模态技术是指完全模仿人对文字,图像和语音信息等多媒体的处理过程,不需要通过算法将不同模态之间的信息转换来完成多媒体的信息的分析。Google Gemini号称是原生多模态技术,GPT-4V采用的是将图像和语音信息转换成文字信息之后再对齐的方式来处理。原生多模态技术在多媒体信息的处理中效率更高,在实际生产力场景中发挥更加实用的价值,比如机器人,视频生成,教育培训和医疗诊断等。

2)垂直领域数据是否能增强AGI的应用边界?

AGI专业数据库的缺失导致通用模型和专业需求的不匹配。一方面,AGI现阶段核心的应用场景还是生产力场景也就是办公和工作场景,而通常工作场景下聚焦于专业性应用,通用AGI往往无法满足专业化场景,通用AGI个人娱乐性场景目前还无法触及,形成供给和需求的极大的错位,用户使用之后放弃率较高。另一方面,以ChatGPT为代表的高水平AGI调用成本较高同时响应速度较慢,用户使用过程中会产生大量无效的API调用,商业化成本较高。使用通用AGI配合专业知识库训练垂直开源大模型成为现阶段垂直领域大模型商业化的可行性路径,互联网公司都开始在云端提供开源大模型部署服务。

方法论数据的缺失导致AGI在数据完备的情况下执行效率较低。知识库包含方法论数据和调用数据两个方面,大部分理解的专业数据库往往指的是可调用的数据,这部分数据在专业领域并不缺少,但方法论的数据更多是人行为经验总结,基本处于空白状态。通用AGI相当于一个逻辑推理能力很强的人,但缺乏知识背景和执行的方法,背景知识可以快速训练获取,但执行方法需要专业应用的人将方法论的部分提炼出来教会AGI。现阶段应用落地较快的细分领域基本都来自于方法论较为成熟的领域,比如架构设计之于低代码开发,审美特征之于图像编辑,教学方法之于教育培训。

相较于专业复杂应用场景,碎片高频场景可能更符合普通用户的需求。AGI的应用刚开始被定义为赋能普通人的专业化工具,希望能通过AI的加持完成自己无法完成的工作。从实际应用情况来看,在专业应用场景下用户使用熟练的功能都可以通过图形界面快速实现而不熟悉的场景大概率也想不到使用AI对话来解决问题。嵌入日常工作流的实时调用才是AI的真实性需求,随着AI Agent的能力边界扩张逐步演化到用户未知的专业场景。Windows Copilot和GPTs的商业化都是将人类知识库封装进标准机器人中满足普通人需求。

3)国内的AI应用是否能跟随国际市场?

开源和闭源大模型生态已经形成,开源跟闭源的差距还较为明显。以OpenAI为代表的闭源大模型生态快速迭代,随着GPTs的推广和微调模式的放开,用户的使用会加速模型的进化。以Meta的Llama开源大模型的代表,从实际功能上看跟闭源模型的性能差异还比较明显,全球开源生态必然会形成合力对抗闭源系统,采用开源大模型进行商业化落地是细分行业龙头企业从成本考虑的优先选择。现阶段闭源和开源并不是完全的竞争关系,现阶段闭源大模型更像是开源大模型的导师,开源大模型的生态迭代国内科技公司能够充分参与。

大模型的商业化悖论,高复杂度高算力消耗场景商业化难度较高。大模型商业化过程本身面临用户使用门槛高的问题,一方面,普通用户还是更习惯简单粗暴的用法,比如语音说话,一键按钮和问题勾选等。另一方面,低延时和成本也是企业商业化过程中无法回避的问题。从现阶段看商业化落地做的比较好的应用都得益于较好的提示语工程和简化之后的低成本低延时的AI算法。国内公司普遍底层大模型性能跟国际最高水平差距虽然较大,垂直开源大模型的研发结合自身数据和本地化需求的优势也能在商业化过程中保持全球同步。

高算力芯片缺失对国内大模型生态短期较为有限,长期需要依靠专用芯片的研发。英伟达已经开始针对国内市场设计新的合规芯片并马上开始销售,虽然在算力上存在一定的降级但起码不存在完全无法使用的问题。随着大模型训练的初步完成,随着应用的优化和固化,算力的需求会从高通用性的训练芯片逐步往高定制化的推理芯片方向上发展。微软和Google在商业化过程中已经开始推进专用芯片方案。从全球AI发展的角度上看,前面大模型带来的训练军备竞赛告一段落,训练芯片的紧缺程度有所缓解,产业重点重新回到应用端的推广,多模态大模型带来视频游戏互联网应用和GPTs应用商店带来的软件应用是接下来潜在的引爆点。

02

AI驱动互联网公司数据价值的重新定价

在C端业务方面,其对市场的影响通常远大于B端业务。C端互联网公司的业务在吸引市场关注度方面更为明显。海外市场除了ChatGPT等偏C端产品外,像微软和谷歌的主要收入仍来自于云服务等B端业务。在C端应用场景方面,海外上市公司不多见。

几个关键思路如下:

公司业务与AI结合度:公司业务恢复的确定性强,AI技术能加速业务拓展。

数据价值壁垒强化:在移动互联网时代未找到良好商业逻辑的公司,通过AI可能找到新的商业模式。

市场颠覆:AI的出现可能改变前端流量分布,这是选择细分领域赛道的关键方向。

代表性场景如下:

教育行业是第一类公司的代表,尤其是国内市场,因为教育的非标准化特性和对视频教学的需求强烈。AI可能在多个领域实现辅助教学。招聘类场景,如LinkedIn和BOSS直聘,也通过AI加强用户体验,简化非标准工作,提高效率。

对于第二类公司,如B站和大众点评其月活跃用户数快速增长,用户和视频内容质量高,但货币化路径不明确。AI可能帮助解构中长视频,改善用户体验,甚至反向视频生成,探索新的商业模式。

第三类可能是流量重新分配的逻辑,特别是在搜索和电商领域。以前基于关键字匹配的流量分配可能被内容阅读方式所取代,可能导致新的流量供应商或合作伙伴的出现。



03

互联网板块正在经历一个转折点

首先,从2023年的三季报来看,互联网公司的盈利能力很明显,PE和PB水平处于较低状态,显示公司EPS的增长已经消化了大量估值。从去年到今年三季度,互联网公司的降本增效带来了显著效果,盈利能力得到了充分体现。在流量稳定的环境下,公司之间的竞争趋缓。

其次,政策方面,互联网公司在整个A股市场中占有重要比例,证明其对国内盈利和就业的重要贡献。尽管最近针对网络游戏的细则出台,但整体看来,政策方面对互联网行业的最严厉时刻已经过去,而且互联网作为经济增长的重要驱动力,仍将受到政策层面的高度关注。

最后,AI带来的变革才是核心,互联网公司很可能是将这些创新转化为产品的主力。尽管目前还不清楚哪些公司将在这方面领先,但研发投入和对数据价值的重估将是关键因素。利用大量垂直数据开发新的商业模式和提升客户服务能力,被视为互联网行业的重要发展方向。



04

AI应用中,B端软件应用是个高确定性的场景

B端管理软件和商业咨询场景下企业员工可通过企业历史知识库的内容搜索为客户提供更高效的解决方案。

应用场景:1)ITSM:总结报告、知识库管理等场景开始结合AI进行探索,主要用于提高IT人员解决问题的效率;2)CRM:在客户跟进报告(电话交流后自动生成跟进报告)、知识库管理(指导销售人员推动业务流程)等场景开始结合AI进行探索,主要用于提高销售人员事项性流程的效率,以及销售能力、经验的复制和拓展以提升销售人员整体的业务能力。



海外SaaS软件三季度应用层开始落地,数据层开始大幅增长。软件是作为本轮AI应用的载体,B端知识库管理是确定性场景。

Salesforce和ServiceNow这两家公司在集中管理软件方面表现突出,分别代表了客户关系管理和流程管理两个大方面AI产品的发展,四季度开始进入AI产品的市场推广和应用,并已经取得了大量试用客户和代表性签约客户。

国内软件公司的挑战在于企业统一数据库建立和付费方式的落地。国内管理软件代表性的两个细分领域OA和ERP相关AI助理的产品已经开始发布进入客户试用阶段。国内软件公司整体进展比海外慢1-2个季度的时间。



随着生成式AI将大规模落地,作为刚需配套的向量数据库赛道将迎来加速,目前国内外市场均处在较早期阶段,市场竞争格局极为分散。

海外市场:海外市场存在“云中立”产业逻辑,故海外云厂商不会降维进入该领域。企业场景下AI知识库的需求开始显现,数据层上Salesforce的data cloud,Elastic的向量搜索和MongoDB的向量数据库业务都呈现明显加速增长。目前海外较为知名的厂商有Milvus、Pinecone(为ChatGPT提供向量数据库)等;传统非结构化数据库厂商如MongoDB也在今年6月发布向量搜索等功能,目前处在市场宣传阶段。

中国市场:一级市场有较多厂商在转型做向量数据库,但国内并无“云中立”的产业逻辑,因此国内云大厂如阿里、腾讯、华为等均具备向量数据库产品以补全自身一揽子打包的云服务解决方案。

- END -

本文所提及的任何资讯和信息,仅为作者个人观点表达或对于具体事件的陈述,不构成推荐及投资建议。投资者应自行承担据此进行投资所产生的风险及后果。
页: [1]
查看完整版本: AI时代的变革者:重估数据价值,塑造互联网新格局