AI模型卷向何种高度?
作者:微信文章【深度科研评论第十五期】
模型是AI的统计学基础
AI(人工智能)的快速发展正在深刻改变社会。其本质是一个多层次的技术生态系统,核心在于模型(Model)——一种对现实世界进行数学抽象与规律捕捉的工具。模型通过与数据(Data)交互,依赖算法(Algorithm)优化,并借助计算力(Computing Power)实现高效训练与推理,完成从输入到输出的智能映射。作为AI的统计学基础,模型不仅是技术实现的载体,更是连接理论与应用的桥梁。
人工智能的进步本质上是模型的进步。从早期的线性回归、贝叶斯网络到如今的深度神经网络,AI模型的发展始终围绕捕捉数据中的统计规律展开。统计学为模型提供了理论基础与方法论支持,但随着模型规模的不断扩大,经典理论能否完全解释这些复杂模型的行为与表现?
本文将从统计学的视角,探讨AI模型的现状与未来发展方向,分析其统计特性、实际应用中的表现与局限,并展望可能的理论突破。
一
AI模型的基础与核心:统计学的视角
1、AI模型是什么?
AI模型是指基于已有数据集,运行深度学习算法所得到的一种数学表示。它通过分析大量数据(如图片、文本),自动找出隐藏的统计规律,并建立输入到输出的预测关系。AI模型通过持续学习数据,并优化框架算法,匹配相应的算力来完成训练,最终实现识别图像、生成文本等智能任务。现代强大的AI模型(如ChatGPT)已经能处理复杂任务,但其核心仍是基于数据的统计学习。
2、AI大模型是什么?
AI大模型是指参数量巨大(通常达数十亿至万亿级)、基于海量数据训练的深度学习模型(如GPT、BERT等),其核心是通过先进架构学习数据的深层统计规律,具备强大的泛化能力和多任务处理潜力。这类模型展现出"规模产生智能"的特性——当参数规模超过临界点时,会突然涌现出小模型不具备的复杂推理、创作等能力,成为当前AI发展的主流方向。
无论是AI模型还是AI大模型,其本质都是基于数据统计规律构建的智能决策系统。它通过分析海量数据中的概率分布和关联规律(比如"深度学习"这个词组出现的概率),运用数学方法自动学习输入(如图片)和输出(如分类结果)之间的映射关系。随着模型规模的扩大,它能捕捉更复杂的统计模式,从而展现出更强大的智能表现,但其核心原理始终是统计学习。
人工智能,数字大脑,未来技术概念图
二
AI模型的现状:从理论到实践的跨越
1、AI模型的现状:
2022年11月30日,OpenAI推出的ChatGPT惊艳亮相,这一成果直接点燃了大语言模型领域的发展引擎。进入2023年,大语言模型呈爆发式增长,全球范围内涌现出几百个大语言模型(LLM)。当前AI模型已进入"大模型时代",参数规模突破万亿级(如GPT-4、DeepSeek等),在通用任务和专业领域(如医疗、金融)均展现出接近人类水平的能力。
ChatGPT作为其中的佼佼者,凭借强大的自然语言处理能力脱颖而出。它不仅能与人进行流畅对话,还能完成文案撰写、代码生成等复杂任务,应用场景十分广泛。ChatGPT之所以能有如此卓越的表现,超万亿级神经网络模型和超大规模超级计算功不可没,正是这些技术支撑,推动人工智能计算达到一个临界拐点,为通用人工智能(AGI)的发展开辟了新路径。
不过,ChatGPT及同类大语言模型在发展进程中并非一帆风顺。模型的可解释性难题,使得人们难以理解其决策机制;数据隐私、算法偏见等伦理问题也逐渐凸显。
2、AI在医学领域中的应用:
AI具有的自我进化能力、超高速处理能力、全流程自动化能力、精准标准化能力和知识整合能力使得AI在专业性强、精准度高的医学领域具有相当广阔的应用前景。
在医学领域,人工智能的应用主要分为虚拟(virtual)和物理(physical)两大分支(代表人工智能在医学中偏数字化和实体化的应用方向)。
虚拟分支以机器学习算法为核心。如在遗传学和分子医学方面,无监督学习算法可用于预测蛋白质复合物,为新治疗靶点的发现提供了方向;新算法也能够识别DNA变异,预测疾病风险。在医疗系统管理中,多智能体系统(MAS)用于慢性精神疾病治疗,通过捕捉患者对药物的反应和行为互动,优化治疗过程,提升治疗效果并降低成本。电子病历也是AI在医学中的应用,电子病历借助人工智能,能识别具有遗传病史或慢性疾病风险的患者。此外,心理治疗化身(avatars)应用于疼痛控制和情绪障碍检测,帮助癌症儿童缓解疼痛,并检测青少年早期情绪问题。
物理分支体现在医疗设备和机器人的实际应用上。以达芬奇手术系统为例,它辅助医生进行复杂手术,如前列腺切除术、妇科手术等。机器人还可用于康复评估,监测患者康复过程中的表现。在药物输送监测方面,纳米机器人研究取得进展,如利用Magnetococcus marinus细菌与纳米脂质体结合,将药物输送到肿瘤缺氧区域。不过,该分支面临伦理和标准化评估的挑战,如机器人手术的伦理规范以及对机器人医疗效果评估标准的统一等问题。
AI在医学领域的应用呈现"虚实结合"的双路径发展:虚拟层面通过机器学习算法驱动,涵盖基因分析、电子病历管理、心理治疗等数字化场景,显著提升疾病预测与诊疗效率;物理层面依托手术机器人、纳米载药系统等实体设备,实现精准手术操作与靶向治疗,但需突破伦理规范与评估标准等实践瓶颈。二者共同推进医疗向智能化、精准化演进。
3、AI与科研:当前AI模型正在推动科研范式发生深刻变革,体现在以下三个方面:首先,AI模型使研究效率方面取得显著跃升。以ChatGPT为代表的大语言模型已在多个科研场景中展现强大助力,其中文献翻译场景使用率达到70.47%,信息检索场景达69.41%。AI技术也正在被更广泛运用于科学研究中,如西湖大学研究团队通过AI技术成功突破传统生物学方法的局限,在非编码RNA分析领域取得重要进展。这些案例充分展示了AI模型对科研效率的显著提升作用。其次,AI模型使科研方法论方面实现重要创新。生成式AI作为新型"科研代理",正在改变传统研究方式。浙江大学调研数据显示,科研人员的人工智能素养每提升1个单位,在实验设计场景中使用AI的概率就增加74.8%。同时,多智能体系统(MAS)通过优化慢性病治疗方案,实现了诊疗流程的自动化升级,为医学研究带来新突破。另外,AI正有效促进学科壁垒的消融。跨模态模型如GPT-4正在推动物理、化学与生命科学等领域的交叉融合。值得注意的是,AI应用呈现出明显的学科差异性,例如信息学部研究生在代码生成工具使用率上比人文学部高出88.6%,这一差异反映了技术渗透的不均衡特征。然而,当前发展仍面临三大挑战:算力不足仍是显著问题。高校算力资源仅为企业的1/10,形成严重制约;AI的发展可能出现技术红利分配不均,高产出学者获益更显著的现象;此外,模型解释性缺陷可能导致科研人员产生认知偏差。这些实践中的问题,本质上仍源于AI模型的统计学习框架局限,未来有望通过结合因果推理等方法实现突破。
2025春晚跳舞的人形机器人
三
AI模型的未来:技术突破与挑战
当前AI模型的发展正面临关键转折:算法架构创新、能效比优化与多模态融合成为主要突破方向,但硬件算力瓶颈、数据质量依赖、可解释性不足等问题仍是核心挑战。AI模型的上限如何?本文将从AI的不可解释性问题入手,探讨基于统计学原理下AI模型的局限性。
生成式AI的不可解释性问题:
算法黑箱指机器输入到输出过程的不透明性。算法黑箱问题表现为模型内部决策过程的不透明性。以GPT-4为例,其基于超100TB语料和1.8万亿参数构建,复杂的架构使决策逻辑难以追溯。同时,设计者的工程优化进一步增加了模型行为的不可预测性。
涌现性是生成式 AI 基于大规模语料、大模型参数和深度自主学习而呈现出的独特性质,表现为智能系统产生出乎意料的新行为和新功能。这类行为源于大规模训练中参数的非线性相互作用,具有随机性和环境依赖性,无法通过传统分析方法解释。
这两个因素共同导致了生成式AI解释的困难:黑箱化遮蔽了决策过程,涌现性则引入了不可预期的行为变异。
针对AI的不可解释性,可能通过统计学方法改善,如使用透明的可解释模型(如贝叶斯网络、决策树)替代不透明的模型,或使用SHAP(基于博弈论沙普利值的特征贡献量化方法)和LIME(通过局部代理模型近似黑箱决策的解释框架)等工具,量化每个特征对AI模型预测结果的影响,从而帮助理解算法黑箱的决策依据。还可以采用简化模型结构,融合因果推理区分相关与因果等统计学手段。但本质上,AI模型学习的是数据中的统计关联,而非真实因果,仍是基于理论层面的设想与考量。这种统计学局限决定了其解释性存在理论天花板。不可解释性实质是人工智能产品的自然属性。
手术机器人概念图
四
总结
AI模型作为人工智能的核心载体,其本质是基于统计学基础构建的智能决策系统,通过捕捉数据中的统计规律实现从输入到输出的映射。这一机制使其在多个领域展现出强大能力:在医疗健康领域,腾讯医典等AI问诊系统能够基于症状描述提供初步诊断建议,平安健康APP等医疗服务APP能对病情进行初步诊断后提供一站式医疗服务,腾讯觅影能精准分析医学影像;在办公场景中,Gamma可以自动生成专业幻灯片,DeepSeek能辅助高效撰写文档,豆包能快速翻译并归纳总结文档,Manus则能够在文本生成、数据处理等多个领域提供帮助;在教育场景中,科大讯飞的学习机实现了个性化教学;在艺术创作领域,如腾讯AI编曲、网易天音等编曲软件能辅助创作者创作旋律,而彩云小梦、文心一言等语言模型能进行诗词、散文等文学创作,midjourney、无界AI等图片生成AI则能高效绘图,按照指令生成图片;在日常生活中,人们也时常运用Kimi Chat、通义千问等具有对话理解功能的AI解答问题。
未来,AI大模型技术和人形机器人的结合可能成为人工智能发展的重要方向。AI大模型+人形机器人的模式也被称为“具身智能”。具身智能是融合人工智能与机器人实体,赋予机器人思考、感知和行动能力,以适应复杂环境和任务的技术。具身智能以 AI 大模型为 “灵魂” 提供认知与决策能力,让机器人学习和理解各类信息;机器人的实体则如同 “皮囊”,配备多种传感器,具备灵活的运动能力,实现对环境的感知和交互。
参考文献:
赵正平.人工智能大语言模型和AI芯片的新进展.微纳电子技术,2025,62(03):7-37.DOI:10.13250/j.cnki.wndz.25030101.
Hamet P, Tremblay J. Artificial intelligence in medicine. Metabolism. 2017 Apr;69S:S36-S40. doi: 10.1016/j.metabol.2017.01.011. Epub 2017 Jan 11. PMID: 28126242.
金龙君.生成式AI的不可解释性及其法治应对.法治研究,2025,(02):42-53.DOI:10.16224/j.cnki.cn33-1343/d.20250303.004.
Molnar, C. (2022). *Interpretable machine learning: A guide for making black box models explainable* (2nd ed.). Leanpub. https://christophm.github.io/interpretable-ml-book/
黄恒,马银琦.谁能获得更多的“技术红利”?——生成式人工智能对科研人员影响的异质性研究.科学学研究,1-15.https://doi.org/10.16192/j.cnki.1003-2053.20250327.001.
知识分子. AI会砸掉科学家的饭碗吗?. https://mp.weixin.qq.com/s/Yg4LivYS4MJStWMznpwlwQ, 2024-12-10. The Intellectuals. Will AI Break Scientists' Rice Bowls? . https://mp.weixin.qq.com/s/Yg4LivYS4MJStWMznpwlwQ, 2024-12-10.
李艳,朱雨萌,孙丹,等.典型科研场景下生成式人工智能使用的差异性分析——学科背景与人工智能素养的影响.现代远程教育研究,1-11.http://kns.cnki.net/kcms/detail/51.1580.G4.20250327.1452.006.html.
Messeri L, Crockett MJ. Artificial intelligence and illusions of understanding in scientific research. Nature. 2024 Mar;627(8002):49-58. doi: 10.1038/s41586-024-07146-0. Epub 2024 Mar 6. PMID: 38448693.
https://baijiahao.baidu.com/s?id=1805916344342378935&wfr=spider&for=pc师喆,郭丁然.智能机器人向我们走来.河南日报,2025-03-31(003).
封面及正文图片源于网络
撰文/编辑:黄曼依
审校/发布:邱依楠
上一篇
寒窗十七载摘硕
后续更多精彩关注我们团队公众号
“AI消化”及“大旗消化”!
——THE END——
页:
[1]