多客科技 发表于 2025-1-1 23:46

AI agent(智能体)是IT业的颠覆式创新,并且会深刻影响工作、生活的很多方面

作者:微信文章
    最近在集中研究各家的AI agent平台,比如字节的coze、Hiagent,dify,智谱的bigmodel,百度的千帆appbuilder等等。研究过程中引发了一些新的思考,于是写成这篇文章发出来,朋友们可以一起来聊聊这个话题。    AI agent,国内通常翻译成智能体。智能体大概就是利用了大模型的工具,可以做很多事,比如智谱平台里就能看到:

    其他一些平台里也能看到AI智能体的身影,比如在豆包里可以创作新AI智能体、钉钉里有AI助理。    而AI智能体平台是什么呢?这些搭建智能体的平台,里面核心部分基本都长这样:

    简单理解智能体的话,就是预先设定了大模型一步一步要做什么的工具/应用,你可以设定一些要求、流程、规则来调用大模型,以及配套的知识和数据,组合成一个智能体,然后你可以用这些智能体完成各种各样的事务。也可以把这些智能体联合起来,去做一个更大的、更复杂的事情。比如上面截图里面“默认推荐问题”就用到了大模型,它可以在后续的问答界面上去自动推荐一些默认问题,引导用户去问这些相关问题。    为什么会有智能体呢?直接用大模型不行吗?这其实是一种必然,之前的文章里介绍过咱们可以把大模型当作人一样来看待,他们是“新脑子”,已经比较好使(大约是优秀本科毕业生的水平,部分大模型可能已经到了硕、博研究生水平)。你如果想把这些新脑子更好的用起来,需要给它一些独有的知识、经验、数据,再给它一些已有的工具/方法,当然也要让它遵守一些规则规范、做事流程,并且过程中把相关过程记下来,后面可以更聪明的为你工作、完成任务。换个角度来说,我们平时用大模型去生成内容,不管是文字、图片、视频,会感受到它的发散性很好(甚至会出现胡写乱画的情况),但日常大多数场景中,你肯定希望它不那么发散,而是按照你的意图和给定的要求、客观的规范去生成内容,这种“可控生成”,就是智能体干的事。    好,了解了智能体大概是什么之后,我们聊下为什么说它是颠覆式创新,不仅会影响IT业,还会影响工作、生活的方方面面。    一方面是“玩家”变了。    IT行业咱们感觉是又远又近,说近是因为我们在手机里就装着很多应用/APP,一些超级APP里也有很多小的应用,比如微信里有很多小程序。说远是因为这些应用程序都是程序员一行一行代码写出来的,咱们也不知道他们是怎么工作的。但以后情况就变了,制作这些日常应用/APP的很可能就是你的朋友、同学、孩子、父母,而他们并不太需要懂多少代码知识。比如,上面截图这个coze平台,你可以低代码甚至零代码,通过拖拉拽、敲敲字就可以创建一个新应用出来,如果你在coze里搭建好了一个智能体或者应用,你还可以发到豆包APP里,这样就形成了闭环:就是你不用懂代码怎么写,就能搭建并且使用自己的应用了。    说豆包和coze可能离大家的生活还有些远,拿我们更熟悉的微信来说,相信后面微信体系也会有类似coze的工具,平台里会出现很多新的智能体应用。了解公众号、小程序、视频号发展史的朋友应该能回想起来,公众号、小程序让很多原先不怎么写文章、代码能力没那么强、拍视频没那么专业的人/团队卷入起来,构成了新的生态,大家有的人写、有的人拍,有的人去消费和使用这些工具或内容。通过智能体,也能长出新的一波玩家(新的创作者、消费者),构成一个完整的创新生态。    而在工作场景中,当制作软件系统的不再只是程序员,而是业务部门的同事,或者产品经理、运营经理的时候,相当部分人的职能会发生变化,或者说组织中会出现一些新的职位。对于会搭建智能体的新人来说,也能在组织中发挥更大的作用(对于毕业生群体来说总体是利好,如果大家愿意尽快的、深入的学习如何搭建和应用的话)。    另一方面是“玩法”变了。    从驳斥一个流行观点入手来说明:很多营销号里经常说AI编程会让程序员这个岗位消失、程序员职业危险了等等,故意贩卖焦虑,但这个在未来相当长时间应该不会发生。在“可控生成”才能满足大多数工作生活需求这个大逻辑下面,大模型的发散性如果不能被约束(靠大模型自身很难解决,现在主流大模型靠的就是有概率的预测和生成),更广泛的场景是使用不了的。而代码恰恰是各种语言中确定性、约束性最高的语言。未来更可能发生的场景是,业务部门同事们在搭建智能体应用的时候,用自然语言写指令控制了大部分的需求场景,而对于不知道如何精细控制的部分,还是会找程序员同事们去写代码,或者拿着AI辅助编程工具写的代码去找程序员做review和debug,让这些指令真正的能跑起来,达成业务目标。业务部门和IT部门可能会融合,原来的IT部门可能会原子化或者小组化,加入到业务部门中。而在AI编程的加持下,多数不同岗位的人会比以往更加懂代码逻辑,知道什么样的场景大致用什么代码去实现,从而更平滑的与程序员合作。职能划分模糊之后,未来企业里会出现更多BG、BU型的组织。    而懂业务、懂需求的程序员,以及其他各个岗位的人,可以更容易的去做个体创业和小组织创业,一个人带着N个智能体来帮助自己工作挣钱,“一个人就是一家公司”。    但核心和更底层的是,数据和知识。    智能体的运转,需要基础数据。举个例子,假设一对年轻夫妇生活在北上广深,而爸妈生活在老家小城市,在父母刚到孩子所在的大城市生活时,如果年轻人想快速让父母知道周边环境,他们可以用智能体搭建一个专门的导航,父母拿着手机就能被引导到附近的菜场、超市、公园等等,而根本不需要去记名字、记路,这样父母融入新环境的时间将被快速的缩短。而这要求高德、百度等导航公司支持普通用户利用平台数据做个性化的应用。或者,这对年轻夫妇想针对自己孩子思维特点做一个定制化的课业辅导APP,这就需要教育公司开放自己的题库数据。在这些个性化需求的满足过程中,对于拥有数据的企业,存在着大量的增值服务机会。    换句话说,APP应用,为什么要像现在这样,页面长的一样、功能也一样呢?大家很多时候的需求难道不是独特的、个性化的吗?对于你自己或者你们一家人的常用功能来说,为什么要和其他人一样,在APP里从固定路径一步步的点击到相应功能位置才能使用呢。    再比如,在企业场景里,当新的智能体应用能直接访问企业数据并且达成业务目标的时候,原先旧的应用、旧的系统将被替换,那企业里真的可能发生“所有应用都将被重做一遍”的情形。如果企业里数据质量越高,越在组织里开放,那智能体将会极大地改变原有的IT架构和应用体系。    而编写和运行智能体,需要知识。在智能体平台创建智能体的时候,是一个将这个事要干成啥样的知识、这个事怎么一步步干出来的知识、这个事还需要其他什么资料/知识,糅合到大模型指令(prompt)、工作流(workflow)、知识库里面的过程。比如最近我想搭建一个心理学短视频文案写作助手,这就要求我知道有哪些心理学主题,也知道什么样的才是大家看短视频时感兴趣的内容,也能知道怎么构建一个自动搜索相关文章然后改写成视频脚本的流程。一个一个智能体,是沉淀工作人群甚至整个人类知识的结晶体。    顺带说一句,对于个人、组织、企业来说,大模型中的知识可能很难被你留存下来(持有大模型的成本太高了),而智能体中的知识是值得被保留下来的。
    关于智能体这个话题,您有什么看法,请在评论里留言,我们一起聊聊。
扩展阅读:企业怎么理解和应用AIGC、RAG、Copilot、Agent、多模态大模型等AI范式写在新型“抢人大战”前夜:告别单点尝试,体系化的应用大模型提升企业绩效腾讯出了个挺香的AI产品:腾讯元宝,可以用它来读李飞飞最新的英文综述知识管理专题:RAG(大模型+知识库)的落地与知识管理的春天RAG(大模型+知识库)落地与知识管理的春天-新的知识运营体系
页: [1]
查看完整版本: AI agent(智能体)是IT业的颠覆式创新,并且会深刻影响工作、生活的很多方面