AI 更聪明的秘诀并不是大数据
作者:微信文章最近,伯明翰大学的一项研究指出,想要改进人工智能(AI)语言系统的重点不在于获取更多数据,而是更好地体现人类语言的多样性。这项研究发表在1月13日的《人工智能前沿》(Frontiers in AI)期刊上,强调开发适用于所有人的人工智能需要深入了解不同社会群体和语境下的语言差异。
研究负责人杰克·格里夫教授(Jack Grieve)表示:“生成式人工智能(如 ChatGPT)在某些提示下可能更容易生成对特定种族或性别的负面描述。如果训练数据中包含了对某些群体不友好或不准确的内容,人工智能就可能复制这些偏见,甚至导致种族歧视或性别歧视的结果。”
1
数据质量优先于数量尽管许多企业致力于用庞大的文本数据训练人工智能系统,但研究团队认为,更关键的是这些数据能否真实反映社会语言的多样性——从地方方言到专业术语,再到不同时代的语言差异。研究表明,精挑细选的训练数据能够帮助解决当前AI面临的多项挑战,比如社会偏见、信息失准以及适应医学或法律等专业领域的能力不足。聚焦语言差异研究指出,语言变异主要体现在三个关键维度:
方言:社会群体之间的语言差异。语域:不同场合和目的下的语言变体。时间:不同时期语言的变化。
这些维度共同影响语言在社会中的使用方式。例如,医疗工作者与同事讨论时使用的术语,与对病人解释时就有所不同。同样,不同地区的人可能对同一概念有着完全不同的叫法。这些差异如果能在AI训练中被充分体现,人工智能将更好地服务所有用户。打造公平AI的新框架研究团队借助社会语言学的方法,提出了一种全新的人工智能开发框架。这种方法强调在训练数据中体现语言多样性的重要性。与单纯从互联网上抓取大量文本不同,AI开发者可以有意识地引入均衡的语言样本,覆盖不同社会群体、职业背景和历史时期。这将确保AI对任何背景的用户都能提供同样有效的服务。实际意义与应用这一研究不仅旨在提升AI性能,还希望帮助AI系统更符合社会价值观。通过关注语言多样性,AI能更好地解决现实中的难题,比如客户服务、医疗和教育领域的需求。比如,一个经过多样性训练的AI系统能够准确理解不同文化或职业背景的用户,从而提供更有效、更公平的服务。展望未来“理解社会结构及其反映在语言中的方式,是充分释放AI潜力的关键。”格里夫教授表示。随着AI语言模型在教育、医疗、商业和政府等领域的应用日益广泛,研究人员认为社会语言学的参与将变得至关重要。通过更好地体现语言多样性,这些系统不仅会变得更准确,还能更具道德感和社会责任感。这项研究为应对人工智能发展中的挑战提供了理论基础,同时为实现AI在多元化社会中的公平服务指出了明确方向。
文/BYMark Long
译/淮杨
校对/金石
原文/https://scienceblog.com/553130/the-secret-to-smarter-ai-linguistic-diversity-not-bigger-data/
本文基于创作共享协议(BY-NC),由语言治理发布
文章仅为作者观点,未必代表语言治理立场
https://mmbiz.qpic.cn/sz_mmbiz_png/XicYtolGZey3lGYf7lv7RafKvovuIQhic8mgWVCrzqjL735ibQQMOiagtiaNriahMFwFmL17sakX3ficI85pVTzjd8gJg/640?wx_fmt=other&from=appmsg&wxfrom=5&wx_lazy=1&wx_co=1&tp=webp
您可能还想看
SEE ALSO
★ 推荐阅读 ★
重磅!语言研究全球前2%顶尖科学家“年度影响力”榜单正式发布
申丹教授、聂珍钊教授入选文学研究全球前2%顶尖科学家“年度影响力”榜单
重磅!2023年QS世界大学排名正式发布
重磅!CiteScore™ 2021 语言学期刊影响力排名正式发布
科研助力 | 2022年语言学类期刊SJR排名分区列表(附Excel版下载)
科研助力|2022年QS世界大学语言学、文学专业排名
重磅|2022年QS世界大学排名
科研助力| 2020年文学类(A&HCI)期刊排名
科研助力| 2020年传播学SSCI期刊影响因子排名
知网太贵?请收藏26个全球高质量免费电子数据库
学术调查| Martin Hilpert :什么让语言成为语言
Martin Hilpert :语言学家的一天都忙些什么?
马丁课堂|Martin Hilpert:语言与大脑的关系:从三个语言学实验谈起
马丁课堂|Martin Hilpert:如何阅读语言学学术论文?
大师对话|Steven Pinker与Noam Chomsky谈语言和人工智能在未来的发展大师对话|Krashen 教授与 Chomsky教授谈现代语言学的发展
大师对话|Halliday, Labov, Jacob Mey,Embleton教授谈功能语用与社会语言学的融合发展
学术访谈|Ken Hyland:如何在高水平期刊发表自己的学术论文
Hello China (中国传统文化短片中英字幕) 100集免费资源
《Amazing China》 中英双语纪录片资源免费获取
86版《西游记》英文配音版资源免费获取
用英语讲好中国故事之刘欣全英文回怼西方记者(附视频+双语文稿)
用英语讲好中国故事之《四季中国》免费获取
页:
[1]