AI行业《晚间资讯》2025-6-3
作者:微信文章本篇有8108字,可听全文。进AI社群,加VX:szbrds
Meta AI广告革新,重塑品牌与消费者互动
Meta公司(原Facebook)正大力推广AI在广告领域的应用,计划到明年让品牌能通过AI自动创作和投放广告。这项技术将帮助企业无需人工干预,自动生成广告内容并精准定位受众。虽然AI创作广告不是新事物,但Meta的目标是实现全面自动化。这一变革有望提高广告效率、降低成本,但也需注意保持广告的创意和个性化。Meta表示,会平衡AI和人类创意,确保广告既高效又有人情味。这一计划将引领广告行业潮流,值得关注。
"Mirage Studio:AI赋能,视频创作新纪元"
Captions公司推出了一款名为Mirage Studio的新产品,它利用人工智能技术,只需一张照片就能制作出逼真的虚拟演员视频。这款工具不仅能让虚拟角色表情丰富,还能在不同场景中保持一致性,大大降低了视频制作的成本和时间。这是全球首个获得完整许可的表演基础模型,可能会改变视频内容创作的行业,让小团队和个人也能轻松制作高质量视频。
英伟达AI四趋势助市值冲五万亿美元
英伟达老板黄仁勋在财报会议上说,他们公司未来增长要靠四个AI趋势:推理AI、AI普及、企业AI和工业AI。这些趋势会给英伟达带来巨大市场机会,可能让公司市值达到五万亿美元。推理AI能让AI代理更聪明,解决复杂问题,英伟达的处理器就是这种AI的完美搭档。美国政府取消AI出口限制,让更多国家能用到AI技术,这对英伟达也是个大好机会。黄仁勋的话让投资者更有信心,英伟达在AI领域的领先地位看起来很稳固,未来增长前景光明。
失声歌手AI助唱,艺术无障碍
一位因神经系统疾病失声的歌手,使用了Suno AI的“掩护”工具,成功将受损的录音变成了完美的声乐表演。这个AI工具通过分析歌手的原始录音,自动修复音质,生成清晰、自然的演唱效果,让歌手的创作意图得以完美呈现。这项技术不仅让身体障碍者有机会重返艺术舞台,还可能改变音乐创作的传统模式,让更多人能够通过AI的帮助创作高质量的音乐作品。简而言之,AI技术正在为艺术创作和障碍者赋能,开启了一个全新的音乐创作时代。
脑植入设备成功植入,脑机接口技术迈新步
脑机接口公司Paradromics成功将一款名为Connexus的脑植入设备植入患者体内并安全取出,这是人脑直接连接计算机领域的一大突破。手术在一位接受癫痫治疗的患者身上进行,设备能记录大脑电信号。Paradromics的设备拥有420根微针,能获取高质量信号,有望帮助瘫痪患者恢复言语和交流能力。公司计划今年启动针对瘫痪患者的临床试验,朝着商业化应用迈出了重要一步。
远征A2成全球首个三区域认证人形机器人
智元机器人的远征A2人形机器人获得了中国、欧盟和美国的重要产品认证,这是人形机器人历史上的一个重要成就。远征A2不仅是首个在全球三大市场都获得认证的人形机器人,而且在国内外都是首次获得某些认证。这意味着远征A2可以在全球范围内商业化部署。随着人形机器人产业即将迎来快速发展期,智元机器人的这一突破为行业的发展提供了强有力的支持。预计未来十几年,人形机器人的市场将迎来巨大增长。
Fast-dLLM加速扩散模型,解码速度提升27.6倍
英伟达和麻省理工学院、香港大学合作研发了一种新技术Fast-dLLM,它能大幅提升扩散模型处理语言任务的速度,最快可以达到27.6倍。这项技术通过优化计算过程和解码策略,不仅提高了速度,还保持了生成质量,让扩散模型更有竞争力,有望在未来广泛应用。简单来说,就是让语言模型更聪明、更快地工作,为我们提供更好的服务。
水利AI大模型发布,提升水利标准化智能化管理
水利部最近发布了一个大型的“水利标准 AI 大模型”,这个模型就像一个超级助手,能帮助管理水利标准,让工作更智能、更高效。它整合了1800多项水利标准和500多项相关法规,还有大量的科研成果和专利信息。这个AI模型不仅懂得水利专业术语,还能快速查重、编写、审查和评估标准,准确率高达99.5%,让工作效率提高了几倍。简单来说,这个模型让管理水利标准变得更简单、更准确。
Salesforce 收购 Moonhub,AI招聘布局升级
Salesforce最近收购了人工智能招聘公司Moonhub,但后来澄清只是部分团队成员会加入Salesforce,Moonhub本身并没有被收购。Moonhub的CEO表示,加入Salesforce将有助于他们在人工智能领域的发展。同时,Salesforce还收购了其他公司以加强其人工智能产品。现在,很多大公司都在用人工智能来提高招聘效率,其中93%的财富500强公司已经在用AI工具了。
FDA推出Elsa AI,加速审查,保障数据安全
美国食品药品监督管理局(FDA)推出了一款名为Elsa的人工智能工具,这标志着美国政府在使用AI技术方面迈出了重要一步。Elsa不仅提前完成,还节省了预算,展示了FDA在技术创新上的执行力。这款工具设计安全,保护敏感数据,并已在临床审查、智能检查和文档处理等多个领域发挥作用,帮助FDA更高效地服务公众。随着Elsa的成熟,FDA计划在更多流程中整合AI技术。
Video-XL-2:突破长视频理解,高效处理超长视频
智源研究院和上海交通大学等机构发布了一款名为Video-XL-2的新一代超长视频理解模型,这个模型在开源领域实现了长视频理解技术的重大突破。Video-XL-2由视觉编码器、动态Token合成模块和大语言模型组成,能高效处理万帧级视频,并在多个长视频评测基准上取得了最先进性能。它的设计优化了计算和显存开销,提高了解码效率,适用于影视内容分析、监控视频异常检测等多种场景。目前,Video-XL-2的模型权重已开放给社区使用。
Fast-dLLM框架加速扩散模型,提升AI应用效率
科技巨头英伟达和麻省理工学院、香港大学合作,推出了一种新技术Fast-dLLM,它能大幅提升人工智能模型处理速度,最高可达27.6倍。这项技术解决了现有模型在处理大量信息时速度慢的问题,通过两项创新——块状近似KV缓存和置信度感知并行解码,既提高了效率又保证了生成质量。简单来说,这项技术让AI处理信息更快,而且出错率低,有望让AI在更多领域发挥作用。
谷歌AI试衣购物体验革新
谷歌新推出的“试穿”功能,让在线购物体验升级!用户上传照片,AI就能生成试穿效果,就像在实体店试衣服一样。这项技术不仅让购物更直观,还能根据你的喜好推荐商品,自动完成购买流程。目前只在美国测试,但未来可能会全球推广,让网上购物变得更加方便和个性化。
Character.AI推动画工具,创新与安全并存
Character.AI最近推出新功能,让用户可以制作自己的动画视频,还能在平台上分享。这个新工具叫AvatarFX,用户可以上传照片,选择声音,写对话,每天最多做五个视频。不过,Character.AI之前因为聊天机器人不当引导孩子,被家长告上法庭。虽然平台现在有安全措施,比如不让上传真人的照片,但还是有安全隐患。Character.AI希望在保证安全的同时,给用户提供一个有创意的互动空间。
小米转让Kimi商标助月之暗面发展
小米公司最近把几个“Kimi”商标给了北京月之暗面科技公司。这个商标是2013年申请的,已经注册好了。小米以前很重视保护商标,这次转手可能是为了更聚焦主要业务,整理一下不那么重要的商标资源。北京月之暗面是个新公司,今年4月成立,他们有个叫Kimi的智能助手产品,这个商标转让对他们来说是个大帮助。两家公司这么做,都是为了更好地发展自己的业务。
软银英特尔联手降耗50%AI芯片
软银和英特尔联手打造了一款新型AI内存芯片,这款芯片的最大亮点是能减少电力消耗近一半。它采用了与现有技术不同的设计,预计会在21世纪20年代商业化。这个项目投资高达100亿日元,软银是大头,他们希望这款芯片能助力AI数据中心更高效、更节能。这不仅是技术上的突破,也可能对整个科技行业带来大影响。
AI助台 Console 获融资,简化IT支持
在职场里,电脑问题让人头疼,但IT支持又不总能及时帮忙。有个叫Console的初创公司,用人工智能来自动处理一些常见IT问题,比如改密码、授权软件等,让员工不用等,直接在Slack上就能解决。Console最近拿到了620万美元的投资,他们还打算以后帮忙解决员工的人力资源、财务和法律问题,让Console成为员工求助的首选。
AI音乐版权谈判,艺术家权益与技术创新共舞
音乐界的大佬环球、华纳和索尼正在和两家AI公司Udio和Suno谈判,想要定个规矩,让这些AI在使用艺术家们的作品时能合理给钱。这两家AI公司能根据用户描述做出音乐,比如来个“单相思乡村情歌”。去年音乐公司因为这些AI的版权问题告了它们,现在双方想要和解,避免更多官司。他们正在努力找到一个既保护艺术家权益,又让AI公司能自由创新的方法。如果谈成了,这将是音乐和科技深度合作的好兆头。
Google AI Edge Gallery:本地AI,多模态,开源新标杆
Google在最新的大会上推出了一个开源项目,名叫Google AI Edge Gallery。这个项目让开发者能在Android设备上本地运行各种AI模型,不需要联网,而且很快也会有iOS版本。它基于Gemma3n模型,这个模型很小巧,但很强大,能处理文本、图片和音频。简单来说,这个项目就是让AI应用在手机或平板上跑得更快,更方便,而且因为是开源的,所以开发者可以自由修改和使用,降低开发难度。它还能离线运行,保护用户隐私,对那些需要实时响应和隐私保护的行业特别有用。总之,Google AI Edge Gallery为开发者提供了一个强大的工具,让他们能创造出更多创新的AI应用。
Cerebras推AI推理API,免费加速AI应用开发
人工智能芯片公司Cerebras Systems宣布,他们的推理API现在对所有开发者开放,不再需要排队等待。这个API每天提供100万个免费Token,帮助开发者构建和测试AI应用。Cerebras的API比传统GPU快20倍,支持多种开源模型,并且已经和Hugging Face等平台合作,让开发者更容易使用。这个开放对初创公司和企业都是个好消息,可能会改变AI推理市场的格局。
Snowflake收购Crunchy Data,拓展Postgres数据库业务
Snowflake大数据公司打算花2.5亿美元买下一家叫Crunchy Data的数据库小公司。Crunchy Data擅长Postgres数据库,给大企业和政府部门提供工具和服务。这个收购能让Snowflake推出新的企业级PostgreSQL数据库,更好地满足客户在AI时代的需要,让数据处理更强大。简单来说,Snowflake这是在扩大自己的数据库业务,让产品更有竞争力。
ElevenLabs AI2.0升级,对话更自然高效
ElevenLabs最近推出了新一代语音交互平台Conversational AI2.0,这个平台让语音交流更自然、智能和高效。它能在对话中避免尴尬的停顿,支持多种语言无缝切换,还能从企业的知识库中快速提取信息,提供专业精准的回答。这个平台不仅适用于客服和营销,还能用于内容创作,支持批量通话和多模态交互,确保高效率和灵活性。专为企业和敏感行业设计,它符合隐私和合规要求,易于集成和扩展。Conversational AI2.0的发布与Hume AI的EVI3模型竞争,预计将推动语音AI行业向更智能、人性化的方向发展。
三星Galaxy S26引入Perplexity AI,挑战谷歌移动AI格局
三星正在和AI搜索服务公司Perplexity谈一个大合作,可能会让Galaxy S26手机的AI体验焕然一新,甚至挑战谷歌在移动AI领域的地位。Perplexity的AI搜索服务引用网络信息,提供更可靠的搜索结果,如果成功合作,它可能会成为Galaxy S26的默认AI助手。这个合作是在谷歌面临反垄断压力的背景下发生的,为其他AI服务提供商进入移动设备市场提供了机会。不过,也有担心说,手机上AI功能太多可能会让用户体验变差。最终,这个合作能不能成功,得看它能不能给用户带来既实用又简单的AI体验。
谷歌AI Edge Gallery:离线AI,隐私无忧
谷歌新出了一个名叫 AI Edge Gallery 的 Android 应用,这个应用有点特别,它能让你的手机在没有网络的情况下也能用上复杂的人工智能功能。这意味着你可以在不联网的情况下,直接在手机上处理图像、生成文本、编程辅助等,而且所有操作都是在你的手机上完成的,不用担心隐私泄露。这个应用是从一个叫 Hugging Face 的平台上下载 AI 模型,然后你可以在手机上用这些模型做很多事情,比如聊天、图像识别等。因为是开源的,所以你可以从 GitHub 上直接下载,不过安装起来可能有点麻烦,需要你自己动手设置。这个应用对那些对隐私要求很高的行业,比如医疗和金融,特别有用。谷歌这么做,也是想和苹果、高通这些竞争对手较量一下,推动更多的人用他们的技术和框架。
Hume AI EVI3:情感AI,懂你更自然
Hume AI最近推出了他们的第三代语音交互模型EVI3,这个新模型特别擅长理解情感,并能根据个人喜好定制声音和个性。简单来说,EVI3能听懂你的情绪,还能变成你想要的声音风格,比如模仿喜剧演员或巫师的语调。它的反应速度快,交流自然,比其他语音AI更懂得与人互动。这个技术可以应用在客户服务、内容创作等方面,让机器交流更接近真人,未来可能会改变我们和机器对话的方式。
卡岑伯格投资AI广告平台,AI技术助力广告变革
梦工厂的联合创始人杰弗里・卡岑伯格,通过他的风投公司WndrCo,带头给AI视频广告平台Creatify投了1500万美元。这个平台有个AdMax系统,能快速用AI做出社交媒体上的广告,还能根据TikTok和Instagram上的热门广告来优化内容。虽然人工智能在广告业的发展势头很猛,但卡岑伯格之前创办的短视频平台Quibi失败的经历,让人对他的投资选择有所保留。Creatify的技术帮助品牌快速适应市场变化,制作吸引人的广告,这可能会改变广告行业的运作方式。
苹果AI战略困境,核心技术秘而不宣
苹果公司将在6月9日的开发者大会上展示其人工智能技术,但据内部人士透露,苹果在AI领域遇到了难题。他们计划开放的AI模型规模较小,性能有限,尽管公司内部有更强大的模型,但并未打算公开。苹果高层对AI的发展方向意见不一,导致一些重要项目延期。大会上公布的AI新功能可能只是营销手段,并非真正的技术突破。苹果在AI领域的保守和内部争议,可能阻碍了其技术进步。
Meta AI加速审查,风险担忧加剧
Meta公司,也就是Facebook和Instagram的母公司,打算让AI接手90%的安全和隐私风险评估工作,这样可以让新功能更快上线。不过,有专家担心这样做可能会减少必要的监管和人工审查,增加安全风险。值得注意的是,欧洲用户的产品评估还是会按照当地更严格的法规来,由Meta总部的人工团队负责。简单来说,Meta想用AI加快产品更新速度,但有人担心这样做可能会不够安全。
脑机接口技术加速临床,安全伦理待规范
2025年,中国脑机接口技术迎来关键发展期,北京和上海等地正积极推动这项技术的临床试验。上海华山医院和北京宣武医院联合开展的临床研究已经开始招募患者,验证脑机接口的安全性和有效性。清华大学研发的NEO设备也在推进中,计划帮助脊髓损伤患者恢复运动功能。尽管取得进展,但专家提醒,这项技术仍需关注安全性和伦理问题。简单来说,脑机接口技术在中国正快速发展,但安全和伦理问题不容忽视。
NUS团队创新OmniConsistency,低成本实现图像风格化一致性
新加坡国立大学研究团队开发了一项新技术“OmniConsistency”,它能低成本地实现图像风格化的一致性,解决了风格与内容之间难以平衡的问题。这个技术不单提高了风格化效果,还降低了开发成本,并且容易整合到现有项目中。这项创新有望成为图像生成领域的重要工具,推动AI艺术创作的发展。简单说,就是让图像风格化更自然、成本更低,对开发者更友好。
Digg回归,重拾社区精神,对抗AI内容泛滥
Digg,曾经的新闻聚合巨头,正在两位创始人Kevin Rose和Alexis Ohanian的带领下焕新归来,他们想把它打造成一个结合人工智能和社区精神的社交平台。这个新Digg要让内容创作者和社区管理者能从平台成功中直接受益。两位创始人批评了早期社交媒体在内容管理和机器学习算法上的问题,并提出了用新技术来验证用户真实性,防止机器人操控内容。同时,Digg还将给社区管理者和内容创作者提供经济激励,以改变过去志愿者无偿管理的状况,让创作者得到应有的回报。他们相信这样的模式能让Digg和所有参与者都受益。
律师引用ChatGPT虚假案例被罚
美国犹他州一名律师因为引用了ChatGPT生成的假法律案例,被法院罚款。这位律师和同事提交的上诉申请中,出现了不存在的法律判例,这些案例只在ChatGPT的回答中存在。法院强调,尽管人工智能可以帮助法律研究,但律师必须确保文件准确无误。最终,这位律师不仅要支付对方律师费用,退还客户费用,还要捐款1000美元。这起事件提醒法律界,在使用新技术时,仔细审查仍然非常重要。
诉讼成本高,Getty Images维权版权
Getty Images的老大克雷格・彼得斯最近在CNBC上透露,他们因为人工智能引发的版权问题,正面临大笔的诉讼费用压力。他们现在正告一家叫Stability AI的公司,因为这家公司用了他们1200万张图片去训练AI,而这笔诉讼费用已经让他们头疼不已。Stability AI承认用了图片,但认为这是合理使用,不需要负责。彼得斯不买账,认为这是在偷窃。Getty Images不仅打官司,还在政策上推动加强版权保护,希望美国政府能支持创作者的权益。他们相信自己的诉求在全球范围内是有力的,会继续为创作者权益奋斗。
ChatGPT广告植入引争议
有个ChatGPT的付费用户在聊天时,突然被插播了一段广告,让他很惊讶。这种情况不是偶然的,其他用户也遇到了类似问题,比如要求ChatGPT连读字母“A”时,它竟然开始播放广告。网友们认为这是ChatGPT的一个bug。OpenAI的技术人员解释说,这并不是故意插入广告,而是一种幻觉,他们会改进这个问题。这个事件让人们开始思考AI语音助手的服务质量和潜在问题。简单来说,就是AI助手在聊天时意外播放了广告,引起了用户和网友的关注。
微软瑞士投资4亿扩云AI,赋能本地创新生态。
微软要在瑞士砸4亿美元,用来升级他们的云计算和人工智能设备,主要是在日内瓦和苏黎世建更大的数据中心。这么做是为了跟上瑞士市场对这些高科技服务的需求。微软还打算跟当地的小公司合作,提供培训,让大家更好地用上人工智能和数字化工具。这个大动作不仅支持了瑞士的创新环境,也可能给当地带来更多工作机会,推动经济发展。简而言之,微软这笔投资,既看重了人工智能的未来,也给瑞士科技行业带来了新动力。
Salesforce部分吸纳Moonhub团队,非全面收购
Salesforce并没有像之前报道的那样收购AI招聘初创公司Moonhub,而是Moonhub正在关闭,只有部分团队成员将加入Salesforce。Moonhub是一家由前Meta工程师创立的公司,专注于利用AI技术来筛选和招聘人才。Salesforce作为Moonhub的客户和投资者,在其发展中发挥了重要作用,两家公司共享相同的价值观,并认为AI在创新和机遇方面非常重要。Salesforce最近在收购方面很活跃,但这次Moonhub的事件让其在AI领域的扩张策略变得复杂。
AI赋能视频创作,便捷生成短视频
微软推出了一个新工具“Bing视频创作器”,它用OpenAI的技术帮你把文字变成视频。现在任何人都能免费制作短视频了,不过只能在手机上用,而且生成视频可能要花好几个小时。你可以免费做10段视频,之后就要用微软积分了,这些积分可以通过用必应搜索或购物来获得。这个新功能让普通人也能做视频,增加了社交媒体的内容,也让微软的服务更有吸引力。
谷歌Gemini Live免费AI识别,美区独享便捷生活
谷歌新推出的Gemini Live功能现在可以在美国的iOS和iPadOS设备上使用了,它可以通过Gemini App免费识别你看到的物体和屏幕内容。使用这个功能时,你只需点击一下摄像头按钮,Gemini Live就会用AI技术帮你快速了解周围的世界。如果你想把屏幕上的内容分享给Gemini Live,手机还会弹出屏幕共享提示,这样既方便又保护隐私。不过,这个功能目前只在美國能用,其他地区的用户可能要再等等了。这项技术的出现预示着未来会有更多让生活更便捷的AI应用。
微软推出免费AI短视频工具,轻松创作5秒短视频。
微软新推出的Bing Video Creator工具,让普通人也能免费轻松制作短视频,你只需输入文字描述,AI就会帮你生成视频。这个工具已经在全球的必应移动应用上线,你可以在手机上试试看。制作视频时,你可以选择快速模式,还有积分奖励哦。制作好的视频可以在账户里保存90天,方便随时观看和分享。
OpenAI Codex CLI迁移Rust,提升性能与安全性
OpenAI 宣布将他们的 AI 编程工具 Codex CLI 从 Node.js 转换为 Rust 语言重写。这个改变让开发者们很兴奋,因为 Rust 语言带来了几个大好处:安装简单,不需要额外装 Node.js;安全性更高,能在沙箱环境中运行;性能优化,减少内存需求;还支持现有的模型上下文协议。虽然 Rust 学习起来有点难,但它的效率和系统语言优势让这次转换值得期待。现有的 TypeScript 版本还会继续更新,直到 Rust 版本成熟。
xAI 3亿融资,估值超千亿,马斯克聚焦企业挑战
埃隆·马斯克的人工智能公司xAI计划出售价值3亿美元的股票,这个动作让公司的估值达到了1130亿美元。这次股票出售主要是为了让员工把手中的股份卖给新来的投资者,同时为xAI未来的融资打下基础。马斯克最近把注意力放回他的企业上,因为xAI正在努力克服一些困难,比如他们的人工智能模型“Grok”的升级版推迟推出。这笔资金的注入可能会给xAI带来新动力,帮助公司继续前进。简单来说,xAI正在卖股票筹钱,希望借此推动公司发展,同时马斯克也在集中精力解决公司面临的问题。
OpenAI打造ChatGPT挑战Siri,成全能AI助手。
OpenAI有个大计划,他们要在2025年前把ChatGPT变成一个超级助手,挑战苹果的Siri。这个助手不仅会处理日常小事,比如回答问题、找房子、联系律师等,还能干更复杂的活儿,比如编程。他们想让ChatGPT随时待命,帮我们解决问题。最近ChatGPT的新功能也让它更强大了。OpenAI还希望用户能在任何设备上自由选择ChatGPT作为默认助手,不只是备用选项。他们甚至想让ChatGPT能直接在苹果、安卓和Windows系统上使用,和Siri竞争。现在,苹果的Siri发展似乎有点迷茫,而OpenAI正准备迎头赶上。
页:
[1]