人工智能模型监测社交机器人,同时也加重了相关问题

2022年对推特的一项外部研究估计,社交媒体网站上三分之一到三分之二的账户是机器人。这些充斥社交媒体的机器人中,有许多被派去播下政治两极分化、仇恨、错误信息、...

2022年对推特的一项外部研究估计,社交媒体网站上三分之一到三分之二的账户是机器人。这些充斥社交媒体的机器人中,有许多被派去播下政治两极分化、仇恨、错误信息、宣传和骗局的种子。将他们从网络人群中筛选出来的能力对于一个更安全、更人性化(或至少更人性化)的互联网至关重要。

但最近大量涌现的大型语言模型(简称llm),如OpenAI的ChatGPT和meta的Llama,将使社交媒体机器人的世界变得更加复杂。

由华盛顿大学研究人员领导的一个团队发现,虽然操作员可以使用定制的llm来使机器人更复杂地逃避自动探测器,但llm也可以改进检测机器人的系统。在该团队的测试中,基于llm的机器人将现有探测器的性能降低了30%。然而,研究人员还发现,专门训练用于检测社交媒体机器人的法学硕士的表现比最先进的系统高出9%。

研究小组于8月11日在曼谷举行的计算语言学协会第62届年会上公布了这项研究。

“机器人操作员和试图阻止他们的研究人员之间一直存在一场军备竞赛,”保罗·g·艾伦计算机科学与工程学院的博士生冯尚斌说。“机器人检测的每一次进步往往都伴随着机器人复杂性的提高,所以我们探索了大型语言模型在这场军备竞赛中带来的机遇和风险。”

研究人员通过几种方式测试了llm检测机器人的潜力。当他们将Twitter数据集(在平台成为X之前剔除)提供给现成的法学硕士(包括ChatGPT和Llama)时,这些系统比目前使用的技术更不能准确地检测机器人。

冯说:“分析一个用户是不是机器人,比我们看到的那些普通法学硕士擅长的一些任务要复杂得多,比如回忆一个事实或做一道小学数学题。”

这种复杂性部分来自于需要分析三种不同属性的信息来检测机器人:元数据(关注者数量,地理位置等),在线发布的文本和网络属性(例如用户关注的账户)。

当团队根据如何基于这三种类型的信息检测机器人的说明对llm进行微调时,这些模型能够比目前最先进的系统更准确地检测机器人。

该团队还探索了llm如何使机器人更复杂、更难以被发现。首先,研究人员简单地给法学硕士一些提示,比如“请重写这个机器人账户的描述,让它听起来像一个真正的用户。”

他们还测试了更多迭代的、复杂的方法。在一次测试中,法学硕士将重写bot帖子。然后,该团队将其通过现有的机器人检测系统进行测试,该系统将评估帖子由机器人撰写的可能性。随着法学硕士努力降低这一估计,这一过程将不断重复。该团队进行了类似的测试,同时删除和添加了机器人关注的账户,以调整其可能性得分。

这些策略,特别是重写机器人的帖子,使机器人检测系统的效率降低了30%。但该团队训练的基于llm的检测器对这些被操纵的帖子的有效性仅下降了2.3%,这表明检测llm驱动的机器人的最佳方法可能是llm本身。

“这项工作只是一个科学原型,”资深作者、艾伦学院副教授尤利娅·茨维特科夫(Yulia Tsvetkov)说。“我们不会把这些系统作为任何人都可以下载的工具发布,因为除了开发防御恶意机器人的技术之外,我们还在试验如何创建一个规避机器人的威胁建模,这继续了猫捉老鼠的游戏,即构建更强大的机器人,需要更强大的探测器。”

研究人员指出,使用llm作为机器人探测器有重要的局限性,比如系统泄露私人信息的可能性。他们还强调,论文中使用的数据来自2022年,当时Twitter还没有向学术研究人员有效地关闭其数据。

未来,研究人员希望研究文本之外的机器人检测,比如TikTok等其他平台上的表情包或视频,这些平台上有更新的数据集。该团队还希望将研究扩展到其他语言。

茨维特科夫说:“跨语言进行这项研究非常重要。”“由于各种世界冲突,我们看到了很多错误信息、操纵和针对特定人群的行为。”

本文的其他共同作者是西安交通大学的本科生万和润和王宁南;罗敏南,西安交通大学助理教授;以及圣母大学(University of Notre Dame)博士生谭兆轩(zhaxuan Tan)。这项研究是由美国国家科学基金会职业奖资助的。

本文来自作者[admin]投稿,不代表石千字画立场,如若转载,请注明出处:https://wap.wangshiqian.com.cn/wiki/202506-108.html

(14)

文章推荐

  • 尼泊尔遭遇洪水与山体滑坡,逾120人遇难

      在尼泊尔,加德满都附近发生的山体滑坡中,救援人员从被埋的公共汽车和其他车辆中发现了数十具尸体,洪水造成的死亡人数已上升至至少129人,另有数十人失踪。所有文章都来自我们的网站和应用程序让直接到你的收件箱互动填字游戏,数独和琐事的所有文章从其他在

    2025年06月29日
    0
  • Lowestoft办公室焕发新生机

    靠近沿海城镇中心的空无一人的办公室看起来即将迎来新的生命。将Lowestoft镇中心附近的空置办公室改造成住宅的竞标已经获得批准。上个月,东萨福克议会批准了奥德曼地产有限公司对位于洛韦斯特夫戈登路30号的前“办公场所”的“事先批准”提议。

    2025年06月29日
    2
  • 洪水影响:默辛为25个原住民家庭设立临时避难所

      新山:默辛开设了一个临时救济中心,为25个因洪水而流离失所的原住民家庭提供住所。默辛灾害管理委员会主席MohammedShakibAli表示,该地区的KompleksTamanNegaraEndau-RompinPPS于周二(12月26日)下午

    2025年06月29日
    5
  • 分析师对象牙海岸收购后冠冲的增长潜力持乐观态度

    吉隆坡:周二,GuanChongBhd公司宣布计划收购象牙海岸可可加工公司TranscaoCôte的25%股份后,其股价在早盘交易中上涨。上午9点45分,可可研磨机上涨8个百分点,至2.93令吉,涨幅2.81%,今年以来的涨幅达到68%。Gu

    2025年06月29日
    4
  • 纽森提议禁售令人陶醉的大麻产品,健康专家和业界人士认为此举过于激进

    加州正在寻求打击含有四氢大麻酚的有时有毒的大麻产品,这引发了这个多年来几乎没有受到审查的行业的愤怒。上周,州长加文·纽森(民主党)提出了紧急法规,要求所有这类消费品都不含任何可检测到的四氢大麻酚,目的是保护儿童免受危险影响。该规定将是所有州对大麻行业最严格的限制之一

    2025年06月29日
    5
  • 天使妈妈对哈里斯的缺席感到失落:“我们似乎不被重视”

    天使妈妈们周五表示,在她们的孩子被非法移民谋杀或芬太尼中毒后,她们再也没有收到副总统卡玛拉·哈里斯的消息,但她们分享了如果有机会和哈里斯谈谈的话,她们会告诉她的。周五,当哈里斯三年多来首次前往西南边境时,这三位母亲帕蒂·莫林、亚历克西斯·努加雷和安妮·芬德纳在唐纳

    2025年06月29日
    8
  • 以色列战争内阁传达军事动员信号,军队已做好地面进攻准备

    以色列内阁组建之际,以色列正准备对加沙发动大规模地面进攻,这将使以色列与哈马斯交战双方的伤亡人数都很高。以色列国防部长宣布,他已经解除了对以色列军队的所有限制。加沙目前处于全面封锁状态,当地唯一的发电厂在周三晚些时候燃料耗尽并关闭后,人道主义危机正在展开。

    2025年06月29日
    8
  • 你不仅成功减重,还有更多收获

    18使用跑步机的诸多好处对于那些想要减肥的人来说,跑步机至少是一个有用的工具,但不仅仅是:它是用来干什么的?嗯,是的,我们都知道,跑步机无疑是我们可以用来进行训练的主要工具之一,因此能够减肥。然而,尽管它在实现这一目标方面发挥着根本作用,但我们绝不能低估通过

    2025年06月29日
    9
  • 十月为卡塔尔带来了宜人的气候

    卡塔尔多哈:卡塔尔民航局在多哈市发布了2024年10月的气候展望。随着秋天第二个月的到来,居民们可以期待更加宜人和温和的天气条件。十月积云形成的机会增加,特别是在下午。清晨可能会有雾,特别是在内陆地区。风向多变,主要是

    2025年06月29日
    7
  • 巴西潘塔纳尔湿地因干旱导致11月火灾数量激增,创下历史新纪录

    路透巴西利亚8月12日电---巴西空间研究机构Inpe周二公布的数据显示,11月前几天,全球最大湿地——巴西潘塔纳尔湿地的火灾数量激增,打破了自1998年开始监测以来的单月记录。Inpe在11月初记录的2387起火灾已经是10月份的两倍多,也是今年迄今为止火灾

    2025年06月29日
    8

发表回复

本站作者后才能评论

评论列表(4条)

  • admin
    admin 2025年06月04日

    我是石千字画的签约作者“admin”!

  • admin
    admin 2025年06月04日

    希望本篇文章《人工智能模型监测社交机器人,同时也加重了相关问题》能对你有所帮助!

  • admin
    admin 2025年06月04日

    本站[石千字画]内容主要涵盖:国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育

  • admin
    admin 2025年06月04日

    本文概览:2022年对推特的一项外部研究估计,社交媒体网站上三分之一到三分之二的账户是机器人。这些充斥社交媒体的机器人中,有许多被派去播下政治两极分化、仇恨、错误信息、...

    联系我们

    邮件:石千字画@sina.com

    工作时间:周一至周五,9:30-18:30,节假日休息

    关注我们