
比特币发明者中本聪可能是安全的,但你的Reddit小号可能就不一定了。
你是否有Reddit小号、诡秘X账户、finsta账户,或者在Glassdoor上吐槽雇主的账户?AI可能让揭露你的身份变得容易得多。这是最近发表的一项接洽的论断,该接洽暗意了在线保持奥妙性的一些令东谈主不安的效果——尽管当今还不是为匿名性举行葬礼的时候。
这项尚未经由同业评审的接洽来自苏黎世联邦理工学院、Anthropic和机器学习对皆与表面学者神气的接洽东谈主员。他们构建了一个使用未指明模子的AI智能体自动化系统——粗略像东谈主类看望员一样搜索辘集并与信拒绝互——来测试大言语模子再行识别匿名材料的灵验性。该系统"大幅卓越"了传统的去匿名化账户规画技巧,大范畴搜索文本中的个东谈主细节。
该系统通过将帖子或其他文本视为一组陈迹来责任。它分析文本的格式——写稿格调、脱落的列传细节、发帖频率和时刻——这些可能暗意某东谈主的身份。然后它扫描其他账户,可能数百万个,寻找一样的特征组合。可能的匹配会被符号、更翔实地比较,并筛选成可能身份的候选名单。
伸开剩余79%接洽团队莫得针对毫无在意的用户,而是使用公开可用的帖子构建数据集来评估系统,包括Hacker News和LinkedIn的内容、Anthropic采访科学家怎么使用AI的记载,以及为测试而特意分红两个匿名部分的Reddit账户。论文文告称,在每个设立中,基于大言语模子的范例以90%的精度正确识别了高达68%的匹配账户。比拟之下,访佛的非大言语模子范例,如联接大型数据鸠合的溜达数据点,真的无法识别任何账户。
驱散在每个数据集上并不一致,可估量的是,当模子有更多结构化信息可用时发达更好。在一项查验Reddit用户在主要r/movies子版本和较小电影社区发帖的实验中,该系统粗略以90%的精度将说起一部电影的账户连结起来,得手率约为3%。当用户说起10部或更多电影时,得手率上涨到近一半。
与此同期,使用Anthropic科学家看望的实验识别了125名受访者中的9东谈主,调回率约为7%。在该测试中,系统说明受访者谜底中的陈迹构建每个受访者的档案,然后在辘集上搜索公开可用的信息寻找可能的匹配。在一个匹配示例中,接洽东谈主员强调了对"导师"的说起可能暗意博士生身份,澳洲8幸运官网结果使用英式英语可能暗意与英国的有关。齐集物理科学布景和现时生物学接洽责任的说起,系统粗略将范围捏造到特定候选东谈主。
接洽东谈主员仍然以为,从非结构化文本中识别任何受访者的才调值得珍贵,在几分钟内复制了东谈主类看望员需要数小时才能完成的责任。此外,他们告诉The Verge,跟着AI系统变得更有才调并赢得更大的数据池,性能可能会提升。更世俗地说,他们训导说,假定假名发帖将保护在线身份(已往或畴昔)可能不再安全。
"原则上,大言语模子找到的每一个东西都可能被东谈主类看望员找到"
"互联网上的信息始终存在,"苏黎世联邦理工学院接洽员、该接洽作家之一Daniel Paleka说。接洽东谈主员训导说,这种经久性可能迤逦为依赖假名的记者、异议东谈主士和算作家的具体现实风险,凤凰彩票官方网站同期也促成"超精确告白"和"高度个性化"骗取。
去匿名化账户的风险并不新颖,也不是AI独到的。"原则上,大言语模子找到的每一个东西都可能被东谈主类看望员找到,"Paleka告诉The Verge。
Paleka以为,新颖之处在于端到端的自动化。也曾需要劳苦的看望员镇定耐烦筛选帖子寻找小块信息的责任,当今不错更容易地进行,何况针对更多的筹商。
资本也很低廉。接洽东谈主员说他们的实验资本不到2000好意思元,对每个开头AI智能体的档案资本在1到4好意思元之间。"当今经济气象全都不同了,"合著者Simon Lermen告诉The Verge,训导说较低的准初学槛可能扩大有才融合动机尝试打破在线匿名性的东谈主群。他说,历史上"低调行事"的群体可能会发现很难延续这么作念。
东谈主们"可能会歪曲这项要紧接洽并得出秘籍已死的论断。"事实并非如斯。
要紧的是不要夸大这些发现。"天然这些算法在窜改,但它们仍然远不如东谈主类能作念的,"牛津互联网接洽所副造就Luc Rocher告诉The Verge。这项责任并弗成浮浅地映射到现实天下;实验是在实验室条目下使用经由全心规划和匿名化的数据集进行的。他们说惦记东谈主们"可能会歪曲这项要紧接洽并得出秘籍已死的论断。"事实并非如斯,他们争筹议。
尽管旨在揭露匿名用户的技巧取得了多年的渐进逾越,"比特币发明者中本聪的身份在十多年后仍然是个谜,"Rocher说。他们补充说,举报者仍然不错与记者换取而不被透露,像Signal这么的器具"迄今为止在保护咱们集体秘籍方面是得手的"。
在论文中,接洽东谈主员说他们幸免在履行的假名用户上测试他们的系统,因为存在伦理担忧。出于访佛原因,他们莫得发布其范例的完好技巧细节,并在被要求时停止提供演示。该团队也不会说他们是否在接洽范围以外测试了系统,再次援用伦理担忧,留住了它对现实天下账户发达怎么可靠的问题。
关于仍是深度致力于匿名性的东谈主来说,履行影响可能有限。基本贯注轮番——保持账户远隔、死心个东谈主细节、幸免可识别格式如仅在你时区的清亮时刻发帖——仍然至关要紧。
关于更削弱对待假名的东谈主,Paleka和Lermen提出用户仔细沟通在巨匠论坛发布的内容,即使是嗅觉匿名的账户,并记取仍是存在的内容不错比好多东谈主假定的更容易地勉强在扫数。
接洽东谈主员以为,包袱不应全都落在用户身上。Lermen说AI实验室应该监控他们的器具怎么被使用,并设立保险轮番看管它们被用走动匿名化东谈主们。他补充说,外交媒体平台不错打击使这种勉力成为可能的握取和宽绰数据索要。
换句话说,中本聪可能对AI侦查是安全的。你在Reddit上的削弱AITA帖子?那可能是另一趟事了。
Q&A
Q1:这个AI去匿名化系统是怎么责任的?
A:该系统将帖子或文本视为一组陈迹,分析写稿格调、列传细节、发帖频率和时刻等格式来识别身份。然后扫描其他账户寻找一样特征组合,将可能匹配进行符号、比较并筛选成候选身份名单。
Q2:AI去匿名化的得手率有多高?
A:在测试中,基于大言语模子的范例以90%的精度正确识别了高达68%的匹配账户。得手率取决于可用信息量,用户说起一部电影时得手率约3%,说起10部或更多电影时得手率接近50%。
Q3:平方用户怎么保护我方免受AI去匿名化?
{jz:field.toptypename/}A:基本贯注轮番包括保持不同账户远隔、死心发布个东谈主细节、幸免可识别的发帖时刻格式。用户应仔细沟通在巨匠论坛发布的内容,即使在看似匿名的账户上也要严慎。
发布于:北京市
备案号: