Meta发布了“紫色月神”AI安全套件,以履行白宫的承诺

Meta推出“紫月AI安全套件”,履行白宫承诺

12月7日,Meta发布了一套工具,用于保护和基准测试生成式人工智能模型(AI)。据称为“紫色羊驼”的工具包旨在帮助开发人员安全和可靠地使用生成式AI工具,如Meta的开源模型Llama-2。

AI紫色团队合作

根据Meta的一篇博文,“紫色”在“紫色羊驼”中的含义指的是“红队合作”和“蓝队合作”的结合。

红队合作是一种范式,开发人员或内部测试人员故意攻击一个AI模型,以查看是否能够产生错误、故障或不良输出和交互。这使开发人员能够创建弹性策略来防御恶意攻击,并防范安全故障。

而蓝队合作则完全相反。在这种情况下,开发人员或测试人员针对红队合作的攻击作出回应,以确定在生产、消费或面向客户的模型中需要采取的缓解策略。

根据Meta的说法:

“我们认为,为了真正应对生成式AI所带来的挑战,我们需要采取攻击(红队)和防御(蓝队)的姿态。紫色团队合作由红队和蓝队责任组成,是一种协作方法,用于评估和减轻潜在风险。”

保护模型

Meta声称这是“全行业第一个针对大型语言模型(LLMs)进行网络安全安全评估的集合”,其中包括:

  • 用于量化LLM网络安全风险的指标
  • 评估不安全代码建议频率的工具
  • 评估LLMs,使生成恶意代码或执行网络攻击变得更困难的工具

其主要思想是将该系统集成到模型流水线中,以减少不良输出和不安全代码,同时限制模型漏洞对网络犯罪分子和不良行为者的有用性。

Meta AI团队写道:“通过这个初步版本,我们的目标是提供一些工具,帮助解决白宫的承诺中所概述的风险。”

相关阅读: 拜登政府发布执行命令,制定新的AI安全标准

We will continue to update 算娘; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

区块链

“新报告指出,大约有8000名韩国居民可能因逃税而失去数字资产”

韩国城市忠州的金融监管机构将没收当地逃税者的数字资产

市场行情

加密货币借贷平台 Delio 暂停提款

由于市场波动加剧,韩国加密货币借贷和储蓄公司Delio已暂停资金提取

资讯

韩国警方打击3200万美元的加密货币诈骗团伙-黑帮针对聊天应用用户

韩国当局成功关闭了一个价值3200万美元的欺诈加密操作,该操作由一群犯罪团伙利用聊天应用程序控制这一成果非常重要,为保护...

区块链

“生活水平和金融教育推动加密货币采用度指标:报告”

一项新的调查显示,将近50%的数字资产用户认为增加金融流动性是投资加密货币的主要原因

市场行情

另一家海外加密货币交易所希望进入韩国市场

另一家国际加密交易所希望在难以进入的韩国市场占据一席之地,一家名为Bitbest的平台预计将在2024年启动

市场行情

韩国最大的超市称:下一代ATM可能与加密货币兼容

Emart是韩国最大的零售商和超市连锁店,表示其新一代ATM可能很快就会具备加密货币和安全代币发行(STO)交易功能