Anthropic在持续的人工智能争议中推出Claude 2

Anthropic发布了Claude 2,这是在持续的人工智能争议中的一项重要举措

Anthropic是一家人工智能(AI)和“公益”公司,于7月11日推出了Claude 2,标志着这个蓬勃发展的生成AI领域在充满看似不间断的进展的一年中又迈出了一大步。

介绍Claude 2!我们最新的模型在编码、数学和推理方面有了更好的性能。它可以产生更长的回答,并且在美国和英国的一个新的公开测试版网站上提供。链接:https://t.co/uLbS2JNczH。图源:@AnthropicAI,2023年7月11日

根据公司的博客文章,Claude 2在几乎每个可衡量的类别上都有所改进。在与其前身之间的差异中,最值得注意的是研究人员对自己的工作的讨论方式。

在宣布Claude 2的博客文章中,并没有提到传统机器学习基准测试或与类似模型的计算分数。相反,Anthropic在许多旨在代表现实世界知识、技能和问题解决测试的测试中,对Claude和Claude 2进行了头对头的测试。

Anthropic表示,Claude 2在知识、编码和其他考试中都击败了其前身,并且甚至在人类平均水平上也表现良好:

“与申请研究生的大学生相比,Claude 2在GRE阅读和写作考试上的得分超过了90%的百分位数,并且在定量推理方面与中位数申请者相当。”

值得注意的是,许多专家认为,由于人类认知推理的性质以及大型语言模型的训练数据集可能包含测试信息,人类与AI参加者之间的比较并不有效。实际上,为人类设计的测试可能并不能真正“测试”AI的推理能力,也无法提供对实际知识或技能的适当演示。

除了推出Claude 2之外,Anthropic还推出了基于Web的“与Claude交谈”界面的测试版,为美国和英国的用户提供了普遍访问聊天机器人的功能。

相关: 如何成为一名高薪的AI提示工程师

Cointelegraph对新版本进行了简要测试,并且从个人经验来看,改进效果立竿见影。Claude 2对Cointelegraph的提示几乎立即作出了明确、简明的回答。

与Claude 2聊天。图片来源:Anthropic

根据Anthropic的说法,新模型的提示限制为100,000个标记,相当于75000个单词。该网站的用户界面显示用户可以上传PDF、TXT、CSV和类似的文件进行解析;然而,在Cointelegraph发布本文之前的有限测试中,此功能无法正常工作。

将本文作为NFT收藏,以保留历史时刻,并展示对加密领域独立新闻报道的支持。

We will continue to update 算娘; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

区块链

“沉睡8年的预挖以太坊价值1.16亿美元重新复活”

尽管钱包所有者的身份仍然未知,但它展示了持有(hodling)的重要性——这是一种优先考虑长期积累加密代币的投资策略

观点

ERC-404代币:分散化的有争议实验

引入创新的ERC-404代币标准,它已偏离传统的治理流程,并采用一个具有意义和明确定义目的的术语这种独特的方法对于为市场增加...

财务

👽 外星人资助加密创业公司:Blueprint Finance筹集了750万美元解决加密货币的清算问题 🚀

从2月15日至21日,探索区块链技术的最新创新和进展,包括有关资金、伙伴关系和交易的令人兴奋的消息保持最新动态,了解最新发展

NFT

梅赛德斯-奔驰的Web3部门与指纹DAO合作推出新的NFT收藏品。

数字艺术组织Fingerprints DAO与荷兰艺术家Harm van den Dorpel和德国汽车巨头梅赛德斯-奔驰合作推出了一款生成艺术非同质化...

区块链

由于软件漏洞,Arbitrum暂停处理

由于序列器中的错误和导致网络压力的交易积压,以太坊第二层网络停机数小时修复程序已经部署,网络现在正在重新处理交易

区块链

以太坊权益证明(Proof-of-Stake)在权益证明领域的地位如何

“自食其果的受害者?根据CoinDesk指数数据,以太坊上验证者的数量不断增加,导致质押奖励下降但是其他链的竞争力较弱,这些链...