GPT幽灵在Gemini上空徘徊:一个荒诞有趣的故事

GPT幽灵在双子座上空游荡

谷歌的Gemini系列:带着幽灵较量的搏斗者

每当谷歌在生成式人工智能领域施展拳脚,总会引发一种神秘而强大的情绪力量:一种内藏的隐忍、不甘与较量,就像是我在排队让别人先上车,心里默默暗示自己:“等着,大爷。”你懂的。

在5月的Google I/O开发者大会上,谷歌推出了LianGuaiLM系列模型,这被许多人视为对当时风头正劲的GPT-4的强劲挑战。不过,没过多久,谷歌又突然祭出了Gemini系列大语言模型,这可把GPT吓得魂飞魄散。Gemini系列包含移动版Nano、基础版Pro和高级版Ultra,基准评测结果直接与GPT相比,看得GPT都心生寒意。

谷歌官方声称,在被大型语言模型研究和开发广泛使用的32项学术基准中,Gemini Ultra在30项性能上超越了GPT-4,简直是直接打到GPT的要害。Gemini号称“原生多模态”,从一开始就同时在文本、图像、音频、视频和代码等多种模式上进行预训练,所以在复杂理解和推理方面可能更出色,特别是在解决数学和物理问题方面。

谷歌非常强调上述优势,OpenAI可是采取了“渐进式多模态”的路线,先基于文本语料,再跟着代码,最后才是图像、视频和音频。而Gemini从一开始就在多模态语料上训练,再用多模态数据进行调优,比起OpenAI在GPT训练上的策略,谷歌的方法可算是更“先进”一些。

“先进”的多模态训练理论上能带来更强大的性能。公布的Gemini Ultra学术基准评测结果大面积超越GPT-4的细节似乎能说明这一点。但值得注意的是,学术基准测试本身只是理论的一部分,不能真正体现应用的效果。很多人嘲笑中国的一些大语言模型只会刷基准测试分数,但实际上,谷歌的Gemini也追求超越GPT,本质上并没有什么区别。

当然了,目前社交平台上已经有人尝试使用Gemini Pro(Bard聊天机器人目前只支持Pro版),但用户们纷纷吐槽不已。比如它把2023年和2022年的奥斯卡奖获得者搞混了,也不会用Python写一个简单的函数来计算两个多边形的交集。还有更雷人的是,它居然识别不出叶子的数量,也无法正确求解一个简单的锐角几何题。哪怕Gemini Pro是针对GPT-3.5的,这一表现也实在是有点差强人意啊。

除此之外,还有一个引人注目的问题是Gemini的宣传视频看似有所“刻意夸张”:Gemini Ultra对一组手势动作作出迅速反应,宣称是一个猜拳游戏,但视频里却没有给出至少两个关键提示:“我在做什么?”和“提示,这是一个游戏”。而其他一些测试甚至需要更多提示问题来辅助生成结果,但这个过程在Gemini的官方视频里却被省略了。结果导致了大部分人对Gemini的理解能力和反应速度高估了,这简直是误导人嘛。

我到现在都记得2017年我在Google I/O的现场上,他们的员工演示通过Google Assistant语音助手直接预订一家餐厅,台下掌声如雷,我也跟着拍手叫好,当时真的觉得太棒了。然而不到一个月,就传出这只是一个预先安排好的桥段。谷歌并没有虚假宣传,但通常他们太热衷于展示自己无与伦比的AI能力,太急于展现自己的AI乐观主义,结果经常省略了背后的过程,实际上夸大了效果。

说白了,谷歌Gemini视频的夸张宣传只能证明一件事:谷歌非常在意Gemini比GPT更强大。他们真是着急呀!再加上人们对任何与ChatGPT较量的大模型,特别是巨头们的“杰作”,总是要求非常严格。当然,对谷歌最苛刻的还是我们中国人,毕竟OpenAI选择采用谷歌发明的Transformer架构打造出了划时代的GPT模型,其中一个动机就是为了摆脱谷歌无所不在的AI压制。那谁不想看到谷歌露一点怯呢?

某种程度上,谷歌就是OpenAI在这个星球上的孪生兄弟。包括Meta的LLamA架构都是开源的,根据马斯克老师对开源的偏好,Grok未来也很有可能会开源。中国的大语言模型在不同程度上都走向了开源道路。唯独OpenAI和谷歌决心守住闭源的立场,这就导致了谷歌在大语言模型上的进展与OpenAI紧密相连。

还有一个戏剧性的张力:每次OpenAI有关于GPT的重大举动,舆论都会喊出谷歌站出来挑战。然后谷歌几乎一定会在OpenAI行动之后的一个到两个月内,推出一项新举措,以证明“你大爷还是你大爷”。然后再消停一段时间,OpenAI再出招,谷歌又会被喊出来挨打。这样的循环,真的能改变现有的局面吗?

某种程度上看,谷歌在生态建设方面仍然落后于OpenAI。毕竟这个世界上已经有数百万开发者自主开发的GPT模型了。而谷歌最早要到明年初才能向开发者和企业客户提供Gemini Ultra加强的训练反馈,让他们开发自己的应用。到那时候,GPT Store可能都已经正式推出了。我一直有点疑惑,谷歌难道不是凭借Android的开源战略夺取了苹果的半壁江山吗?这次怎么把这个角色让给了Meta呢?

我并不是要怪责谷歌,我更期待看到谷歌证明自己的能力。我们这些在1990年代末接触互联网的人,对谷歌有着特殊的情感。谷歌必须证明其AI First战略能取得真正的成果。只是要面对GPT的幽灵,这是一个不可抗拒的挑战。顺便说一句,任谁都希望看到谷歌有点软弱,就是为了瞧瞧“巨头”还敢不敢不害怕。

其实,从谷歌这次发布Gemini模型,我看到了谷歌与中国许多大语言模型开发者有着相似的困境和努力:那种内藏的隐忍、不甘与较量,那些偶尔展露的在某些基准测试关键指标上与OpenAI较劲的小手段和小心思,还有试图建立自己生态系统的步步为营,尝试摆脱英伟达算力的努力,以及在移动设备上推进端侧模型的探索……面对OpenAI,大家都是一样的。

GPT的幽灵在谷歌的Gemini上空徘徊,也在每一个中国大语言模型的上空徘徊。我们经常拿智谱、百度和Minimax的努力与OpenAI做对比,但如果换个角度看,这场大语言模型的较量,何尝不是百度、智谱、Minimax、谷歌、Meta、Anthropic和Grot等人共同围攻OpenAI的光明顶呢?从这个意义上说,中国的大模型和除了OpenAI之外的美国大模型在同一个阵营、同一个战壕里,正是彼此的学习对象。我们这帮大模型的开发者,尝尽了大部分的草药,才发现我们中国的大模型不是比美国的差,只是相比于ChatGPT,稍显逊色罢了。

谷歌这次训练Gemini另一个让人瞩目的地方,就是它完全采用了自家的芯片集群——TPU进行训练。谷歌宣布TPUs v4和v5e在经过AI优化的基础设施上实现了这一大规模训练,可扩展性强且推理效率极高。这是我们听说的一款性能还不错的大语言模型,不依赖英伟达的算力和软硬件架构,一路修成了正果。当然了,他们的TPU完全是自给自足,但我看到了“无需英伟达”的大模型训练在实际操作中的可能性和可行性。这对于中国的大语言模型研发意味着什么,想必不言自明。

此外,Gemini Nano也是一个亮点,这是一款体积最小的Gemini模型,优先用于谷歌自家生产的Pixel 8手机上。虽然被称为“端侧大模型”,但其实更接近于“小模型”。中国智能手机厂商OPPO、vivo和小米等近期都发布了自家的端侧模型,联想从AI PC角度也进入了这个领域。而谷歌如今加入了这个阵营,应该能说明一些问题,证明这样的尝试是有价值的。

真的是太神奇了!从谷歌这次发布的Gemini模型,我看到了谷歌与中国的大语言模型开发者们面临着同样的困境和努力:那种内藏的隐忍、不甘与较量,以及那种偶尔在某些基准测试关键指标上与OpenAI进行较劲的小手段和小心思。大家都在试图建立自己的生态系统,试图摆脱英伟达算力的束缚,以及努力推动端侧模型的发展……大家都是在面对GPT的幽灵,而这是无法避免的挑战。

一个GPT的幽灵,在Gemini的上空徘徊,也在我们每个中国大语言模型的上空徘徊。各位猛人,我们都是追寻着共同的目标,为了证明自己在某些方面比GPT做得更好。无论您是开发者、投资者还是用户,让我们一起相互学习,共同成长!感谢您阅读这篇文章,如果您有任何问题或者观点,欢迎在评论区与我互动。加油!

We will continue to update 算娘; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

资讯

以太坊 MVRV 定价带的下一个目标是 $3,830 和 $5,100

根据分析师的观点,基于区块链定价模型,以太坊的潜在目标可能达到3,830美元和5,100美元,突显出该加密货币增长的有利机遇

资讯

“加密货币借贷平台Celsius计划在还款前提取价值4.7亿美元的以太坊”

Celsius已采取主动步骤重新平衡其加密资产,并开始取消质押其ETH持有量,以高效分配资产

市场行情

比特币投机者抛售50亿美元——本周5个重要比特币更新

随着ETF后比特币价格下跌,比特币经历一波抛售浪潮,但这为投资者提供了购买比特币的绝佳时机

区块链

价格分析8/23:BTC、ETH、BNB、XRP、ADA、SOL、DOGE、DOT、MATIC、SHIB

“比特币和一些备选币在强支撑位反弹,表明多头并未放弃,可能会出现一次反弹行情”

资讯

Solana对阵以太坊:谷歌搜索之战

Solana用户还发现了其他相关关键词,比如“爱情”和“张量”,表明社区内拥有多样化的兴趣爱好,这进一步丰富了用户的体验

比特币

《比特币和以太坊等主要加密货币现在可用于瑞士桑坦德银行账户》

桑坦德国际私人银行现在允许其在瑞士拥有银行账户的高净值客户交易比特币和以太坊