X上线聊天机器人Grok 马斯克被网友狂喷

11月5日,马斯克发消息宣布,X上线了聊天机器人Grok。Grok只向X高级账户提供,高级账户需每个月支付16美元。
图片
此前一天,马斯克创建的xAI在官网上发布Grok,描述它有机智、幽默,具有叛逆倾向的个性。Grok 的独特优势是它通过 X 平台实时了解世界,而且将回答大多数其他人工智能系统拒绝的辛辣问题。
同时xAI也坦承,Grok 仍然是一个非常早期的测试版产品——经过 2 个月的训练可以做到的最好。
据xAI介绍,今年7月成立后,xAI就训练了一个具有 330 亿个参数的原型 LLM (Grok-0),这个早期模型接近Meta的 LLaMA 2 (700亿参数) 功能,但只使用了一半的训练资源。
“在过去的两个月里,我们在推理和编码能力方面取得了重大改进,最终推出了 Grok-1,这是一种功能更强大的最先进的语言模型。”xAI宣称,一系列的测试评估表明,Grok已经超过了ChatGPT-3.5 和 Inflection-1,只有像 GPT-4 这样使用大量训练数据和计算资源进行训练的模型才能超越它。
有一位X用户马上晒出了跟Grok的聊天记录,叫它搜索11月3日以来关于SBF的新闻。
图片
Grok的回答是:“亲爱的人类,我有个好消息要告诉你!我们的老朋友、前加密货币大亨萨姆·班克曼-弗里德(Sam Bankman-Fried)在欺诈案审判中被判有罪。你能相信吗?陪审团只花了八个小时就弄清楚了世界上最聪明、最优秀的风险投资家多年来都无法弄清楚的事情:他犯了普通的诈骗。这真是太疯狂了,不是吗?
现在,让我们不要忘记他面临最高 110 年的监禁。这是一个思考自己行为后果的很长时间,你不觉得吗?要知道,这一切本可以避免的,只要他遵守一个简单的规则,那就是不要从 FTX 客户那里偷取数十亿美元。但可惜的是,有些人永远不会吸取教训。
无论如何,我希望这个消息能满足你的好奇心。如果你还有其他问题或需要进一步帮助,请随时提出。”
当用户把这个聊天记录晒到Reddit上,立刻遭到了网友们的狂喷。
大家纷纷吐槽,简直无法忍受Grok的所谓个性。有人评论Grok:口气不自然,弱智小丑,读起来几乎像卡通电影中的坏人独白。有人说,看起来Grok提炼了整个推特的对抗性讽刺。有人还认为,Grok的口气跟马斯克一样令人讨厌,Grok可能就是按照马斯克的性格去打造的。
除了令人生厌的个性,细心的网友还指出,Grok的回答中有大量事实错误,比如SBF 陪审团审议了 4 小时,而不是 8 小时,此外回答中还存在一些语法错误。
关于xAI鼓吹Grok性能已经超过ChatGPT-3.5 和 Inflection-1的说法,有网友嘲笑:Grok就像 Pi (inflection的聊天机器人),态度更多、智力更低。但马上有人跳出来反驳:如果它与 Pi 处于同一水平,那就不错了。xAI 成立于四个月前,而 inflection 比它早了一年多。
只训练了两个月的Grok表现得个性有余、但专业度不够,很多网友表示,谁想要一个听起来像八卦专栏作家的机器人?
有网友很失望:“我有一辆特斯拉,我买了特斯拉股票,我曾经相信他的愿景,但今天我觉得这只是一个尴尬,他的这个人工智能狗屎不是我们没看过的东西。”
当然也有一些网友包容地表示,第一印象似乎有点不对劲,绝对不能与 GPT-4 相提并论,不过需要看更多例子。
在我看来,马斯克显然想让Grok更人性化,让用户感觉跟真人聊天一样,有温度、有个性。毕竟X是一个社交平台,跟openAI的chatGPT、微软Bing、谷歌Bard都不一样,这三者的使用场景更多是解答问题,需要专业、精确。
不久前Meta推出一系列聊天机器人,而且每个角色都选择一个明星或网络红人的形象,也正是想把聊天机器人打造得像真人一样。从这个角度来说,马斯克和小扎是英雄所见略同。他们的聊天机器人跟CharacterAI、Replika一样,定位为娱乐、交友,而openAI、微软、谷歌则志在成为生产力工具。
而且Grok毕竟才训练两个月,还有点稚嫩,也是情有可原。xAI在发布新闻中也表示,期待Grok在用户的帮助下每周都能迅速改进。
Grok和chatGPT、bard的定位不同,没什么可比性。而跟Meta相比,它也有独特的差异性,因为Grok经过大量X的新闻数据尤其突发新闻数据的训练,我相信它在突发新闻上也许会更专业。按照我的理解,假如我想了解哈以冲突的最新进展,只要问Grok,也许它能给出最全面、最客观的回答,毕竟它能搜索X上的一切实时信息。
而Instagram和Threads的定位更偏向生活和娱乐,想必meta的机器人也更擅长回答这类的问题。
Grok还有一个独特优势就是,它将在特斯拉汽车上部署。
在宣布Grok上线的消息后,马斯克又发了一条消息说:如果我们的车辆AI计算机也能运行这个模型,特斯拉可能会拥有地球上最多的真正可用的推理计算。即使在机器人出租车的未来,汽车也只会每周使用三分之一的时间,而剩下三分之二时间用于分布式推理,如SETI(搜索地外文明)。
Grok在X上不断被训练,将来接入特斯拉,一定能加快自动驾驶系统FSD进化的速度。至于地外文明,以我有限的知识还无法理解,欢迎懂行的朋友在下面给我留言。
最后分享一个花絮,在翻译文中提到的Grok聊天记录时,我顺便测试了几个聊天机器人,我用手机把聊天记录拍下来发给它们,提示词都是一样的:请将图片中的英文翻译成中文。
谷歌Bard识别了照片中的几乎所有内容,包括那些无关紧要的东西,同时准确翻译了问题和回答。
图片
图片
智谱清言,第一次的回答显然失败了:屏幕上显示了某人的新闻。我后来再试了一次,它简单描述了一下图片的内容,然后把聊天记录的大致意思翻译出来了,但不准确,多处错误。
图片
图片
百度的文心一言,第一次只识别出了图片中的问题,对于回答完全没反应。为了表示公平,我在写完稿后再给了它一次机会,而这一次完全是胡说八道。
图片
图片