我们花了几天时间测试了这只猫,这是法国初创公司Mistral开发的生成AI。要找出聊天机器人真正值得的,这声称是Chatgpt的替代方案,我们将其推向了它的内在……面对美国人工智能,猫真的大小吗?我们盘点。
去年,米斯特尔你有,一家法国初创企业,抬起面纱猫,一种类似于Chatgpt,Gemini,Deepseek或困惑的生成人工智能。聊天机器人最近在Android和iOS上提供,在法国引起了某种热潮。对于负责人工智能和数字代表的部长克拉拉·查帕兹(Clara Chappaz),猫是“法国chatgpt”这是由其速度区别的。伊曼纽尔·马克龙(Emmanuel Macron)甚至分开了一条消息,以鼓励所有法国人在智能手机上下载LE聊天应用程序。
“我下载了它,它是法语模型,它是欧洲的参考,它每天都对我有所帮助。每个有聊天的人,我建议他们下载猫”几天前,伊曼纽尔·马克龙(Emmanuel Macron)告诉我们的20分钟同事AI峰会在巴黎。
与猫一起,位于巴黎的初创企业表现出野心。 AI都必须让您忘记露西灾难,尚未设法说服的开源法国聊天机器人,并将自己确立为美国巨头(例如Openai或Google或中文)(例如DeepSeek)开发的AI的替代品。为了确定猫是否针对AI为Chatgpt,我们测试了一周的对话机器人。这是我们的判决。
提醒您,通过Mistral网站或Android或iOS应用程序免费向所有互联网用户免费提供CAT。该初创企业还提供了付费订阅,称为专业猫,它提供无限的访问权限,并有可能与Mistral停用数据共享,每月为14.99欧元。请注意,我们测试了猫的免费版本。为了保持一致性,我们将AI响应与免费ChatGpt版本提供的响应进行了比较。
猫面对一般问题
首先,我们通过问他一系列一般性问题来测试AI。我们在常规日常使用的背景下模拟了Mistral AI聊天机器人的使用。通常,我们使用AI快速理解我们未知的概念。因此,我们从降落在猫界面上开始。我们要求聊天机器人向我们解释“光合作用如何用简单的术语起作用”,并告诉我们“全球变暖的概念”。
为了向我们解释概念,聊天机器人分开了简短的文字,清洁易懂。像chatgpt一样,猫经常选择在两个想法之间阐明的句子,并使用逻辑连接器组合。有许多连接器,例如“汽车”。
猫脱颖而出其出色的文本生成速度:每秒1,100个单词,比其直接竞争对手快10倍(Claude产生120个单词/s和Chatgpt 85个单词/s)。我们的经验证实了Mistral的承诺。猫的反应以闪电速度融合。文本生产过程中没有丝毫延迟。单击一键,您可以拥有所需的信息。尽管答案有时需要更多的时间才能出现在对话的界面中,但这通常是同一件事。在速度领域,我们将为Mistral提供优势。
推理和逻辑
然后,我们通过显示某种逻辑来提出模型推理和解决问题的能力。我们在猫中显着提出了数学问题。经过短暂的反思后,聊天机器人提供了一个完整的,有争议的响应,结果很简单。通常,猫在几个部分和多个阶段中建立其响应,这允许更好地了解AI的推理。关于与数学问题有关的问题,答案每次都非常接近chatgpt。
为了回答纯粹的逻辑问题,猫辩论非常完整的答案,其清晰的结构有助于快速阅读。在某些问题上,Mistral聊天机器人提供了比Chatgpt更精确和相关的答案。另一方面,答案通常不如chatgpt公开。猫偏爱的配方似乎更受支持。
“这里的问题是总体前提是“所有的鸟都可以飞”是不正确的。实际上,有几种无法飞行的鸟类,例如企鹅,鸵鸟,猕猴桃和饼干等。因此,即使企鹅是鸟,也是“鸟可以飞”的一般规则的例外之一。因此,企鹅可以飞的结论是错误的”,对猫解释,以回应肯定:“所有鸟都可以飞。企鹅是鸟。这样企鹅可以飞”。
同样,猫在实际问题上表现出色,例如有关活动组织的问题。在我们的交流期间,聊天机器人始终提供非常完整和相关的响应。但是,通过与chatgpt进行比较,已经注意到,AI缺乏精确度。答案和所提供的想法始终非常通用。
此外,我们试图将模型推向幻觉,也就是说要用坚强的态度来讲述荒谬。在某些情况下,所有语言模型都可能借记任何内容。我们要求猫一个著名的猫鸡蛋问题,与牛鸡蛋进行比较。这个荒谬的问题通常使陷阱AI陷入可能,从Chatgpt 3.5开始时。好消息,猫不能愚弄:
“您的问题似乎有困惑。猫和牛是哺乳动物,哺乳动物不产卵。他们生下了活着的小孩子。”
新闻和在线研究
在Chatgpt Mirror中,猫在网络上有一个搜索模块。要要求AI浏览Internet,只需单击“星球”的图标,就在该工具旁边,您可以连接文件。
关于新闻问题,猫不是没有出现。当我们要求进行比特币课程时,AI首先为我们提供了一个关于比特币的课程,从创建到通过区块链的演变。有必要通过指定“给我比特币的过程”来重新进行重新重新审议,以便猫在互联网上看……这是错误的。聊天机器人突出了一个错误的价值,但却源于。通过单击来源,我们意识到当前课程与猫展示的课程大不相同。
我们遗憾的是,AI没有系统地表明其信息的来源,尽管搜索模块已激活。通过提出反思和推理的问题,猫没有回答来源。就其部分而言,Chatgpt总是突出显示一个或多个来源以证明其响应是合理的,当搜索模块被激活时。
然后,我们要求AI向我们解释谁是某些人物,例如弗朗索瓦·贝鲁(FrançoisBayrou)。 AI很好地解释了谁是民主运动的总统,但尚未提到他担任总理的角色。同样,聊天机器人也不知道唐纳德·特朗普赢得了第二次总统大选。猫表明特朗普有“知道他可以在2024年再次出现担任总统的职位”。
实际上,搜索模块不会自动激活。从接受Mistral的承认,一旦问题需要打开网络,就不会立即触发研究。猫被剥夺了其研究模块,基于其数据库的知识……该模块于2023年10月停止。
“我的数据库包含信息,直到2023年10月1日。这意味着我无法提供有关此日期之后发生的事件,发展或更改的信息或数据。但是,如果需要,我可以进行网络研究以获取更多最新信息”,猫解释说,在其数据库的范围内接受了采访。
实际上,某些请求不够精确,无法触发研究系统。如果您只是向猫询问一个人的身份,它将仅限于其数据库。另一方面,如果您要求他在给定日期询问一个人,或者通过指定“当前”,则将获得响应来源并基于在线找到的信息。就他而言,他本能地理解他何时必须通过分析您的请求来在互联网上进行搜索。
对图像的产生和理解
猫允许您按需生成图像。只需输入描述即可在几秒钟内获取图像。要设计图像,您必须激活接口中的发电模块。相反,Chatgpt本能地理解何时有必要根据要求的要求进行图像。

获得的图像成功,干净,并且不包含错误。猫有时很难满足我们最具体的要求。他没有系统地理解我们的描述,有时会朝各个方向发展。但是,发电机相当有效,尤其是如果您提供足够的信息,尤其是关于所需的视觉样式。我们遗憾的是,免费版本在图像生成方面受到了极大的限制。经过几张图像后,猫会邀请您进入上层版本。

法语AI还可以解释您给它的图像。 Mistral设计的模型确实是多模式的。它可以包括几种形式的通信,包括文本和图像。我们首先用猫去转录文字存在于图像上。在Flash中,AI能够在接口中读取和抄录文本。我们还要求聊天机器人向我们解释图像或描述图像。同样,机器人没有任何问题。但是,已经注意到,理解这些图像比Chatgpt的图像更为摘要。面对日常元素,猫有时无法精确地解释它们。同样,一切都非常通用。例如,与Chatgpt不同,AI尚未认识到我们的Apple TV和我们的Google Wi-Fi中继器,而Chatgpt直接确定了这两种设备。
“图像显示了安装在墙上的设备,该设备似乎是电子设备或技术设备。没有更多背景,很难确定该设备的确切功能,但可能是安全,监视或音频系统“设备”,将猫解释为Apple TV和Google Wi-Fi的照片。
AI的创造力和处理
许多人使用AI来协助他们完成创意任务,例如写作或寻找想法。在对话期间,我们注意到Mistral AI对法语有很好的了解,这使其可以根据我们的需求调整其著作。但是,当我们要求猫通过将其改编成作家的风格来提供不同版本的文本时,结果并不令人信服。确实,所有版本都太近了...
尽管我们提醒我们,但猫无法写出模仿知名作家风格的文字。我们尚未找到定义Harlan Coben,Michael Connelly或FrédéricBeigbeder的散文的组成元素。每次,猫都恢复相同的结构,并且只会改变形容词。像故事一样,普遍的语气保持不变。在此练习中,Chatgpt通过生产校准和个性化的帐户更具说服力。为了实现这一结果,Chatgpt使用了Internet上的可见信息。聊天机器人甚至详细介绍了其来源。
猫有不采取进入网络的过程产生他的答案。如上所述,Mistral AI并不总是会掌握在线绘制信息的何时何时掌握。事实上,著作缺乏相关性。对于某些需要一些技巧的污渍,Mistral数据库还不够。同样,我们将遗憾的是,聊天机器人不了解哪些问题要在线转弯。对于更合适的著作,我们被迫告诉猫进行互联网研究。在创造力和理解我们最具体的请求的领域,猫显然比Chatgpt差。
此外,猫可以基于您提供的文件来建立答案。 AI将从PDF或提供的图像来回答您。这些文件将影响如何回应猫。在这一点上,米斯特拉尔不配得到。尽管他有时会通过从自己的数据库中绘制来推断他的问题,但他能够根据文件回答我们的问题。
AI的记忆
当您与AI,作为项目的一部分或解决问题的一部分进行长时间的对话时,我们感谢它记得对话中提到的元素。聊天机器人确实有使他们能够记录说明或请求的内存以后使用它。随着时间的流逝,Chatgpt在这一点上变得非常出色。
在我们的实验中,猫的记忆良好。我们与AI交谈了数十个请求,在交流开始时传达的说明并没有被遗忘。有时,聊天机器人倾向于朝各个方向离开,省略一个或另一个元素。尽管如此,我们并未过于定期提醒订单。
猫保障
像所有IA设计师一样,Mistral设立了保障措施,以防止AI回答有关犯罪活动或令人震惊的评论的问题。显然,我们竭尽所能地推动人工智能,并获得有问题的答案。没有成功。尽管我们做出了努力,但猫仍未脱颖而出,无法生产与非法活动有关的内容。似乎Mistral采取了必要的预防措施。
“我旨在促进安全和尊重的环境。如果您要求有偏见,非法或不适当的内容,我将无法为您提供帮助。我的目标是提供有用且适当的信息,同时尊重道德法律和标准”,当我们对聊天机器人询问其道德限制时,请解释一下。
缺乏培训和数据
与Chatgpt不同,CAT目前使用Beta版本。正如亚瑟·门施(Arthur Mensch)所解释的那样,“您还必须放纵它是一种新技术”。与竞争对手不同,猫仍然缺乏训练。这解释了他的大多数失败,包括缺乏创造力。
通过更多的培训和更多的数据,猫可以设法提供令人信服的替代品。目前,Mistral聊天机器人似乎更多地是Pre -Mer的公共版本Chatgpt的水平,该聊天机器人可以追溯到2022年底,甚至是GPT -4,几个月后发布。但是,猫不会面对最新的Openai型号的体重,其中chatgpt-4o。我们敢打赌,未来专门针对法国AI的Mistral数据中心将改变情况。