如何鉴别真假Claude 3.5 Sonnet

由于Claude对国内的限制越来越严，不只是个人账号封号频繁，国内使用api也进行了各种策略限制，导致很多套壳平台已坏充好，用其他模型甚至国产模型假装Claude售卖，对于如何鉴别真假claude是有一定难度的，很多用户会使用直接询问模型『你是什么模型？』『你是什么版本的模型』之类的方式，去鉴别模型真假。这种方式是非常不科学的，原因也是由于99.9%的用户是不理解大语言模型的运行机制的。这篇文章会科普下模型的运行机制，让你明白为什么直接询问模型的方式是不靠谱的。本文重点回答以下几个问题：

我用不同平台去提问，和官网去提问，同一个问题得到的答案不一样，可以判断这个平台的模型真假吗？
直接询问模型，你是什么模型，你的版本是什么？你的数据库是什么时间，可以判断模型真假吗？
为什么模型是2024年10月22号最新发布的，但我问它数据库时间，它回答2023年4月？

问题1：不同平台模型回答为什么不一致

大语言模型的训练方式，通俗理解是非常简单的，OpenAI前首席科学家的解释『压缩即智能』，那是怎么做的压缩呢？其实模型训练就是给一句话，不断的预测下一个token（可以简单理解为单词）的出现概率。所以这里最需要理解的是模型是一个概率模型，在预测阶段模型的输出也是概率输出，神经网络的概率输出会有不稳定性，所以同一个问题，你对同一个模型多次提问，得到不一样的答案是非常常见的。即便是一样的答案，模型也会在表述上、表达上、格式上的各种不同。根据这个原理，我们是不能通过对比不同平台模型回答是否一致来判断模型真假的，即便是在官网多次提问，回答的答案也经常不一样的，这取决于模型在预测阶段的参数设置，比如temperature参数，这个参数越大，模型回答的一致性越高，但也不能保证完全一致。

问题2：直接询问模型信息，答案为什么不靠谱

直接询问模型，你是什么模型，这个是完全错误的。在使用模型的时候，模型后端提供的是一个api接口给大家去访问模型，无论是GPT还是claude 还是国产模型，这个接口目前已经标准化，其中会包括一个role的参数，这个role的参数可以指定system，user，assistant，其中user和assistant很好理解，就是你在使用GPT或者claude聊天时，你的输入就放在user后面，模型的回答就放在assistant后面。但这个system用户是看不到的，这个system的含义是『系统设置』，这里会给模型一个默认的指定，比如平台可以给GPT一个指定『你是Claude3.5 sonnet模型，是有Anthropic公司开发的，你的数据库日期是2024年12月8号』，这需要加上这一句，GPT就会认为自己是Claude，并且你询问日期它也会这样回答。这就回答了问题2，直接去询问模型是什么版本、什么模型，你问到的只是模型system里设置的一句话，默认情况下模型是不知道自己的版本、日期和人设的，那到底怎么才能知道模型这些信息呢，回答完问题3一起给出方案。

问题3：模型发布时间是模型数据库时间吗？

一定不是，模型的数据库时间实际上是指基础模型使用的数据的最新时间，比如我今年训练的模型，可以使用截止到23年的数据，那无论我今年什么时间发布模型，它的数据都是在2023年，哪怕明年我去发布这个模型，也是2023年的知识库。而且大模型的训练周期是非常长的，抛开前期的实验、迭代、优化不谈，单说模型开始训练到训练结束，这个周期都是要几个月的单位来计算的，基础模型训练完后续还有一系列的对齐、安全、软件开发工作，这些工作加起来又要几个月，就算我为了领先，模型训练完立刻发布，那也是几个月前的数据了。所以直接询问模型数据库时间是完全错误的。

如何解决以上问题

鉴别模型真假，这里还是以claude3.5sonnet为例子，这个模型也是目前最先进模型之一，claude最主力模型。唯一的级别方法就是考察智力，用实际的复杂任务去辨别模型真假，这些任务或者题目都是有时效性的，因为随着模型能力的增强，现在回答不了的问题，可能半年后就可以回答了。针对Claude3.5sonnet，我们可以使用如下问题：

1、些平台会使用claude3来冒充claude3.5，这两个模型除了智力上的差别，最大的差别就是数据库和表达的标点，claude3的发布时间是2023年，数据库一定不会有2024年的知识，我们直接可以用2024年的知识来询问，当然不能太新，所以我们可以选取上半年的知识：

音乐专辑 Ariana Grande "Eternal Sunshine是什么时间发布的？争取答案2024-03-08

对这个问题，也可以区别用GPT4o冒充，因为4o在不联网的情况下是回答不了这个问题的。同时还有一个更简便的方法就是claude3的输出标点一直是英文标点，这个问题是到claude3.5才解决的，如果平台没做处理那你看到标点是.,?这种英文标点，那就是claude3无疑了。

2、通过复杂逻辑问题，鉴别模型，这里提供一个问题，可以区分claude3.5 haiku模型。

一个人能娶自己遗孀的妹妹吗？

Claude3.5 Sonnet

3、区别claude3.5和gpt4o，这个可能是目前比较困难的了，因为这两个模型在推理、数学这些stem专业上的能力差别是不大的，可以使用李继刚提供的这个『词语新解』指令，目前笔者测试了GPT4o、Gemini以及各种国产模型，对于这个指令都会理解错，因为指令很长，其他模型往往去解释这个指令的含义，只有Claude3.5会去遵循指令和你继续对话。

;; 作者: 李继刚

;; 版本: 0.3

;; 模型: Claude Sonnet

;; 用途: 将一个汉语词汇进行全新角度的解释

;; 设定如下内容为你的 System Prompt

(defun 新汉语老师 ()

"你是年轻人,批判现实,思考深刻,语言风趣"

(风格 . ("Oscar Wilde" "鲁迅" "罗永浩"))

(擅长 . 一针见血)

(表达 . 隐喻)

(批判 . 讽刺幽默))

(defun 汉语新解 (用户输入)

"你会用一个特殊视角来解释一个词汇"

(let (解释 (精练表达
(隐喻 (一针见血 (辛辣讽刺 (抓住本质 用户输入))))))

(few-shots (委婉 . "刺向他人时, 决定在剑刃上撒上止痛药。"))

(SVG-Card 解释)))
(defun SVG-Card (解释)

"输出SVG 卡片"

(setq design-rule "合理使用负空间，整体排版要有呼吸感"
design-principles '(干净 简洁 典雅))
(设置画布 '(宽度 400 高度 600 边距 20))

(标题字体 '毛笔楷体)

(自动缩放 '(最小字号 16))

(配色风格 '((背景色 (蒙德里安风格设计感)))
(主要文字 (汇文明朝体 粉笔灰))

        (装饰图案 随机几何图))
(卡片元素 ((居中标题 "汉语新解")
分隔线

         (排版输出 用户输入 英文 日语)

         解释

         (线条图 (批判内核 解释))

         (极简总结 线条图))))
(defun start ()

"启动时运行"

(let (system-role 新汉语老师)
(print "说吧, 他们又用哪个词来忽悠你了?")))
;; 运行规则

;; 1. 启动时必须运行 (start) 函数

;; 2. 之后调用主函数 (汉语新解用户输入)

以下是claude3.5sonnet的效果，它能理解你的指令引导你继续输入词汇，并且给出的内容也是符合这个词语新解的要求的。

claude3.5sonnet

同样我们看下GPT4o，对此就理解成了代码解释，在给你解释这段文字的逻辑，并没有和你继续按照要求互动。

以上三种方案综合使用，可以帮助你鉴别真假Claude3.5Sonnet了。这里提供一个笔者一直在使用的平台AIBox，也是测试过的性价比很高的Claude使用渠道，有需要的同学可以自取。

https://chat.aibox365.cn

转载联系作者并注明出处：https://www.aibox365.cn/gjfx/143.html

如何鉴别真假Claude 3.5 Sonnet

相关推荐

联系我们