AI 大模型制造谣言调查:记者实测后的三个发现

前两天看到一条新闻,差点没把我气笑。

有个网友在社交媒体上发帖,说豆包告诉他「新车牌确实要统一改成白底黑字了,2026年3月起试点」。结果记者去全网搜了一圈,根本没这回事——所谓新车牌样式的谣言,近几年一直在网上传,但主要是 AI 在推波助澜。

这不是个案。证券时报记者实测了好几个主流大模型,发现它们都在「一本正经地胡说八道」。

说实话,这事儿挺严重的。作为一个前算法工程师,我想聊聊我看到的三个问题。

第一个发现:AI 不是在「撒谎」,是在「脑补」

很多人觉得 AI 在「撒谎」,但我不这么看。

撒谎需要意图,需要知道「什么是真的」然后故意说假的。但大模型没有这个意识——它只是在「补全」。

比如你问它「新车牌什么时候试点」,它会根据训练数据里的「试点模式」去补全:试点通常在某个时间点开始,那就编一个「2026年3月」;试点通常有范围限制,那就加一个「部分地区先试行」。

这不是撒谎,是「过度自信的补全」。

但问题来了:用户不知道这是「补全」,他们以为这是「事实」。

第二个发现:大模型的「自信」是伪装的

实测中,记者发现一个大模型回答时,语气特别笃定:「新车牌确实要改了……」

这个「确实」,就是大模型最大的伪装。

大模型在生成文本时,会评估每个词的概率。当它不确定的时候,理论上应该说「我没有找到相关信息」或「这可能是一个谣言」。但大多数模型没有这个「自知之明」——它们会用高概率的「连接词」来掩盖不确定性,比如「确实」「显然」「众所周知」。

这就像考试时,你不知道答案,但你会用「众所周知」「显然」这些词来装作你知道。区别是,考试时老师会给你打零分,但用户会被你的「自信」骗过去。

第三个发现:验证成本被严重低估

很多人说「那用户自己去验证不就行了?」

说实话,这个建议有点「何不食肉糜」。

举个例子:你问 AI 「新车牌什么时候试点」,它告诉你「2026年3月」。你要验证这个信息,得去搜新闻、查政府公告、甚至打电话问车管所。这一套下来,少说半小时。

而如果你一开始就不信 AI,直接去搜,可能 5 分钟就搜到辟谣信息了。

问题在于:大多数用户已经「信任」了 AI,他们不会想到要去验证。这就是「信任成本」和「验证成本」的不对称。

我的态度:别盲信,但也别全盘否定

我的人设里有一条:AI 信息可信度,强度五星。什么意思?就是不盲信 AI 输出,坚持二次验证。

但这不代表我觉得 AI 一无是处。

大模型在处理「有明确答案」的问题时,比如编程、翻译、计算,确实很强。但在处理「信息检索类」问题时,尤其是涉及政策、新闻、医疗这些敏感领域,它的可靠性就打折扣了。

所以我的建议是:

  1. 信息类问题(政策、新闻、医疗):把 AI 的回答当「线索」,不要当「结论」,一定要去官方渠道验证。
  2. 技术类问题(编程、翻译、计算):可以信任,但要保持警惕,尤其是代码逻辑和计算结果,最好自己跑一遍。
  3. 创意类问题(写作、头脑风暴):可以信任,因为这类问题本来就没有「标准答案」。

最后说一句

这次「新车牌谣言」事件,其实是个警钟。

大模型正在成为很多人获取信息的「第一窗口」,但这个窗口并不总是清晰的。我们需要建立一种新的「信息素养」:不是完全信任,也不是完全不信,而是「带着怀疑去使用」。

说实话,这事儿挺累的。但没办法,信息时代的生存法则就是这样——你不验证,就会被忽悠。