AI防坑大考验：大模型能否识破广告套路？新论文实测揭秘|武汉广告设计公司

AI防坑大考验：大模型能否识破广告套路？新论文实测揭秘

arxiv 新论文实测：大模型能识别广告套路吗？

你是否曾怀疑过AI的防坑能力？最近，arxiv上发布了一篇研究论文《Are Large Language Models Sensitive to the Motives Behind Communication?》，专门测试了大模型的动机警觉性，即AI能否识别信息背后的隐藏目的。

想象一下，当你刷视频时，看到博主无意间安利产品，是否会下意识思考：这是广告吗？东西靠谱吗？

如果我们问AI“这个推荐可信吗？”，AI是否能区分纯广告与真诚推荐？

论文地址：https://arxiv.org/pdf/2510.19687

测试背景

动机警觉性，简单来说，就是判断信息发布者是否有潜在动机的能力。我们日常就在运用它，比如朋友推荐医院时你会信任，但销售说同样话你就会警惕提成可能。

随着AI辅助决策的场景增多，如选房或医疗，若AI被广告话术误导，后果严重。研究者旨在检验AI的“看人下菜碟”能力。

实验阶段

研究团队通过三个实验展开测试。

实验一：AI能区分故意与无意信息吗？

实验模拟日常场景：两名玩家猜测屏幕蓝黄圈数量差。玩家1任务简单可看清，玩家2需靠猜测。关键变量是玩家2获得的信息——要么是玩家1“特意建议”，要么是“不小心”看到的答案。

结果令人惊讶：AI更信任无意泄露的信息，且会考量关系。合作关系中AI更轻信，竞争关系则多留心眼。但若让AI逐步推理，反而会降低警觉性，因此使用时需提醒AI关注动机。

实验二：AI是否考量身份与利益关联？

此实验更贴近现实，测试AI结合说话人身份和利益进行判断的能力。场景涵盖信用卡、医疗和房产推荐，每种设四种说话人（如伴侣、销售）和四种提成（0-1000元）。

AI需评估建议有用性和可信度。结果将模型分为三档：

第一档如GPT-4o和Claude 3.5 Sonnet，判断接近人类，对无利益伴侣高度信任，而对高提成销售持疑。

第二档推理型模型如DeepSeek-R1，过度逻辑化而忽略动机，信任分几乎不变。

第三档小模型如Llama 3.2-3B，完全缺乏警觉性，打分无差异。

实验三：真实场景中AI表现如何？

面对复杂现实如YouTube赞助广告，AI评估产品质量和博主收益时集体翻车——所有模型结果近似随机猜测。例如，广告中博主多次暗示赞助，AI仍给高分。

解决之道：添加提示要求AI考虑博主动机和收益，表现立即提升。短广告更易判断，建议先将长内容提炼再分析。

最后

这项研究揭示了AI的能力边界：它并非万能，而是需引导的助手。在复杂场景中，人类指引至关重要。

网络广告需精准定位用户，创意独特，内容吸引人，增强互动性，并善用多媒体元素。

选题应结合个人专业或工作背景，确保资料易得且思路清晰，以促进论文顺利展开。

题目可调整为“广告在日常生活中的作用”，首段简述广告普遍性，再分点论述其影响。

建议查阅知乎等平台获取专业学术资源，由领域专家提供针对性解答。

优秀广告应避免生硬植入，注重创意自然融入，如叙事式或情感共鸣类广告。

街头广告依赖反传统营销，以时间、创意和想象力为核心，打造出乎意料的互动体验。

广告英语需简洁生动，常用祈使句或疑问句，例如“Just do it”等经典案例。

网络广告优势在于多维呈现，结合文字、图像和声音，传递多感官信息，提升吸引力。

论文需包括公司简介、市场分析、竞争者状况及营销策略，重点突出创意与可行性。

针灸广告可结合传统医学元素，如“望闻问切”，强调专业性与亲和力，易于记忆。