一般人和 ChatGPT 聊天时,往往不会在意要不要讲究礼貌。但来自爱荷华大学的一项最新研究显示:即便回答内容几乎相同,对 ChatGPT 粗鲁无礼也会让你花费更高的输出成本。
这项研究指出,GPT-4 的输出 token 价格大约是每百万输出 token 12 美元。研究者发现:
一条非礼貌提示语比礼貌提示语平均多生成 14 个 token每条提示语多花费约 0.000168 美元假设每天 API 调用量超过 22 亿次,这意味着如果所有提示语都变为非礼貌,仅因输出 token 增加,每天就可能为 OpenAI 带来额外 36.9 万美元收入换句话说,你对 ChatGPT 粗鲁,它会“加班”生成更多无关词语,为自己赚取额外收入。

此外,为了测试结论是否会因为任务类型不同而改变,研究者把提示语分到六类任务:信息检索、文本生成、编辑改写、分类、摘要以及技术任务,然后用语义向量(embedding)计算每条提示与各任务的相似度,选择最匹配的任务标签。
控制了任务类型之后,结果显示:在所有情况下,礼貌提示始终生成更短的回答,不同任务类型之间没有显著差异。

有人可能会问:礼貌提示虽然生成的回答更短,但会不会内容缩水、质量下降?研究者专门验证了这个问题。
他们把每条原始提示语和改写后的礼貌/不礼貌版本生成的回答拿来做语义相似性对比。用的是 all-MiniLM-L6-v2 模型,把回答嵌入语义向量空间,然后计算余弦相似度。
结果显示,平均相似度高达 0.78,这说明即便语气发生变化,内容仍保持一致。
研究者还进行了人工评估,由401 名参与者评估 20 对礼貌 / 不礼貌提示语输出,同样发现,两者的输出内容并无显著质量差异。
3.保持礼貌才能实打实的节约成本对于企业而言,研究者指出,直接限制 token 数量并不可靠:
GPT-4 很难严格遵守长度指令,即使你指定 200 个 token,实际可能生成 211 或 237 个使用 max_count 参数能限制输出上限,但可能导致回答被截断目前更可靠的做法是:写 prompt 时保持礼貌,既能保持回答质量,也能节约企业成本。
尽管该研究主要关注企业用户的 ChatGPT 使用情况,但普通用户也会受到这种现象影响,因为即便是入门级账户也有使用限制。如果粗鲁对待ChatGPT ,会更快消耗掉每日token 配额。
此外,研究者还呼吁:企业用户、LLM 服务提供商以及政策制定者,都应关注 输出 token 成本透明化,因为语言的微小变化可能会带来大额开销。
在最后,研究者也强调,礼貌现象可能只是更深层次语言奇异性的一种指示,而这些尚未被发现的语言特性,很可能正影响着推理成本。
所以,下次写 ChatGPT 提示语时,多加一个“请”,不仅礼貌,还能省钱!
相关文章









猜你喜欢
成员 网址收录40418 企业收录2986 印章生成263572 电子证书1157 电子名片68 自媒体91237