复旦团队研发大模型提示词交易新模式,有望降低内容创作者素材获取成本

全文1693字,阅读约需5分钟,帮我划重点

划重点

01复旦大学多媒体与智能安全团队研发了一种新型提示词交易模式,以降低内容创作者素材获取成本。

02该交易模式综合考虑了提示词与生成内容的相关性和生成质量,让买家、卖家和平台都能在权衡成本与收入之后,制定符合各自利益的交易策略。

03研究人员表示,该交易模式非常契合买方市场,也更加符合未来的交易场景。

04预计该交易模式将能带来两种潜在应用:规范提示词交易市场,降低内容创作者的创作成本。

05目前,相关论文已发布在arXiv上,复旦大学博士生李美玲和任洪润是共同第一作者。

以上内容由腾讯混元大模型生成,仅供参考

目前,市面上已有一些比较成熟的大模型提示词交易平台比如 PromptBase,并已开放提示词的售卖渠道。

尽管提示词交易平台正在陆续出现,但是对于提示词价格的定义,却没有一个比较客观的衡量标准。

这些平台的交易流程大致可以总结为:

首先,卖家上传提示词商品,并给出使用细则和售卖价格;

其次,买家按照卖家规定的价格支付费用;

再次,卖家和交易平台通过固定比例的抽成获取收益;

最后,买家获取提示词商品和使用细则。

在这种交易模式之中,提示词价格的界定由卖家主导,因此属于典型的卖方市场。

随着生成式大模型的应用领域变得愈加广泛,提示词交易的市场规模也会逐步扩大。

作为一种数据商品,当提示词供大于求的时候,卖方市场就会变为买方市场。届时,PromptBase 等交易平台的以卖方主导的交易模式便不再适用。

在这一背景下,来自复旦大学的多媒体与智能安全团队关注到:很有必要针对提示词的买方市场,来构建一种新型提示词交易模式。

如下图所示,在汇集海量提示词商品的平台中,一些买家会向平台提出提示词购买需求。

平台接到需求之后,会从符合要求的卖家那里,购买合规的提示词。鉴于提示词收集成本,卖家需权衡出售的提示词丰富程度。

图片

图 | 提示词交易场景(来源:资料图)

基于此,该课题组提出一款更加合理的提示词交易模式。

该模式综合考虑了提示词与生成内容的相关性和生成质量,让买家、卖家和平台都能在权衡成本与收入之后,制定符合各自利益的交易策略。

研究人员表示:假设提示词商品的收集轮次共有 T 次,那么就可以将每次收集轮次 t 看作是一次迭代。

在使用该团队提出的提示词交易模式时,主要涉及到两个阶段:

阶段一,提示词类别选取。

在这一阶段之中,平台要选择符合买家购买需求的提示词类别。鉴于各类提示词的质量是未知的,因此先要随机设定各类别提示词丰富程度

图片

的值,并对所有类别的提示词质量进行评估。

之后在每一次的迭代中,采用基于贪婪搜索的多臂老虎机,根据各类别的评估质量,挑选出等待出售的提示词类别。

阶段二,定价策略制定。

在这一阶段之中,买家、平台和卖家三方,分别会针对平台交易价格 pG,t、与卖家的交易价格 pt、以及所收集提示词的丰富程度

图片

进行协商。

协商过程中,为了更加契合买方市场,三方会采用级联 Stackelberg 博弈的方法。

这时可以将买家、平台和卖家分别视作一级领导者、二级领导者和追随者,同时优先考虑买家的利益,然后依次考虑平台利益和卖家利益。

在每一次迭代之中,根据当前的评估质量,选取前 K 个类别中的提示词,同时对被选中的 K 个类别的评估质量加以更新。

这时,根据设计好的交易三方利润函数,使用逆向归纳法先后计算出买家、平台和卖家的最优交易策略<pG,t,pt

,

图片

>。

协商完成之后,卖家上传丰富程度为

图片

的提示词商品,平台则要对商品进行审核。在确保商品符合出售标准之后,平台将商品交付给买家。

然后,买家以预先商定的价格 pG,t 向平台付款,平台则以预先商定的价格 pt 向卖家付款,至此交易正式完成。

而决策变量 pG,t 既不能太低也不能太高,太低可能会终止交易,太高则有损自身利润。因此,为了保证交易的正常进行,买家需要设置决策变量 pG,t 的取值范围。

同样,平台也需要设置决策变量 pt 的取值范围。因为假如 pt 太低,会降低卖家上传商品的积极性;而假如 pt 太高,则会有损平台自身利润。

同时,卖家上传的提示词商品丰富程度

图片

,如果不符合要求,平台有权更换提示词供应商,以便保障买家的权益。

研究人员表示:“我们提出的交易模式非常契合买方市场,也更加符合未来的交易场景。”

预计将能带来如下两种潜在应用:

其一,通过开展各种模态提示词的价格评估,可以更好地规范提示词交易市场,从而营造卖方、平台和买方的三赢局面。

其二,随着提示词商品的与日俱增,提示词的交易成本也将逐渐降低,这意味着内容创作者能以更低的代价找到灵感和素材,从而能够提高创作效率。

图片

图 | 李美玲(来源:李美玲)

日前,相关论文以“Online Prompt Pricing based on Combinatorial Multi-Armed Bandit and Hierarchical Stackelberg Game”为题发布在 arXiv[1],复旦大学博士生李美玲和任洪润是共同第一作者。

图片

图 | 相关论文(来源:arXiv)

综合来看,交易三方利润函数的设计以及提示词的质量评估等因素,都会对最终定价起到关键影响。

此外,课题组后续将尝试将本次成果扩展到更具普适性的提示词定价场景之中。

参考资料:

1.https://arxiv.org/pdf/2405.15154

排版:刘雅坤