In-Context Learning 上下文学习

David LiuAugust 17, 2025About 3 min

上下文学习是大语言模型一种新的学习范式，它通过构造特定的Prompt,来使得语言模型理解并学习下游任务。相比于传统的监督微调，其不需要更新模型参数可以快速适应下游任务。

上下文学习通过任务说明，演示示例等信息引导模型输出，快速适应新任务，使语言模型即服务成为可能。监督微调需要构造训练集，通过更新模型参数来适应下游任务，效果更好，但是成本高。

大语言模型在预训练阶段从大量文本中学习潜在的概念。当运用上下文学习进行推理时，其借助任务说明或演示示例来“锚定”其在预训练期间所习得的相关概念，从而进行上下文学习，并对问题进行预测。

ICL 分类

上下文学习的分类按照示例数量的不同，上下文学习可以分为三类：

演示示例选择

演示示例选择的两个主要依据是相似性和多样性。鉴于不同方法对示例选择依据的侧重有所不同，现有的示例选择策略大致归纳为三类：直接检索、聚类检索和迭代检索。

示例选择依据

直接检索

直接检索是目前应用广泛的示例选择策略。其工作原理是，在筛选示例时，检索器依据特定的评分标准对示例进行排序，然后选取排名靠前的K个示例。代表性方法是KATE。

聚类检索

聚类检索策略把所有示例划分为K个簇，让相似的示例聚集在一起。而后从每个簇中选取最为相似的示例，最终获取K个示例。代表性方法是Self-Prompting。

迭代检索

迭代检索策略中，检索过程是迭代的，下一个示例的选择依赖于当前的问题和已选的示例。代表性方法是RetICL。

性能影响因素

上下文学习的性能受到多种因素的共同影响，这些因素包括预训练数据、预训练模型，以及演示示例等多个方面。