GPT-3 文本说明
ChatGPT Prompt是一款基于大型语言模型的工具,可以从长文本中提取信息。它可以帮助你回答问题、总结文本、对文本进行分类和提取实体,适用于多种应用场景。
大型语言模型对于从长文本中提取信息非常有用。应用包括:
- 回答有关一段文本的问题,例如:
- 查询知识库以帮助人们查找他们不知道的内容
- 查询不熟悉的文档以了解其包含的内容
- 使用结构化问题查询文档,以提取标签、类、实体等。
- 总结文本,例如:
- 总结长文档
- 总结来回的电子邮件或消息线程
- 总结详细的会议记录,包括要点和后续步骤
- 对文本进行分类,例如:
- 按主题或类型对客户反馈消息进行分类
- 按主题或类型对文档进行分类
- 对文本的语气或情绪进行分类
- 提取实体,例如:
- 从客户消息中提取联系人信息
- 从文档中提取人员、公司或产品的名称
- 提取客户评论或反馈中提到的内容
以下是每种方法的一些简单示例。
回答有关一段文本的问题
下面是回答有关一段文本的问题的示例提示:
使用下面的文字,回答下面的问题。 如果答案未包含在文本中,请说"我不知道"。 文本: """ 位于中非西海岸加蓬奥克洛的奥克洛矿(有时称为奥克洛反应堆或奥克洛矿山)被认为是唯一的天然核裂变反应堆。 Oklo 由 16 个地点组成,人们认为这些地点大约在 17 亿年前发生了自持核裂变反应,并持续了数十万年。 据估计,那段时间的平均热功率不到 100 千瓦。 """ 问:迄今已发现多少个自然裂变反应堆? 回答:
输出:
一:Oklo Mine 被认为是唯一的天然核裂变反应堆。
如果要询问的文本超过令牌限制(/ 为 ~4,000 个标记,早期型号为 ~2,000 个标记),则可以将文本拆分为较小的部分,按相关性对它们进行排名,然后仅使用看起来最相关的部分提出问题。这在openAI|使用嵌入进行问答中得到了证明。text-davinci-002-003
就像学生在允许访问笔记时在测试中表现更好一样,GPT-3 在获得包含答案的文本时在回答问题方面做得更好。 没有笔记,GPT-3 必须依靠自己的长期记忆(即内部权重),这更容易导致虚构或幻觉的答案。
综述
下面是总结一段文本的简单示例提示:
总结以下文字。 文本: """ 两个独立的实验今天早上在瑞士日内瓦附近的欧洲高能物理实验室 CERN 报告了他们的结果。 两者都显示出令人信服的证据,证明存在一种重量约为 125 吉电子伏特的新玻色子粒子,到目前为止,这符合理论物理学家先前对希格斯粒子的预测。 "作为外行,我会说:'我想我们已经做到了'。你同意吗?" CERN 总干事 Rolf-Dieter Heuer 向座无虚席的礼堂发问。 聚集在那里的物理学家爆发出热烈的掌声。 """ 概括:
输出:
CERN 的总干事问座无虚席的礼堂,他们是否同意两个独立的实验已经找到了符合希格斯粒子预测的新玻色子粒子的令人信服的证据,聚集在那里的物理学家们以掌声回应。
这些示例提示中使用的三引号并不特殊;GPT-3 可以识别大多数分隔符,包括 、 或 。对于长文本段,我们建议使用某种分隔符来帮助消除一段文本结束和下一段文本开始的歧义。"""
<>
{}
###
分类
如果要对文本进行分类,最佳方法取决于是否事先知道类。
如果你的类是事先知道的,分类通常最好使用微调模型来完成,如GPT-3|微调分类所示。
如果你的类事先不知道(例如,它们是由用户设置的或动态生成的),你可以尝试零镜头分类,方法是给出包含类的指令,甚至使用嵌入来查看哪个类标签(或其他分类文本)与文本最相似。
实体提取
下面是实体提取的示例提示:
从下面的文本中,按照以下格式提取以下实体: 公司:<以逗号分隔的公司列表> 人物和头衔:<以逗号分隔的提及人员列表(他们的头衔或角色附加在括号中)> 文本: """ 1981 年 3 月,美国诉 AT&T 案在助理检察长威廉·巴克斯特 (William Baxter) 的带领下开庭审理。 AT&T 董事长查尔斯·L·布朗 (Charles L. Brown) 认为公司会被毁掉。 他意识到 AT&T 会输,并于 1981 年 12 月恢复与司法部的谈判。 不到一个月后达成协议,布朗同意资产剥离——最好也是唯一现实的选择。 AT&T 的决定使其得以保留其研究和制造部门。 该法令名为最终判决的修改,是对 1956 年 1 月 14 日同意令的调整。哈罗德 H. 格林法官被授予修改后的法令的权力...... 1982 年,美国政府宣布 AT&T 将不再作为垄断实体存在。 1984 年 1 月 1 日,它被拆分为七个较小的区域性公司,贝尔南方公司、贝尔大西洋公司、纽约证券交易所、美国信息技术公司、西南贝尔公司、美国西部公司和太平洋电信公司,以处理美国的区域电话服务。AT&T 保留了其长期控制权 远程服务,但不再受到竞争保护。 """
输出:
公司:AT&T、Bell South、Bell Atlantic、NYNEX、American Information Technologies、Southwestern Bell、US West、Pacific Telesis 人物和头衔:William Baxter(助理检察长)、Charles L. Brown(AT&T 董事长)、Harold H. Greene(法官)
评论 (0)