openAI|以 2D 或 3D 形式可视化嵌入

本文介绍了如何使用t-SNE算法将高维的语言嵌入降至2维,并将结果可视化成散点图。在这个例子中,我们使用了亚马逊上的食品评论数据集,并将每个评论的打分映射成了散点图上点的颜色。

在 2D 中可视化嵌入

我们将使用 t-SNE 将嵌入的维数从 1536 减少到 2。一旦嵌入减少到二维,我们就可以在二维散点图中绘制它们。 数据集在 Obtain_dataset Notebook 中创建。

1.降维

我们使用 t-SNE 分解将维度降为 2 维。

import pandas as pd
from sklearn.manifold import TSNE
import numpy as np

# Load the embeddings
datafile_path = "data/fine_food_reviews_with_embeddings_1k.csv"
df = pd.read_csv(datafile_path)

# Convert to a list of lists of floats
matrix = np.array(df.embedding.apply(eval).to_list())

# Create a t-SNE model and transform the data
tsne = TSNE(n_components=2, perplexity=15, random_state=42, init='random', learning_rate=200)
vis_dims = tsne.fit_transform(matrix)
vis_dims.shape
(1000, 2)

2.绘制嵌入

我们根据星级评分为每条评论着色,从红色到绿色。

即使在降维的情况下,我们也可以观察到良好的数据分离。

import matplotlib.pyplot as plt
import matplotlib
import numpy as np

colors = ["red", "darkorange", "gold", "turquoise", "darkgreen"]
x = [x for x,y in vis_dims]
y = [y for x,y in vis_dims]
color_indices = df.Score.values - 1

colormap = matplotlib.colors.ListedColormap(colors)
plt.scatter(x, y, c=color_indices, cmap=colormap, alpha=0.3)
for score in [0,1,2,3,4]:
    avg_x = np.array(x)[df.Score-1==score].mean()
    avg_y = np.array(y)[df.Score-1==score].mean()
    color = colors[score]
    plt.scatter(avg_x, avg_y, marker='x', color=color, s=100)

plt.title("Amazon ratings visualized in language using t-SNE")
Text(0.5, 1.0, 'Amazon ratings visualized in language using t-SNE')
openAI|以 2D 或 3D 形式可视化嵌入

此文章由OpenAI开源维基百科原创发布,如若转载请注明出处:https://openai.wiki/visualizing_embeddings_in_2d.html

(0)
上一篇 2023-02-20 14:10
下一篇 2023-02-20 14:44

相关推荐

  • GPT-3|代码编写示例

    本文介绍了使用GPT-3编写代码的示例,包括编写SQL查询等。GPT-3能够自动推断变量名称,提高代码编写的效率和准确性。适用于需要大量代码编写的开发场景,让开发者事半功倍。

    ChatGPT 2023-02-20
    002.1K
  • Auto-GPT-ZH|ChatGPT中文自动化

    Auto-GPT-ZH是一个支持中文的实验性开源应用程序,展示了GPT-4语言模型的能力。它具备互联网搜索、长期和短期记忆管理、文本生成、访问流行网站和平台等功能,使用GPT-3.5进行文件存储和摘要。使用该开源项目可以让您的ChatGPT拥有自动化处理的功能,让您抛弃繁琐的监督和纠错过程,本站提供完整的使用帮助教程。

    2023-04-20
    0125.2K
  • ChatGPT Plus 增值版的申请付费流程

    本文介绍了 ChatGPT Plus 增值版的申请付费流程,包括了申请付费的具体步骤,支付方式,以及申请付费后的注意事项等,帮助用户更好地了解和使用 ChatGPT Plus 增值版。

    2023-02-15
    010332.8K
  • Visual-ChatGPT|对话生成图像

    关于Visual-ChatGPT的出图效果其实很一般,因为全部都过文字描述去执行功能,这真的远没有您点几点鼠标轻松,而且对中文的支持也没有所描述的那样友好,还需要openAI的API接口做为使用条件。

    ChatGPT 2023-04-08
    032.8K
  • openAI|如何流式完成

    当使用OpenAI完成端点时,流式传输可以更快地获得响应,提高应用程序的效率和性能。本文提供Python示例,介绍如何接收流完成并处理,以便在整个完成完成之前就可以开始打印或以其他方式处理完成的开始。

    ChatGPT 2023-02-19
    006.9K

发表回复

登录后才能评论
微信