按时间归档：2023年

Stable Diffusion

Stable Diffusion｜生成图像的工作原理

本文介绍Stable Diffusion图像生成的原理和方法，通过在一张图像逐渐添加噪点并记录噪点特征，再根据噪点生成所需图像。该方法使用稳定的扩散模型，训练中连续添加高斯破坏数据，然后反转噪声恢复。

2023-04-21
0025.8K
ChatGPT

Auto-GPT-ZH｜ChatGPT中文自动化

Auto-GPT-ZH是一个支持中文的实验性开源应用程序，展示了GPT-4语言模型的能力。它具备互联网搜索、长期和短期记忆管理、文本生成、访问流行网站和平台等功能，使用GPT-3.5进行文件存储和摘要。使用该开源项目可以让您的ChatGPT拥有自动化处理的功能，让您抛弃繁琐的监督和纠错过程，本站提供完整的使用帮助教程。

2023-04-20
00126.2K
其它模型

MiniGPT-4｜图像对话模型

MiniGPT-4使用一个投影层将冻结视觉编码器与冻结的LLM对齐，通过传统预训练和自我生成方式构建高质量图像文本对，再在小型数据集上进行微调训练，该模型在视觉语言任务中表现出了很好的效果。

2023-04-20
00158.3K
其它模型

GPT4All-UI｜对话机器人

基于Flask Web应用程序的聊天界面，可与基于llamacpp的聊天机器人（如GPT4all、vicuna等）进行交互。使用Nomic-AI高级库与GPT4all模型进行通信，确保无缝高效的通信。

2023-04-16
0034.9K
Auto-GPT｜ChatGPT自动化

Auto-GPT是一个实验性开源应用程序，展示了GPT-4语言模型的能力。它具备互联网搜索、长期和短期记忆管理、文本生成、访问流行网站和平台等功能，使用GPT-3.5和GPT-4进行文件存储和摘要。

ChatGPT 2023-04-13
003111.4K
风格化

multi-style_portrait_stylization｜人像多风格漫画

本项目用于将人像照片转换为卡通风格。采用DCT-Net模型，支持GPU/CPU推理，适用于包含人脸的人像照片，推理流程包括预处理、人脸关键点检测、人脸提取和对齐，以及背景融合得到最终效果。

2023-04-12
0014.3K
图像识别

CV_ORC-Text-Spotting｜多场景文字ORC识别

CV_ORC-Text-Spotting是一个多场景文字识别模型，可用于提取图片中的文字并输出对应字符串。该模型可适用于多种场景的文字识别，包括手写、自然、车牌和文档印刷，并提供了相应的文本检测模型。

2023-04-12
0003.4K
图像识别

Segment-Anything｜万物分割

分割任何物体(Segment Anything Model)，可输入提示生成高质量的对象掩码，用于图像中所有对象的分割任务。该模型有望取代传统的OpenCV，成为未来图像分割抠图领域的主流模型。

2023-04-10
04159.0K
ChatGPT

ChatGPT_Academic｜ChatGPT多功能拓展

ChatGPT_Academic是一款科研工作专用的ChatGPT拓展插件，支持函数插件、自动润色、中英互译、代码解释、程序剖析、PDF和Word文献总结翻译、Tex公式、自我解析报告和源代码生成。

2023-04-09
0037.0K
图像识别

cv_hrnetocr_skychange｜天空图像替换

cv_hrnetocr_skychange是一个基于hrnet-ocr框架的天空图像替换模型，可实现换天算法，自动获取天空区域的alpha图，并利用融合算法将原天空进行替换，从而改变原图的天空样式。

2023-04-08
0003.1K

17 / 27
14
15
16
17
18
19
20