按时间归档:2023年
-
Stable Diffusion|生成图像的工作原理
本文介绍Stable Diffusion图像生成的原理和方法,通过在一张图像逐渐添加噪点并记录噪点特征,再根据噪点生成所需图像。该方法使用稳定的扩散模型,训练中连续添加高斯破坏数据,然后反转噪声恢复。
-
Auto-GPT-ZH|ChatGPT中文自动化
Auto-GPT-ZH是一个支持中文的实验性开源应用程序,展示了GPT-4语言模型的能力。它具备互联网搜索、长期和短期记忆管理、文本生成、访问流行网站和平台等功能,使用GPT-3.5进行文件存储和摘要。使用该开源项目可以让您的ChatGPT拥有自动化处理的功能,让您抛弃繁琐的监督和纠错过程,本站提供完整的使用帮助教程。
-
MiniGPT-4|图像对话模型
MiniGPT-4使用一个投影层将冻结视觉编码器与冻结的LLM对齐,通过传统预训练和自我生成方式构建高质量图像文本对,再在小型数据集上进行微调训练,该模型在视觉语言任务中表现出了很好的效果。
-
GPT4All-UI|对话机器人
基于Flask Web应用程序的聊天界面,可与基于llamacpp的聊天机器人(如GPT4all、vicuna等)进行交互。使用Nomic-AI高级库与GPT4all模型进行通信,确保无缝高效的通信。
-
Auto-GPT|ChatGPT自动化
Auto-GPT是一个实验性开源应用程序,展示了GPT-4语言模型的能力。它具备互联网搜索、长期和短期记忆管理、文本生成、访问流行网站和平台等功能,使用GPT-3.5和GPT-4进行文件存储和摘要。
-
multi-style_portrait_stylization|人像多风格漫画
本项目用于将人像照片转换为卡通风格。采用DCT-Net模型,支持GPU/CPU推理,适用于包含人脸的人像照片,推理流程包括预处理、人脸关键点检测、人脸提取和对齐,以及背景融合得到最终效果。
-
CV_ORC-Text-Spotting|多场景文字ORC识别
CV_ORC-Text-Spotting是一个多场景文字识别模型,可用于提取图片中的文字并输出对应字符串。该模型可适用于多种场景的文字识别,包括手写、自然、车牌和文档印刷,并提供了相应的文本检测模型。
-
Segment-Anything|万物分割
分割任何物体(Segment Anything Model),可输入提示生成高质量的对象掩码,用于图像中所有对象的分割任务。该模型有望取代传统的OpenCV,成为未来图像分割抠图领域的主流模型。
-
ChatGPT_Academic|ChatGPT多功能拓展
ChatGPT_Academic是一款科研工作专用的ChatGPT拓展插件,支持函数插件、自动润色、中英互译、代码解释、程序剖析、PDF和Word文献总结翻译、Tex公式、自我解析报告和源代码生成。
-
cv_hrnetocr_skychange|天空图像替换
cv_hrnetocr_skychange是一个基于hrnet-ocr框架的天空图像替换模型,可实现换天算法,自动获取天空区域的alpha图,并利用融合算法将原天空进行替换,从而改变原图的天空样式。