图像识别-openAI维基百科

图像识别

AI根据图片信息生成对应描述自动图像Tag标签，mplug_image-captioning_coco_base_zh模型是生成多模态的基础，基于skip-connections高效跨模态融合框架。

2023-07-09

0023.1K

图像识别

CV_ORC-Text-Spotting是一个多场景文字识别模型，可用于提取图片中的文字并输出对应字符串。该模型可适用于多种场景的文字识别，包括手写、自然、车牌和文档印刷，并提供了相应的文本检测模型。

2023-04-12

0003.4K

图像识别

分割任何物体(Segment Anything Model)，可输入提示生成高质量的对象掩码，用于图像中所有对象的分割任务。该模型有望取代传统的OpenCV，成为未来图像分割抠图领域的主流模型。

2023-04-10

04158.9K

图像识别

cv_hrnetocr_skychange是一个基于hrnet-ocr框架的天空图像替换模型，可实现换天算法，自动获取天空区域的alpha图，并利用融合算法将原天空进行替换，从而改变原图的天空样式。

2023-04-08

0003.1K

图像识别

cv_unet_universal-matting可以对包括人、物、植物、车辆等在内的多种物体进行抠图处理，无需额外输入。该模型基于粗分割和精细抠图两个子网络实现，具有较好的抠图效果。

2023-04-08

0023.7K

图像识别

Cycle-CenterNet表格结构识别模型是一种基于深度学习技术的图像处理模型，用于图中表格单元格拼接后的物理坐标的输出，具体输出的是单元格的四个角点的坐标，按照顺时针的顺序依次输出各个点的坐标。

2023-04-07

0054.8K

图像识别

cv_unet_image-matting是一个自动识别人像AI抠图的模型，可以无需任何额外输入，直接自动推理含有人像的图像，输出四通道人像抠图结果，基于原图和粗语义分割mask预测精细的抠图结果。

2023-04-05

00126.3K