领先的 AI 开源平台,为开发者和研究人员提供强大的工具和资源,助力推动人工智能的发展与创新
自动创建YouTube短视频的自动化赚钱项目,只要输入视频文本MoneyPrinter即可自动产生与之相关的短视频。
字节跳动发布的一种视频编辑工具,Boximator能让用户通过简单的操作控制生成视频中主体的运动轨迹。
码多多Al智能聊天系統是一款基于人工智能技术的聊天系统AI源码。它可以与用户进行自然语言对话,提供各种服务和答案。
ProPainter,一键移除视频内的移动物体,一键移除视频水印。
Magic Animate是一项开创性的开源项目,简化了动画创作,允许您从单个图像和动态视频制作动画视频。
TryOnDiffusion就谷歌推出的一项新虚拟试穿功能,能够实现高度逼真的虚拟试穿,用户能够直观地看到不同体型的人穿着不同尺寸的衣服效果如何。
一款由腾讯研究人员开发的音频驱动的肖像动画合成框架,AniPortrait能够根据音频和静态人脸图片生成逼真的动态视频。
一个专注于动漫图像超分辨率的项目,旨在恢复和增强来自现实世界场景的低质量、低分辨率动漫图像和视频源。
一种基于区域语义控制的实时交互生成图像方法,主要用于图像生成和编辑应用。它基于扩散模型在文本到图像合成中的成功,旨在通过减少推理时间和提高生成图像的质量来提高扩散模型的可用性。
一款漂亮且功能强大的在线海报设计器,图片编辑器,仿稿定设计,迅排设计Poster-Design适用于海报生成、电商产品图、文章长图、视频/公众号封面等多种场景。
一个开源的文本生成图像动漫模型,通过整合新的数据集,Animagine XL 3.1扩展了对广泛动漫作品和风格的理解,从经典作品到最新发布的动漫,覆盖了从古老到现代的各种艺术风格。
一个用于构建基于大型语言模型(LLMs)的应用程序的开源框架。 LLMs 是根据大量数据预先训练的大型深度学习模型,LangChain可以生成对用户查询的响应,例如回答问题或根据基于文本的提示创建图像。
Comflowy社区开箱即用的 Comfy UI 整合包 一键安装,小白也能轻松上手。
为您喜欢的漫画生成文字记录,将文本与说话者相匹配,从而使读者能够通过阅读文本来完整地体验漫画故事。
毫不费力地改变图像和视频中的照明,实现超逼真的效果。使用Beeble AI 的创新技术,通过逼真的灯光效果增强您的创作。
一个可扩展、功能丰富且用户友好的自托管 WebUI,适用于各种 LLM 运行器,支持的 LLM 运行器包括 Ollama 和 OpenAI 兼容的 API。
一个使用nextjs创建的用于生成 Sora AI视频的开源Web模板。
一个开源项目,允许用户使用 OpenAI Sora 模型使用文本在线生成视频,从而简化视频创建,并具有轻松的一键网站部署功能。
一个高度可控的虚拟模特服装试穿开源工具,OOTDiffusion可以根据不同性别和体型自动调整服装,可控试穿参数,自然融合与逼真效果。
一个能够录下你的语音内容,然后自动帮助你把这些语音转成文字,对内容进行总结,并且生成相关的任务列表的AI笔记工具。
腾讯AI实验室开发的一个实时目标检测工具,它能够自动识别和定位图像中的各种对象
一款革命性的语音面部动画生成工具,借助 Media2Face,现在可以从任何音频、图像或文本输入无缝生成逼真且富有表现力的面部动画。
一款由AI驱动的应用程序,通过语音生成富有表现力的3D面部动画。
一个基于WhisperLive把声音转文字和WhisperSpeech理解这些文字的能力构建。能够与AI聊天机器人进行超低延迟对话。
由idoubi艾逗笔开发的一款AI红包封面生成器,利用AI技术生成高清精美的微信红包封面图片。
一个视频搜索和流媒体代理工具,能让您在 ChatGPT 中与您的视频库聊天并观看视频流。
一个专门为DuckDB数据库设计的文本到SQL的模型,你可以使用自然语言说描述你的需求,它会自动转换成SQL代码。
一种基于扩散的图像修复模型,主要用于虚拟试穿场景。它能够在修复图像时保留参考物品的细节,适用于在线购物等虚拟试穿场景中的图像修复任务。
基于大规模扩散的高保真通用图像恢复模型,SupIR能够根据文本提示进行智能修复,提高图像修复的质量和智能程度。
谷歌研究院开发的基于空间时间的文本到视频扩散模型。采用了创新的空间时间U-Net架构,能够一次性生成整个视频的时间长度,确保了生成视频的连贯性和逼真度。
字节跳动开发的由LLM驱动文本生成图像多合一系统,专门设计用于为不同的输入提示生成高质量的图像。
一个声音克隆和文本到语音转换的开源 Python RAG框架,只需1分钟语音即可训练一个自己的TTS模型。
一个增强版免费开源的ChatGPT程序,LibreChat 是一个免费开源的聊天机器人平台,集成了多种 AI 模型。
AI角色动画工具,通过先进的视频处理和3D渲染技术,MotionShop能够高效地将视频中的某个角色替换为3D人物,同时不改变视频中的其他场景和人物。
PhotoMaker:利用多张照片作为身份ID,获取人物特征,然后根据描述生成一个新的、个性化的人物图像。
一个开源的聊天机器人Web UI框架,Chatbot UI提供 OpenAI 的 ChatGPT UI 的改进版本。提供了一个简单的用户界面,具有新对话、新聊天、导入数据、导出数据、设置和插件键等功能。
一个面部图像精准恢复和个性编辑技术工具,不仅能复原受损图像细节,同时能精准捕捉和重现个人独特的面部特征。同时它还支持换脸。
网易有道一个开源的本地知识库问答系统,旨在支持多种文件格式和数据库,允许离线安装和使用。
ChatGPT 的开源、托管替代品,jan.ai可在您的计算机上100%离线运行。
基于AI大语言模型 API 实现的 AI 助手全套开源解决方案,自带运营管理后台,开箱即用。集成了 OpenAI, Azure, ChatGLM,讯飞星火,文心一言等多个平台的大语言模型。集成了 MidJourney 和 Stable Diffusion AI绘画功能。
文生3D数字人工具,借助 Make-A-Character,您可以毫不费力地从文本描述中生成可控、逼真、可动画的3D数字人角色。
一种从单个图像到一致的多视图扩散基础模型,旨在使用单视图输入生成 3D 一致的多视图图像。
从音频生成全身逼真的虚拟人物形象。它可以从多人对话中语音中生成与对话相对应的逼真面部表情、完整身体和手势动作。
该模型利用面部识别模型的面部ID嵌入,可以更准确地捕捉和再现特定人物的面部特征。IP-Adapter-FaceID结合文本描述生成可以生成高度个性化且与原始面部特征一致的图像。
一个高质量视频生成的开放式扩散模型,相比之前的生成视频模型,VideoDrafter最大的特点是能在主体不变的基础上,一次性生成多个场景的视频。
一个由清华大学、阿里巴巴和华中科大共同开发的一个基于扩散模型可以让人物照片说话,支持包括歌曲、多种语言的语音、嘈杂的音频在内的各种声音匹配让人物头像说话的框架。
一款融合了音乐理解和多模态音乐生成任务,旨在助力用户进行音乐艺术创作的引领潮流的框架。
解决AI图像生成中手部畸形的问题 目前的图像生成模型,再生成图像方面已经非常出色,但在生成人类手部的图像时却常常出现问题,比如手指数量不对或者手形怪异。
一个开源的 AI 图像重绘增强工具,通过使用最新的 BSR Gan技术,可以将低分辨率图像提升至高分辨率并修复和增强图像的细节。
AnyDoor,由香港大学、阿里巴巴和蚂蚁集团联合研发AnyDoor,可以将一张照片上的任何物品传送到另一张图片的世界中。
ComfyUI Portrait Master 肖像大师简体中文版。超详细参数设置!再也不用为不会写人像提示词发愁!重新优化为ison列表更方便自定义和扩展。
DreaMoving,一种基于扩散的可控视频生成框架,用于生成高质量的定制人类舞蹈视频。
LucidDreamer,可以从单个图像的单个文本提示中生成可导航的3D场景。 单击并拖动(导航)/移动和滚动(缩放)以感受3D。
LiveSketch是一款AI生成视频工具,用户通过文本提示将静态素描转化为动画,它提供了一种简单直观的方法,使他们的素描变得生动活泼。
miniPaint,在线PS,一个开源的Photoshop替代品,miniPaint可直接在浏览器中运行,不需要购买,下载,安装。
InvokeAI 是一个开源项目,是 Stable Diffusion 模型的领先创意引擎,它为使用 Stable Diffusion 模型生成高质量图像提供了简化的过程。
8spAi系统集成了全模型AI问答、创作、绘画、文生图、思维导图一站搞定!GPT4对话识图、知识库训练、文档提问总结、DALLE-3绘图、Midjourney绘画动态全功能与思维导图自动生成等功能,为用户提供了智能化的服务和体验。
Deepfakes Creator,可以通过文本输入生成逼真的会说话的真人视频。用户只需要上传想要化身模仿的人的照片,并写一个剧本,工具就能创建出逼真的人物化身视频,模拟人物说话。
VideoSrt是一个可以识别视频语音自动生成字幕SRT文件的开源软件工具。适用于快速、批量的为媒体(视频/音频)生成中/英文字幕、文本文件的业务场景。
有了 Notebook CoPilot,开发笔记本的过程变得更加容易。这个简单的工具可以毫不费力地根据您的输入生成代码和 Markdown 单元格,从而显着简化您的工作流程。
易魔声EmotiVoice是一个强大的开源TTS引擎,支持中英文双语,包含2000多种不同的音色,以及特色的情感合成功能,支持合成包含快乐、兴奋、悲伤、愤怒等广泛情感的语音。
CustomNet旨在更好地将指定物品的图片融合到新生成的图片中,并确保原物品的样式和纹理细节得以还原。这项技术给SD商品图融合带来了一线生机。
Platon.AI柏拉图智能不仅仅是 AI 爬虫,也是 AI agents 的基础设施。 AI agents 要使用工具,就必须高速阅读理解在线网页,理解网页上的每一个元素——这就是 platon.AI 的技术。
EmojiGen是一个开源的表情符号生成器。用户只需要在输入框中输入一个词或短语,EmojiGen就会立即生成相关的表情符号。
AI Comic Factory是一个免费开源的AI漫画生成器,使用LLM + SDXL开发。它能够根据用户提供的提示词生成漫画,并支持无损放大、保存和打印。
DeepFaceLive是一款基于人工智能的面部合成技术,它可以将一个人的面部表情和动作合成到另一个人的脸上,从而实现非常逼真的面部合成效果。
Documate是一款针对站内文档问答的开源 AI 工具,旨在将 AI 聊天对话框无缝嵌入到您的网站之中。
EasyPhoto是一个用于生成AI肖像的Webui UI插件,可以用来训练与你相关的数字化替身。
AI Companion App,一键创建和训练属于你的AI伴侣/女朋友。
FaceChain是一个可以用来打造个人数字形象的深度学习模型工具。用户仅需要提供最低一张照片即可获得独属于自己的个人形象数字替身。
Whisper 是一种通用的语音识别模型。它在不同音频的大型数据集上进行训练,也是一个多任务模型,可以执行多语言语音识别以及语音翻译和语言识别。
AIdea 是一款支持 GPT 以及国产大语言模型通义千问、文心一言等,支持 Stable Diffusion 文生图、图生图、 SDXL1.0、超分辨率、图片上色的全能型完全开源APP。
TextBase 是一款简单的框架,用于构建 AI 聊天机器人,它可以帮助开发人员快速搭建和优化聊天机器人。
CodeFormer,超最强的AI 视频去码、图片修复,人脸修复神器。
DeepFaceLab 是一种利用深度学习识别来交换图片和视频中的人脸的工具。
MagicEdit 是字节跳动的一款视频编辑工具,它可以高保真度和时间连贯性地编辑视频,通过学习明确区分外观和动作。
MotionAgent 集成了大语言模型、文本生成图片模型、视频生成模型和音乐生成模型。
小狐狸AI创作系统是一款基于ThinkPHP框架开发的AI问答小程序,可以说小狐狸GPT目前国内较好的一款的ChatGPT对接OpenAI 软件系统。
码多多ChatWork智能知识库,可以进行AI对话、AI应用,拥有强大的第三方对接能力。适用企业智能客服、企业智能文档、专家顾问助理等多种企业级商业场景,具有较大的商业使用价值。
SparkAi系统支持GPT4.0、Midjourney绘画、GPT3.5 API绘画、GPT联网功能、绘画广场功能、Prompt功能,后台自定义添加,用户也可自定义添加+实时语音识别输入、用户会员套餐、用户每日签到功能、支持手机电脑不同布局页面自适应。
长臂猿AIGC系统内置智能聊天对话机器人、AI绘图、AI模型训练、营销内容创作、企业虚拟AI员工等数十项AI功能,可以训练自己的AI机器人,不限制用户数量,支持源码私有化部署。
通过DragGAN,任何人都可以通过精确控制像素的位置来变形图像,从而操纵不同类别的姿势、形状、表情和布局。
一个为黑白图像上色的魔搭模型,通过双解码器实现逼真的图像着色,输入一张黑白图像,实现端到端的全图上色,返回上色处理后的彩色图像。
自动创建YouTube短视频的自动化赚钱项目,只要输入视频文本MoneyPrinter即可自动产生与之相关的短视频。