Whisper 是一种通用的语音识别模型。它在不同音频的大型数据集上进行训练,也是一个多任务模型,可以执行多语言语音识别以及语音翻译和语言识别。
Whisper 是Openai 开源音频转文字的语音识别模型。它在不同音频的大型数据集上进行训练,也是一个多任务模型,可以执行多语言语音识别以及语音翻译和语言识别。
Whisper有五种模型尺寸,提供速度和准确性的平衡,其中English-only模型提供了四种选择。下面是可用模型的名称、大致内存需求和相对速度。
一种从单个图像到一致的多视图扩散基础模型,旨在使用单视图输入生成 3D 一致的多视图图像。
TextBase 是一款简单的框架,用于构建 AI 聊天机器人,它可以帮助开发人员快速搭建和优化聊天机器人。
AI Comic Factory是一个免费开源的AI漫画生成器,使用LLM + SDXL开发。它能够根据用户提供的提示词生成漫画,并支持无损放大、保存和打印。
InvokeAI 是一个开源项目,是 Stable Diffusion 模型的领先创意引擎,它为使用 Stable Diffusion 模型生成高质量图像提供了简化的过程。
MotionAgent 集成了大语言模型、文本生成图片模型、视频生成模型和音乐生成模型。
基于AI大语言模型 API 实现的 AI 助手全套开源解决方案,自带运营管理后台,开箱即用。集成了 OpenAI, Azure, ChatGLM,讯飞星火,文心一言等多个平台的大语言模型。集成了 MidJourney 和 Stable Diffusion AI绘画功能。
SciMatch,它利用了 OpenAI 的GPT 等人工智能工具,并基于对面部图像与自我报告的五种主要人格特征之间的相关性的研究,实现了仅用用户自拍照即可找到与你相匹配的完美伴侣。
Maverick 是一种基于AI 根据每位客户的购买历史、偏好和行为为其生成个性化视频并将其发送给客户的AI工具。
一款股市AI助手,为股市决策提供实时见解和分析。它提供数据驱动的交易,帮助用户做出更明智的股市决策。
Sampld 是一个可免费下载高音质、免版权音乐资源的优质平台。点击任意一段声音,即可免费下载,下载页面提供了声音所属的标签类型等信息。
好说AI是一个强大的应用,集合了 AI 聊天、AI 艺术创作、AI 换脸、AI 游戏、AI 工具推荐、AI 新闻以及科技创新交流,旨在为您提供富有创造力且便捷的 AI 体验!
免费可商用!提供高质量的图片、矢量图和 psd 文件的素材网站
智能罐子AI JAR旨在提供法律咨询的参考,广泛应用到教育、案情、通用问题解答等各种商业场景,帮助人们在充满挑战的环境中更高效地工作,实现决策智能化。
全网短视频去水印,抖音快手在线视频解析,去水印工具,去水印软件
一种从单个图像到一致的多视图扩散基础模型,旨在使用单视图输入生成 3D 一致的多视图图像。