AudioStory
AudioStory 是腾讯 ARC 实验室发布的音频生成技术,能根据自然语言描述生成高质量的长篇叙事音频。采用分而治之策略,将复杂叙事请求拆解为有序子任务,通过...
Open-Fiesta
Open-Fiesta 是开源的多模型 AI 聊天平台,基于 Next.js 14 构建。平台支持多种 AI 提供商(如 Gemini、OpenRouter 等)和多种模型,用户能同时选择 5 种模型...
Step-Audio 2 mini
Step-Audio 2 mini 是阶跃星辰发布的开源端到端语音大模型。突破传统语音模型结构,采用真端到端多模态架构,直接将原始音频输入转化为语音响应输出,时延更...
Nano Banana提示词 | 分享
用梯子,在Google Al Studio上就可以免费玩这个最火热的大模型了。链接如下:https://aistudio.google.com/app/prompts/new_chat?pli=1网络上最流行的手办模...
实测Nano Banana:一张自拍搞定证件照+职业照+写真大片
✨这是我的第24篇的AI主题原创文章。全文共约2780字,阅读时间约7分钟。✨这几天一直在玩Nano Banana,探索它的各种可能。由于它十分优秀的一致性,以及对语义...
MobileCLIP2
MobileCLIP2是苹果公司研究人员推出的高效端侧多模态模型,是MobileCLIP的升级版本。在多模态强化训练方面进行了优化,通过在DFN数据集上训练性能更优的CLIP...
一键生成逼真漫画,2步即可完成,小白可上手(内附提示词)
上次分享的漫画工作流,效果还行。最近公众号漫画很火?只需2步即可生成,超简单(小白可上手)但总觉得差点意思。那些AI生成的漫画,一眼就能看出是AI味。缺少...
InternVL3.5
InternVL3.5(书生·万象3.5)是上海人工智能实验室开源的多模态大模型,模型在通用能力、推理能力和部署效率上全面升级,提供从10亿到2410亿参数的九种尺寸版...
MAI-Voice-1
MAI-Voice-1 是微软人工智能团队推出的首个具有高度表现力和自然的语音生成模型。模型能在单个 GPU 上不到一秒钟内生成一分钟的音频,是目前最高效的语音系统...
粤公网安备 44011502001135号