谷歌推出的原生多模态输入输出 + Agent 为核心的AI模型
Gemini 2.0是谷歌最新推出的原生多模态输入输出的AI模型。Gemini 2.0 Flash是2.0家族第一个模型,以多模态输入输出和Agent技术为核心,速度比 1.5 Pro快两倍...
书生·万象InternVL 2.5:创新驱动的多模态大语言模型提升智能交互体验
书生·万象InternVL 2.5是上海AI实验室的OpenGVLab团队推出的开源多模态大型语言模型(MLLM)系列。该系列模型在InternVL 2.0的基础上进行显著增强,特别是在...
开源文本转语音工具,ChatTTS扩展版支持语音克隆
ChatTTSPlus是ChatTTS的扩展版本,基于集成TensorRT加速、语音克隆和移动模型部署等先进技术,提升语音合成的性能和灵活性。在Windows平台上,能实现超过3倍...
AI建筑可视化平台,快速将草图或概念图转化成可视化图像
Gendo是AI驱动的建筑可视化平台,基于生成式AI技术,如GANs和Diffusion模型,快速创建高度逼真的建筑概念图。平台能集成到设计工作流程中,支持设计师在项目...
AI浏览器插件,一键翻译国外视频用熟悉语言播放
YouTube Dubbing是在线观看国外视频的浏览器插件,基于智能同步配音和AI字幕技术,对字幕进行翻译并直接将翻译后的内容播放出来,免去盯着字幕的烦恼,消除观...
海螺AI新视频模型I2V-01-Live,专注动漫图片转视频,效果出色
原标题:海螺AI新视频模型I2V-01-Live,专注动漫图片转视频,效果出色 文章来源:科技未来派 内容字数:1690字海螺AI新模型:将静态图像转化为动态视频 大家...
OpenAI深夜被狙,谷歌Gemini 2.0掀翻牌桌!最强智能体组团击毙o1
新智元报道编辑:编辑部 HYZj【新智元导读】昨天深夜,OpenAI彻底被谷歌狙击,震撼亮相的Gemini 2.0掀起智能体革命,原生多模态的多项惊人demo预示着:智能体...
谷歌Gemini再添猛将!GPA 5.0毕业即DeepMind高级科学家,开挂博士给科研新人7点建议
新智元报道编辑:LRS好困【新智元导读】薛复昭博士宣布即将加入Google DeepMind,分享了他在博士生涯中的七点心得,包括工程能力的重要性、与优秀人才合作、...
超图计算+目标检测,性能新SOTA!清华发布Hyper-YOLO:用超图捕捉高阶视觉关联
新智元报道编辑:LRST【新智元导读】Hyper-YOLO是一种新型目标检测方法,通过超图计算增强了特征之间的高阶关联,提升了检测性能,尤其在识别复杂场景下的中...
一句话一张图秒变3D动画,4K级超清画质!英伟达祭出新作,游戏生成世界成真
新智元报道编辑:泽正【新智元导读】英伟达团队再次于自己的老本行大发光彩。近日发布的Edify 3D支持用户从文本提示或者图像来直接生成4K级别的3D实体与场景...
领导点赞朋友圈成加班新证据!苹果2024年度最佳App揭晓,ChatGPT全面融入苹果生态!
· 奔驰宣布大中华区董事会人事变动\x0a· 哪吒汽车已逐渐启动小批量复产\x0a· Google 请求 FTC 终止微软与 OpenAI 的独占云交易
粤公网安备 44011502001135号