up导航
  • blog
  • 网站提交
    • ai工具
    • blog
    • 网站提交

    发现

    共 266 篇文章
    发现科技资讯
    排序
    发布更新浏览点赞
    Wav2Lip – 开源的高保真唇形同步工具,自动生成与语音同步的口型动画

    Wav2Lip – 开源的高保真唇形同步工具,自动生成与语音同步的口型动画

    Wav2Lip 是一个 口型同步技术开源项目,可以在任意语音对任意说话的脸部视频进行口型同步。旨在提升视频中唇部同步的保真度。此项目通过 Wav2Lip 实现精确的唇动匹配,再利用 Real-ESRG...
    发现资讯
    1个月前
    02440
    VibePPT – AI PPT制作工具,能快速生成具有专业设计感的演示文稿

    VibePPT – AI PPT制作工具,能快速生成具有专业设计感的演示文稿

    VibePPT是一款AI驱动的在线智能PPT生成平台,支持通过自然语言 Prompt 一键生成结构完整、视觉专业的演示文稿,内置多种商务、教育、科技、营销等主题模板,自动匹配配色与排版,并可智能配图...
    发现资讯
    1个月前
    02430
    CombatVLA - 淘天集团推出的3D游戏专用视觉-语言-动作模型,决策速度比传统模型快50倍

    CombatVLA - 淘天集团推出的3D游戏专用视觉-语言-动作模型,决策速度比传统模型快50倍

    淘天集团未来生活实验室团队提出 CombatVLA,这是首个专门针对 3D 动作角色扮演游戏战斗任务的视觉-语言-动作(VLA)模型,模型在动作角色扮演游戏的战斗任务中,成功率超越了人类玩家和GPT...
    发现资讯
    2个月前
    02420
    OpenAI推出的–ChatGPT Study 学习助手模式,引导用户主动思考,促进深度学习。

    OpenAI推出的–ChatGPT Study 学习助手模式,引导用户主动思考,促进深度学习。

    OpenAI推出ChatGPT Study学习模式。相比ChatGPT此前的模式,学习模式能够帮助和引导用户一步步解决问题,而非直接给出答案。ChatGPT Study采用四种核心教学方法。交互式提示...
    发现资讯
    3个月前
    02420
    AudioStory – 腾讯ARC推出的音频生成模型,自动分析视频内容并生成匹配的背景音轨

    AudioStory – 腾讯ARC推出的音频生成模型,自动分析视频内容并生成匹配的背景音轨

    腾讯ARC实验室刚刚发布的AudioStory技术,核心在于其统一的理解与生成框架。该模型能够处理视频配音、音频延续和长篇叙事音频合成等多种任务。通过将大语言模型与音频生成系统结合,AudioStor...
    发现资讯
    1个月前
    02380
    Deepfig一全球领先的通用人工智能(AGI) 底层模型

    Deepfig一全球领先的通用人工智能(AGI) 底层模型

    DeepFig是什么? DeepFig是一家致力于开发和研究全球领先的通用人工智能(AGI) 底层模型与技术的尖端科技公司。其核心使命是挑战人工智能领域最前沿的基础性难题,旨在构建具有强大性能、卓越...
    发现资讯
    2个月前
    02380
    WhisperLiveKit – 开源AI语音识别工具,支持多种语言,能将语音实时转录为文字

    WhisperLiveKit – 开源AI语音识别工具,支持多种语言,能将语音实时转录为文字

    WhisperLiveKit是一款本地部署的AI会议工具,能够实现语音实时转录并识别不同说话人,解决了传统语音转写工具的非实时性、隐私风险和说话人混淆问题。支持实时语音转文字和说话人识别功能,适用于会...
    发现资讯
    1个月前
    02370
    字节跳动开源的大语言系列模型–Seed-OSS ,能高效解决推理难题

    字节跳动开源的大语言系列模型–Seed-OSS ,能高效解决推理难题

    Seed-OSS 是字节跳动 Seed 团队发布的开源大语言模型系列,专为长上下文、推理、智能体和通用能力而设计。该模型系列包含三个版本: Seed-OSS-36B-Base:基础模型(包含合成指令数...
    发现资讯
    2个月前
    02370
    Qwen3-Next - 阿里通义推出的新一代混合架构大模型,实现高效自动化操作

    Qwen3-Next - 阿里通义推出的新一代混合架构大模型,实现高效自动化操作

    Qwen3-Next是什么 Qwen3-Next是阿里通义推出的新一代混合架构大模型,具有强大的长文本处理能力和高效的推理速度。模型融合Gated DeltaNet和Gated Attention技术...
    发现资讯
    2个月前
    02360
    ToonComposer – 腾讯联合港中文、北大推出的AI动画制作工具,能生成高质量的动画视频

    ToonComposer – 腾讯联合港中文、北大推出的AI动画制作工具,能生成高质量的动画视频

    香港中文大学、腾讯和北京大学联合开发了一款名为ToonComposer的AI动画制作系统,能够通过一张彩色参考图片和几张简单的线稿草图,自动生成完整的高质量卡通动画视频。ToonComposer的核心...
    发现资讯
    2个月前
    02320
    加载更多
    Copyright © 2025 up导航 浙ICP备2024076937号 
    网址
    网址文章软件书籍