up导航
  • blog
  • 网站提交
  • 2fa工具
  • 全球地址生成
  • ui工具
      • 未登录
        登录后即可体验更多功能
    • ai工具
    • blog
    • 网站提交
    未登录
    登录后即可体验更多功能

    资讯

    共 2675 篇文章
    发现科技资讯
    排序
    发布更新浏览点赞
    Open Interpreter – 开源AI终端助手,支持在本地环境中运行

    Open Interpreter – 开源AI终端助手,支持在本地环境中运行

    open interpreter 是一个开源的 ai 终端助手项目,旨在为大型语言模型(llm)赋予本地代码执行能力。通过自然语言交互界面,用户可以通过类似 ChatGPT 的方式在终端中与模型对话...
    发现资讯
    1个月前
    05500
    FlowyAIPC – 本地AI办公助手工具,支持多种语言的即时翻译

    FlowyAIPC – 本地AI办公助手工具,支持多种语言的即时翻译

    FlowyAIPC 是 Flowy AI 公司推出的面向智能办公领域的 AI 助手产品,这款工具能在完全离线状态下运行,所有数据、聊天记录、知识库内容都保存在本地电脑中,保证了数据的安全性和私密性。它...
    发现资讯
    3个月前
    05480
    Lynx : 字节跳动推出的高保真个性化视频生成模型,仅需一张人物照片

    Lynx : 字节跳动推出的高保真个性化视频生成模型,仅需一张人物照片

    Lynx是字节跳动推出的高保真个性化视频生成模型,仅需输入一张人像照片,即可生成身份高度一致的动态视频。该模型通过单张人物图像即可生成身份一致、动作自然、场景多样的动态视频,在身份保真度、动作连贯性...
    发现资讯
    5个月前
    05480
    商汤开源的首个实时视频生成推理框架–LightX2V ,支持多种视频生成任务

    商汤开源的首个实时视频生成推理框架–LightX2V ,支持多种视频生成任务

    商汤开源了行业首个能实现实时视频生成的推理框架LightX2V,支持低资源部署,通过DiT蒸馏加速、轻量化 VAE、稀疏注意力等优化,实现低成本、强实时的视频生成。框架支持多种硬件部署,提供 Grad...
    发现资讯
    3个月前
    05450
    GLM-4.6V – 智谱开源的多模态大模型系列,支持云端、本地及多种硬件环境部署

    GLM-4.6V – 智谱开源的多模态大模型系列,支持云端、本地及多种硬件环境部署

    智谱正式上线并开源 GLM-4.6V 系列多模态大模型,该模型支持高达 128k tokens 的超长上下文,在视觉理解精度方面处于同规模模型的领先梯队,并首次将工具调用能力深度原生集成至视觉架构中...
    发现资讯
    3个月前
    05430
    万相2.6 – 阿里通义推出的新一代视频生成系列模型,首个支持角色扮演模型

    万相2.6 – 阿里通义推出的新一代视频生成系列模型,首个支持角色扮演模型

    阿里通义推出万相2.6系列模型,支持音画同步、多镜头生成及声音驱动等功能。旨在实现生成视频在画面与声音上的整体一致性。其分镜控制功能可依据语义理解,将原始素材构建为包含多镜头切换的专业叙事段落。该版本...
    发现资讯
    3个月前
    05380
    SSVAE – 智谱AI开源的频谱结构化变分自编码器,提供快速生成视频的能力

    SSVAE – 智谱AI开源的频谱结构化变分自编码器,提供快速生成视频的能力

    ssvae(spectral-structured vae)是智谱ai研发的一种面向视频生成任务优化的新型变分自编码器。SSVAE 在相同生成质量下,收敛速度提升3倍,仅用1.3B参数量就超越了4B参...
    发现资讯
    3个月前
    05370
    Qwen3-Omni – 阿里通义开源的原生端到端全模态大模型,支持119种文本语言交互

    Qwen3-Omni – 阿里通义开源的原生端到端全模态大模型,支持119种文本语言交互

    Qwen3-Omni模型的发布,标志着开源多模态人工智能领域的一个重要里程碑。该报告旨在对Qwen3-Omni进行全面深入的技术剖析,通过先进的深度学习技术,输入的视频、音频、文本直接进入核心模型,中...
    发现资讯
    6个月前
    05340
    NEO – 商汤联合南洋理工开源的全新多模态模型架构,训练仅需1/10数据量,达到顶尖的视觉感知能力

    NEO – 商汤联合南洋理工开源的全新多模态模型架构,训练仅需1/10数据量,达到顶尖的视觉感知能力

    商汤科技联合南洋理工大学S-Lab发布并开源全新多模态模型架构NEO。该架构号称是行业首个实现深层次融合的原生视觉语言模型,通过原生图块嵌入、三维旋转位置编码和多头注意力机制创新,实现视觉与语言在底层...
    发现资讯
    3个月前
    05270
    PixVerse V5.5 – 爱诗科技推出的视频生成大模型,支持音频和视频同步生成

    PixVerse V5.5 – 爱诗科技推出的视频生成大模型,支持音频和视频同步生成

    PixVerse V5.5是爱诗科技推出的最新一代AI视频生成大模型,模型基于自研的多模态视觉语言(MVL)架构,采用Diffusion与Transformer混合设计,支持音画同步生成,简化从构思到...
    发现资讯
    3个月前
    05240
    加载更多
    Copyright © 2026 up导航 浙ICP备2024076937号 
    网址
    网址文章软件书籍