up导航
  • blog
  • 网站提交
    • ai工具
    • blog
    • 网站提交

    资讯

    共 2525 篇文章
    发现科技资讯
    排序
    发布更新浏览点赞
    通义DeepResearch – 阿里推出的开源深度研究智能体,推动智能体的发展和创新。

    通义DeepResearch – 阿里推出的开源深度研究智能体,推动智能体的发展和创新。

    阿里正式开源其首个深度研究型智能体模型——通义DeepResearch,迅速在开源社区中位居前列。旨在解决复杂研究任务中的信息检索与推理问题。该模型通过多源交叉验证、结构化报告生成等能力,可辅助科研...
    发现资讯
    2周前
    0880
    VLAC – 上海AI实验室开源的具身奖励大模型,支持人机协作模式

    VLAC – 上海AI实验室开源的具身奖励大模型,支持人机协作模式

    VLAC是上海人工智能实验室开源的具身奖励大模型,旨在解决机器人真实世界强化学习中的效率与泛化难题。VLAC模型通过数据驱动的奖励机制和多模态认知架构,初步解决了机器人真实世界学习的效率与泛化难题。其...
    发现资讯
    2周前
    01490
    Meta Ray-Ban Display – Meta推出的首款带显示屏的AI眼镜,为用户提供便捷的智能交互体验

    Meta Ray-Ban Display – Meta推出的首款带显示屏的AI眼镜,为用户提供便捷的智能交互体验

    Meta Ray-Ban Display是Meta首款搭载高解析度显示屏的消费级设备,其主要设计特点是在右镜片内嵌半透明抬头显示屏(HUD),亮度达5000尼特,可在户外强光环境下清晰显示信息,且从外...
    发现资讯
    2周前
    0970
    WebWeaver – 阿里通义开源的双Agent框架,提高研究效率和质量

    WebWeaver – 阿里通义开源的双Agent框架,提高研究效率和质量

    WebWalker是阿里巴巴通义实验室提出的一个用于提升大型语言模型(LLM)网页信息检索能力的框架,它是一个基于阿里通义大模型(通义千问)的开源框架,旨在通过对话式AI助手(Agent)来提升用户与...
    发现资讯
    2周前
    01340
    Mini-o3 – 字节联合港大推出的视觉推理模型,支持多轮交互推理

    Mini-o3 – 字节联合港大推出的视觉推理模型,支持多轮交互推理

    自字节跳动和香港大学的研究团队推出了 Mini-o3,一个旨在复现OpenAI强大但未公开的o3模型能力的开源系统。Mini-o3的核心目标是扩展模型与工具的交互能力,使其能够执行长达数十步的深度推理...
    发现资讯
    2周前
    01330
    混元3D 3.0 – 腾讯混元最新推出的3D生成模型,建模精度提升3倍

    混元3D 3.0 – 腾讯混元最新推出的3D生成模型,建模精度提升3倍

    在2025腾讯全球数字生态大会上,腾讯混元3D 3.0模型正式发布,混元3D 3.0模型现已集成于混元3D AI创作引擎,面向用户免费开放,并同步上线腾讯云API。混元3D 3.0模型建模精度比上一版...
    发现资讯
    3周前
    01560
    IndexTTS2 – B站开源的最新文本转语音模型,可精准模仿该音频的声线

    IndexTTS2 – B站开源的最新文本转语音模型,可精准模仿该音频的声线

    哔哩哔哩(B 站)Index 团队宣布全面开源其自主研发的文本转语音(TTS)系统 ——IndexTTS-2.0,它支持两种生成模式:一种明确指定生成的标记数量以精确控制语音持续时间;另一种以自回归的...
    发现资讯
    2周前
    01190
    Strix – 开源AI安全测试工具,全面漏洞检测,支持多种测试场景

    Strix – 开源AI安全测试工具,全面漏洞检测,支持多种测试场景

    Strix是一款由开源社区开发的AI安全测试工具,主要用于模拟黑客攻击场景,自动发现并验证软件漏洞,Strix依靠大语言模型(LLM)驱动的多智能体架构,不止能动态执行代码、操控HTTP请求,还能直接...
    发现资讯
    4周前
    01570
    Stand-In – 腾讯微信推出的视频生成框架,支持生成具有高保真度的文本内容

    Stand-In – 腾讯微信推出的视频生成框架,支持生成具有高保真度的文本内容

    腾讯发布了一个全新的开源项目——Stand-In,它是一个轻量级、即插即用的身份保留视频生成框架,不仅支持生成具有高保真度的文本到视频(Text-to-Video,T2V)内容,还能进行换脸、姿态控制...
    发现资讯
    4周前
    01800
    HuMo – 清华联合字节推出的多模态视频生成框架,实现最高级别定制和控制。

    HuMo – 清华联合字节推出的多模态视频生成框架,实现最高级别定制和控制。

    字节开源的Humo模型支持文生视频、图生视频及音频生成视频,可结合文本、图像与音频多模态输入,并支持多图参考合成。HuMo 框架具备强大的多模态输入处理能力,可以同时利用文本、图像和音频三种信息,协同...
    发现资讯
    4周前
    01410
    加载更多
    Copyright © 2025 up导航 浙ICP备2024076937号 
    网址
    网址文章软件书籍