up导航
  • blog
  • 网站提交
    • ai工具
    • blog
    • 网站提交

    资讯

    共 2529 篇文章
    发现科技资讯
    排序
    发布更新浏览点赞
    Meta Ray-Ban Display – Meta推出的首款带显示屏的AI眼镜,为用户提供便捷的智能交互体验

    Meta Ray-Ban Display – Meta推出的首款带显示屏的AI眼镜,为用户提供便捷的智能交互体验

    Meta Ray-Ban Display是Meta首款搭载高解析度显示屏的消费级设备,其主要设计特点是在右镜片内嵌半透明抬头显示屏(HUD),亮度达5000尼特,可在户外强光环境下清晰显示信息,且从外...
    发现资讯
    2周前
    0970
    WebWeaver – 阿里通义开源的双Agent框架,提高研究效率和质量

    WebWeaver – 阿里通义开源的双Agent框架,提高研究效率和质量

    WebWalker是阿里巴巴通义实验室提出的一个用于提升大型语言模型(LLM)网页信息检索能力的框架,它是一个基于阿里通义大模型(通义千问)的开源框架,旨在通过对话式AI助手(Agent)来提升用户与...
    发现资讯
    2周前
    01340
    Mini-o3 – 字节联合港大推出的视觉推理模型,支持多轮交互推理

    Mini-o3 – 字节联合港大推出的视觉推理模型,支持多轮交互推理

    自字节跳动和香港大学的研究团队推出了 Mini-o3,一个旨在复现OpenAI强大但未公开的o3模型能力的开源系统。Mini-o3的核心目标是扩展模型与工具的交互能力,使其能够执行长达数十步的深度推理...
    发现资讯
    2周前
    01330
    混元3D 3.0 – 腾讯混元最新推出的3D生成模型,建模精度提升3倍

    混元3D 3.0 – 腾讯混元最新推出的3D生成模型,建模精度提升3倍

    在2025腾讯全球数字生态大会上,腾讯混元3D 3.0模型正式发布,混元3D 3.0模型现已集成于混元3D AI创作引擎,面向用户免费开放,并同步上线腾讯云API。混元3D 3.0模型建模精度比上一版...
    发现资讯
    3周前
    01590
    IndexTTS2 – B站开源的最新文本转语音模型,可精准模仿该音频的声线

    IndexTTS2 – B站开源的最新文本转语音模型,可精准模仿该音频的声线

    哔哩哔哩(B 站)Index 团队宣布全面开源其自主研发的文本转语音(TTS)系统 ——IndexTTS-2.0,它支持两种生成模式:一种明确指定生成的标记数量以精确控制语音持续时间;另一种以自回归的...
    发现资讯
    2周前
    01190
    Strix – 开源AI安全测试工具,全面漏洞检测,支持多种测试场景

    Strix – 开源AI安全测试工具,全面漏洞检测,支持多种测试场景

    Strix是一款由开源社区开发的AI安全测试工具,主要用于模拟黑客攻击场景,自动发现并验证软件漏洞,Strix依靠大语言模型(LLM)驱动的多智能体架构,不止能动态执行代码、操控HTTP请求,还能直接...
    发现资讯
    4周前
    01570
    Stand-In – 腾讯微信推出的视频生成框架,支持生成具有高保真度的文本内容

    Stand-In – 腾讯微信推出的视频生成框架,支持生成具有高保真度的文本内容

    腾讯发布了一个全新的开源项目——Stand-In,它是一个轻量级、即插即用的身份保留视频生成框架,不仅支持生成具有高保真度的文本到视频(Text-to-Video,T2V)内容,还能进行换脸、姿态控制...
    发现资讯
    1个月前
    01800
    HuMo – 清华联合字节推出的多模态视频生成框架,实现最高级别定制和控制。

    HuMo – 清华联合字节推出的多模态视频生成框架,实现最高级别定制和控制。

    字节开源的Humo模型支持文生视频、图生视频及音频生成视频,可结合文本、图像与音频多模态输入,并支持多图参考合成。HuMo 框架具备强大的多模态输入处理能力,可以同时利用文本、图像和音频三种信息,协同...
    发现资讯
    1个月前
    01500
    MiniMax Music 1.5 - MiniMax推出的新一代音乐生成模型,支持最长4分钟的音乐生成

    MiniMax Music 1.5 - MiniMax推出的新一代音乐生成模型,支持最长4分钟的音乐生成

    MiniMax最新发布的Music1.5音乐生成模型,如同一位多才多艺的音乐大师,能够在短短几分钟内创造出完整的4分钟歌曲作品。用户只需用日常对话的方式告诉它想要什么样的音乐,比如描述一段欢快的春日时...
    发现资讯
    1个月前
    01750
    混元图像2.1 – 腾讯开源的文生图模型,支持2K分辨率的图像生成

    混元图像2.1 – 腾讯开源的文生图模型,支持2K分辨率的图像生成

    腾讯Hunyuan团队正式开源HunyuanImage2.1,该模型支持原生2048x2048分辨率输出,并显著提升文本生成能力,尤其在双语(中英)支持和复杂语义理解上表现出色。该模型增强了语义一致性...
    发现资讯
    1个月前
    01230
    加载更多
    Copyright © 2025 up导航 浙ICP备2024076937号 
    网址
    网址文章软件书籍