up导航
  • blog
  • 网站提交
    • ai工具
    • blog
    • 网站提交

    发现

    共 259 篇文章
    发现科技资讯
    排序
    发布更新浏览点赞
    SceneGen – 上海交大推出的3D场景生成框架,单图到3D场景一步生成

    SceneGen – 上海交大推出的3D场景生成框架,单图到3D场景一步生成

    上海交通大学的研究团队推出了一种名为 SceneGen 的新颖框架,在这一领域取得了突破性进展。它以一张场景图像和图中物体的分割掩码作为输入,能够在一次前向传播中,同时生成场景内多个3D资产的几何、纹...
    发现资讯
    6小时前
    000
    Agent Kit – OpenAI推出的AI Agent开发工具,无需编写代码即可设计复杂工作流

    Agent Kit – OpenAI推出的AI Agent开发工具,无需编写代码即可设计复杂工作流

    Agent Kit 是 OpenAI 推出的一个基于 Agent 的工作流编排工具,旨在帮助你将智能体从原型阶段推进至生产阶段。它涵盖了你构建、部署和优化智能体工作流所需的全部功能,能大幅减少流程中的...
    发现资讯
    12小时前
    0140
    Ming-UniAudio – 蚂蚁集团开源的音频多模态模型,支持语音理解和生成任务

    Ming-UniAudio – 蚂蚁集团开源的音频多模态模型,支持语音理解和生成任务

    随着大语言模型(LLM)的快速发展,语音语言模型在语音理解、生成和编辑等方面取得了显著进展。Ming-UniAudio 是蚂蚁集团开源的一个创新语音处理项目,这是一个基于统一连续分词器的语音大模型,能...
    发现资讯
    12小时前
    060
    Sora 2 – OpenAI 推出的新一代AI音视频生成模型,首次实现了环境音效与画面动态同步生成

    Sora 2 – OpenAI 推出的新一代AI音视频生成模型,首次实现了环境音效与画面动态同步生成

    OpenAI推出的新一代视频生成模型Sora 2,首次实现了音频与画面的智能同步生成。新模型通过多模态融合算法,能够理解视频内容的情绪基调、场景特征和动作节奏,并据此生成匹配的背景音乐、环境音效甚至人...
    发现资讯
    1天前
    060
    聆音EchoCare – 香港中科院推出的超声大模型,有效提升医疗服务效率

    聆音EchoCare – 香港中科院推出的超声大模型,有效提升医疗服务效率

    中国科学院香港创新研究院人工智能与机器人创新中心(CAIR)在香港正式开源发布其最新科研成果——EchoCare“聆音”超声基座大模型(简称“聆音”),通过超过450余万张大规模多器官、多中心、多地区...
    发现资讯
    1天前
    0380
    豆包大模型1.6-vision – 火山引擎推出的视觉深度思考模型,具备工具调用能力

    豆包大模型1.6-vision – 火山引擎推出的视觉深度思考模型,具备工具调用能力

    火山引擎宣布正式推出豆包大模型 1.6-vision,以工具调用的差异化能力,将图像融入其思维链中,实现对图片的定位、剪裁、点选、画线、缩放、旋转等精细处理。在增强推理可解释性的同时,可高效精准地完成...
    发现资讯
    2天前
    0230
    Ring-1T – 蚂蚁百灵开源的万亿参数思考大模型,展现出强大的数学推理能力。

    Ring-1T – 蚂蚁百灵开源的万亿参数思考大模型,展现出强大的数学推理能力。

    蚂蚁集团重磅推出万亿参数思考模型Ring-1T,并全面开源模型权重、训练配方。Ring-1T不仅在数学竞赛上刷新开源SOTA,还在逻辑推理和医疗问答中脱颖而出。 并结合人类反馈强化学习(RLHF)提升...
    发现资讯
    3天前
    0410
    Anthropic最新推出的AI编程模型–Claude Sonnet 4.5 ,能专注工作超 30 小时

    Anthropic最新推出的AI编程模型–Claude Sonnet 4.5 ,能专注工作超 30 小时

    Anthropic 公司推出了一款名为 Claude Sonnet 4.5 的新一代前沿模型,该模型在编码、计算机操作及满足实际业务需求方面能力更强,同时在网络安全、金融、科研等专业领域表现突出。 C...
    发现资讯
    5天前
    0520
    Lynx : 字节跳动推出的高保真个性化视频生成模型,仅需一张人物照片

    Lynx : 字节跳动推出的高保真个性化视频生成模型,仅需一张人物照片

    Lynx是字节跳动推出的高保真个性化视频生成模型,仅需输入一张人像照片,即可生成身份高度一致的动态视频。该模型通过单张人物图像即可生成身份一致、动作自然、场景多样的动态视频,在身份保真度、动作连贯性...
    发现资讯
    5天前
    0790
    JoySafety – 京东开源的大模型安全框架,支持通过 API 动态调整安全策略

    JoySafety – 京东开源的大模型安全框架,支持通过 API 动态调整安全策略

    京东正式推出了其开源的大模型安全框架 ——JoySafety。框架支持每日超过亿次的调用,拥有高达95% 以上的攻击拦截率,确保用户在享受高效服务的同时,数据安全和用户隐私也得到了有力保障。 JoyS...
    发现资讯
    6天前
    0830
    加载更多
    Copyright © 2025 up导航 浙ICP备2024076937号 
    网址
    网址文章软件书籍