up导航
  • blog
  • 网站提交
    • ai工具
    • blog
    • 网站提交

    资讯

    共 2565 篇文章
    发现科技资讯
    排序
    发布更新浏览点赞
    PokeTomo – 夏普推出的口袋智能伙伴机器人,支持与用户进行自然对话

    PokeTomo – 夏普推出的口袋智能伙伴机器人,支持与用户进行自然对话

    夏普公司近日发布了一款名为“Poketomo”的口袋智能伙伴,旨在为用户带来日常陪伴与情感互动。该产品基于夏普自研AI技术CE-LLM驱动,支持语音对话,并能根据用户情绪做出反应,成为生活中的贴心伙伴...
    发现资讯
    3个月前
    02730
    Step-Audio 2 mini - 阶跃星辰开源的端到端语音模型,能精准理解各种音频内容

    Step-Audio 2 mini - 阶跃星辰开源的端到端语音模型,能精准理解各种音频内容

    Step-Audio 2 mini是什么 Step-Audio 2 mini是阶跃星辰推出的开源端到端语音模型。突破传统语音模型结构,采用真端到端多模态架构,直接将原始音频输入转化为语音响应输出,时延...
    发现资讯
    2个月前
    02720
    AIRI – 开源的AI多模态数字桌面伴侣,用户可以通过文字或语音与数字伴侣进行交流

    AIRI – 开源的AI多模态数字桌面伴侣,用户可以通过文字或语音与数字伴侣进行交流

    AIRI​​——一个能自己部署的虚拟伴侣系统。它不只是聊天机器人,还能陪你打游戏、实时语音互动,甚至作为桌宠常驻桌面。最吸引我的是它的开源属性和可定制性,所有数据都在本地运行,隐私无忧。它基于现代W...
    发现资讯
    2个月前
    02720
    DeepFig:AI驱动的智能社交媒体多平台发布与创作工具

    DeepFig:AI驱动的智能社交媒体多平台发布与创作工具

    DeepFig是什么? DeepFig是一款专为社交媒体运营者设计的AI智能内容创作与分发工具。它核心解决了多平台运营中“内容同质化”与“适配低效化”的痛点,通过先进的AI大模型技术,实现“一次创作...
    发现资讯
    3个月前
    02710
    Jetson Thor – 英伟达推出的机器人AI计算平台,兼容多种生成式AI框架,能构建丰富生态系统。

    Jetson Thor – 英伟达推出的机器人AI计算平台,兼容多种生成式AI框架,能构建丰富生态系统。

    英伟达正式发布机器人专用计算平台Jetson Thor,其AI算力达到前代产品的7.5倍(即提升6.5倍),能效提高3.5倍。 开发者套件售价3499美元,量产模组批量采购价低至2999美元。Jets...
    发现资讯
    2个月前
    02680
    FastVLM - 苹果开源的视觉语言模型,能够准确理解和生成与图像内容

    FastVLM - 苹果开源的视觉语言模型,能够准确理解和生成与图像内容

    FastVLM是一款专为高分辨率图像处理优化的视觉语言模型,基于苹果自研的MLX框架开发,专为Apple Silicon设备量身定制。FastVLM支持完全本地化处理,无需依赖云端上传数据,完美契合苹...
    发现资讯
    3个月前
    02660
    Voost – 创新的双向虚拟试穿和试脱AI模型,增强服装与身体的关系推理能力。

    Voost – 创新的双向虚拟试穿和试脱AI模型,增强服装与身体的关系推理能力。

    NXN Labs的研究团队开发了一个叫做Voost的人工智能系统,旨在提升虚拟试衣和试脱技术的表现。就像是一个超级聪明的"换衣魔法师"。这个系统最神奇的地方在于,它不仅能让你"试穿"任何衣服,还能从穿...
    发现资讯
    3个月前
    02660
    Agent Development Kit(ADK):谷歌推出的AI Agent开发与部署框架

    Agent Development Kit(ADK):谷歌推出的AI Agent开发与部署框架

    Agent Development Kit(ADK)是谷歌于2025年推出的开源AI Agent开发与部署框架,旨在简化多智能体系统的构建、管理和部署流程。Google AI Hub是一个在线平台,提...
    发现资讯
    3个月前
    02650
    Open-Fiesta – 开源的AI聊天平台,支持键盘提交和流式 API

    Open-Fiesta – 开源的AI聊天平台,支持键盘提交和流式 API

    Open-Fiesta 是一个开源的多模型AI聊天平台,它支持多种AI提供商和模型,如Gemini、DeepSeek R1等,让你可以轻松切换和比较不同模型的输出。此外,它还提供了网络搜索和图片附件功...
    发现资讯
    2个月前
    02640
    Wav2Lip – 开源的高保真唇形同步工具,自动生成与语音同步的口型动画

    Wav2Lip – 开源的高保真唇形同步工具,自动生成与语音同步的口型动画

    Wav2Lip 是一个 口型同步技术开源项目,可以在任意语音对任意说话的脸部视频进行口型同步。旨在提升视频中唇部同步的保真度。此项目通过 Wav2Lip 实现精确的唇动匹配,再利用 Real-ESRG...
    发现资讯
    2个月前
    02640
    加载更多
    Copyright © 2025 up导航 浙ICP备2024076937号 
    网址
    网址文章软件书籍