up导航
  • blog
  • 网站提交
  • 2fa工具
  • 全球地址生成
  • ui工具
      • 未登录
        登录后即可体验更多功能
    • ai工具
    • blog
    • 网站提交
    未登录
    登录后即可体验更多功能

    资讯

    共 2669 篇文章
    发现科技资讯
    排序
    发布更新浏览点赞
    LLaVA-OneVision-1.5 – EvolvingLMMS-Lab开源的多模态框架,实现跨模态的信息检索

    LLaVA-OneVision-1.5 – EvolvingLMMS-Lab开源的多模态框架,实现跨模态的信息检索

    LLaVA-OneVision-1.5 是由 EvolvingLMMS-Lab 开发的全开源多模态框架,旨在通过高效训练和高质量数据实现多模态任务的高性能和低成本。该模型支持基于文本查询图像或基于图像...
    发现资讯
    3个月前
    02920
    MineContext – 字节开源的主动式上下文感知 AI 工具,支持多模态信息处理

    MineContext – 字节开源的主动式上下文感知 AI 工具,支持多模态信息处理

    ‌MineContext是字节跳动开源的主动式上下文感知AI工具‌,通过屏幕截图和内容理解帮助用户管理数字工作环境,支持自动生成摘要、待办清单等功能,所有数据本地处理以保障隐私安全。它会根据用户的上下...
    发现资讯
    3个月前
    07780
    Qwen3-VL Cookbooks – 阿里推出的多模态任务开发指南,支持多种应用场景

    Qwen3-VL Cookbooks – 阿里推出的多模态任务开发指南,支持多种应用场景

    Qwen3-VL Cookbook是一份为开发者准备的多模态实践指南,涵盖从文档解析到视频理解的各类应用场景。核心能力包括万物识别、文档解析、OCR+关键信息提取、视频理解、智能体控制和空间理解3D定...
    发现资讯
    3个月前
    02810
    UserLM-8b – 微软开源的用户对话模拟模型,支持生成多种用户话语

    UserLM-8b – 微软开源的用户对话模拟模型,支持生成多种用户话语

    userlm-8b 是由微软发布的一款专注于模拟对话中“用户”行为的语言模型,与传统扮演“助手”角色的模型不同。该模型基于大量真实对话数据进行训练,能够生成贴近真实用户表达方式的对话内容。具备生成用户...
    发现资讯
    3个月前
    04290
    NeuTTS Air – Neuphonic开源的语音合成模型,提升语音合成的自然度和准确性

    NeuTTS Air – Neuphonic开源的语音合成模型,提升语音合成的自然度和准确性

    NeuTTS Air是由Neuphonic开发的一款超拟真、可离线运行的文本到语音(TTS)模型,支持多种操作系统和设备平台,包括移动设备、个人电脑、树莓派等,易于集成到各种应用中。NeuTTS Ai...
    发现资讯
    3个月前
    04500
    Paper2Video – 国立大学推出的学术论文生成演示视频项目,自动生成演示视频

    Paper2Video – 国立大学推出的学术论文生成演示视频项目,自动生成演示视频

    Paper2Poster是一款开源的多模态智能系统,支持本地部署以及 API 接入,并将生成可编辑的 .pptx 海报文件,在产出成果的基础上引入 PaperQuiz 来对传达效果进行量评。给它一篇论...
    发现资讯
    3个月前
    04350
    Gemini Enterprise – 谷歌推出的企业级AI Agent平台,支持创建定制智能体

    Gemini Enterprise – 谷歌推出的企业级AI Agent平台,支持创建定制智能体

    谷歌云正式推出 Gemini Enterprise 平台,让团队能在安全的环境中探索、建立、分享与执行 AI 智慧代理。使用 Gemini Enterprise,用户将可以访问功能强大的自动化智能代理...
    发现资讯
    3个月前
    06510
    Androidify – 谷歌开源的如何构建AI Android应用项目,创建个性化安卓机器人

    Androidify – 谷歌开源的如何构建AI Android应用项目,创建个性化安卓机器人

    Androidify是谷歌推出的一项开源计划,旨在帮助开发者深入了解如何在 android 平台上打造由人工智能驱动的应用程序。用户可以通过上传个人照片或输入文字描述,生成专属的安卓机器人形象,并自由...
    发现资讯
    3个月前
    03820
    xLLM – 京东开源的智能推理框架,实现5倍效率提升和90%成本优化

    xLLM – 京东开源的智能推理框架,实现5倍效率提升和90%成本优化

    京东正式开源其自研大模型推理引擎xLLM。据悉,该引擎基于国产芯片深度优化,是一款专注于大模型高效推理的基础软件。xLLM在内部多场景应用中实现的5倍效率提升和90%成本优化,已经强有力地证明了其技术...
    发现资讯
    3个月前
    04090
    Mano – 明略科技推出的GUI智能操作模型,为自动化操作提供高效解决方案

    Mano – 明略科技推出的GUI智能操作模型,为自动化操作提供高效解决方案

    mano 是由明略科技研发的专用大模型,专注于图形用户界面(gui)的智能化操作。该模型建立在多模态基础架构之上,融合了在线强化学习与自动化训练数据采集等前沿技术。Mano的创新,不单单是解决了目前的...
    发现资讯
    3个月前
    03660
    加载更多
    Copyright © 2026 up导航 浙ICP备2024076937号 
    网址
    网址文章软件书籍