up导航
  • blog
  • 网站提交
  • 2fa工具
  • 全球地址生成
  • ui工具
      • 未登录
        登录后即可体验更多功能
    • ai工具
    • blog
    • 网站提交
    未登录
    登录后即可体验更多功能

    资讯

    共 2669 篇文章
    发现科技资讯
    排序
    发布更新浏览点赞
    FS-DFM – 苹果联合俄亥俄州立大学推出的扩散语言模型,速度提升128倍

    FS-DFM – 苹果联合俄亥俄州立大学推出的扩散语言模型,速度提升128倍

    苹果提出 FS-DFM 扩散模型,仅需 8 轮快速迭代,即可生成与传统模型上千轮迭代质量相媲美的文本,且写入速度比同类模型最多可提高 128 倍。FS-DFM 在扩散模型的基础上进行了进一步简化,目标...
    发现资讯
    2个月前
    03180
    微软推出的首款自研图像生成式AI模型–MAI-Image-1 ,能处理复杂的图像生成任务

    微软推出的首款自研图像生成式AI模型–MAI-Image-1 ,能处理复杂的图像生成任务

    微软正式发布了其首款自主研发的图像生成 AI 模型 ——MAI-Image-1。这一创新模型不仅在生成逼真图像方面表现优异,还能模拟自然光照效果,为用户带来更为生动的视觉体验。该模型在保证生成质量的同...
    发现资讯
    3个月前
    02680
    腾讯AI Lab推出的全长度歌曲生成模型–SongBloom ,仅需 10 秒音频样本和对应歌词

    腾讯AI Lab推出的全长度歌曲生成模型–SongBloom ,仅需 10 秒音频样本和对应歌词

    SongBloom 是一个由腾讯 AI Lab 联合顶尖高校研发的开源歌曲生成模型。它采用自回归扩散模型,将扩散模型的高保真度与语言模型的可扩展性相结合,能够快速生成完整歌曲,支持双通道、48kHz ...
    发现资讯
    3个月前
    03240
    Get Jobs – 开源的AI简历投递工具,自动化多平台投递简历

    Get Jobs – 开源的AI简历投递工具,自动化多平台投递简历

    Get Jobs 是一款一键自动化投递Boss/猎聘等岗位的神器,支持AI生成JD匹配招呼语+秒发简历,智能过滤无效职位。就是用自动化脚本 + AI 匹配帮你把简历一键海投到 Boss 直聘、前程无忧...
    发现资讯
    3个月前
    04590
    SAIL-VL2 – 字节抖音联合国立大学开源的视觉语言模型,突破传统密集型模型的限制

    SAIL-VL2 – 字节抖音联合国立大学开源的视觉语言模型,突破传统密集型模型的限制

    抖音SAIL团队与LV-NUS Lab联合推出的多模态大模型SAIL-VL2。它能高效地将视觉输入对齐到语言模型的表示空间。整个系统由三个核心部分组成:视觉编码器SAIL-ViT、视觉-语言适配器和大...
    发现资讯
    3个月前
    02680
    Hitem3D – AI 3D模型生成工具,一键生成高精度三维模型

    Hitem3D – AI 3D模型生成工具,一键生成高精度三维模型

    Hitem3D AI是一款由人工智能驱动的下一代3D模型生成平台,支持用户上传图片后,一键生成高精度三维模型。这一技术突破让复杂模型从原需数日建模压缩到3分钟,并且可输出多种生产所需格式。 Hitem...
    发现资讯
    3个月前
    01.1K0
    LLaVA-OneVision-1.5 – EvolvingLMMS-Lab开源的多模态框架,实现跨模态的信息检索

    LLaVA-OneVision-1.5 – EvolvingLMMS-Lab开源的多模态框架,实现跨模态的信息检索

    LLaVA-OneVision-1.5 是由 EvolvingLMMS-Lab 开发的全开源多模态框架,旨在通过高效训练和高质量数据实现多模态任务的高性能和低成本。该模型支持基于文本查询图像或基于图像...
    发现资讯
    3个月前
    02920
    MineContext – 字节开源的主动式上下文感知 AI 工具,支持多模态信息处理

    MineContext – 字节开源的主动式上下文感知 AI 工具,支持多模态信息处理

    ‌MineContext是字节跳动开源的主动式上下文感知AI工具‌,通过屏幕截图和内容理解帮助用户管理数字工作环境,支持自动生成摘要、待办清单等功能,所有数据本地处理以保障隐私安全。它会根据用户的上下...
    发现资讯
    3个月前
    07780
    Qwen3-VL Cookbooks – 阿里推出的多模态任务开发指南,支持多种应用场景

    Qwen3-VL Cookbooks – 阿里推出的多模态任务开发指南,支持多种应用场景

    Qwen3-VL Cookbook是一份为开发者准备的多模态实践指南,涵盖从文档解析到视频理解的各类应用场景。核心能力包括万物识别、文档解析、OCR+关键信息提取、视频理解、智能体控制和空间理解3D定...
    发现资讯
    3个月前
    02810
    UserLM-8b – 微软开源的用户对话模拟模型,支持生成多种用户话语

    UserLM-8b – 微软开源的用户对话模拟模型,支持生成多种用户话语

    userlm-8b 是由微软发布的一款专注于模拟对话中“用户”行为的语言模型,与传统扮演“助手”角色的模型不同。该模型基于大量真实对话数据进行训练,能够生成贴近真实用户表达方式的对话内容。具备生成用户...
    发现资讯
    3个月前
    04250
    加载更多
    Copyright © 2026 up导航 浙ICP备2024076937号 
    网址
    网址文章软件书籍