TalkCody – 开源AI编程助手,涵盖 50 多种主流 AI 模型,支持多模态输入talkcody 是一款开源的 ai 编程助手,旨在提升开发者在软件开发过程中的效率。支持Ollama离线模型和自定义提示,将复杂调试化繁为简。采用 Rust 和 Tauri 构建,具备原生性能和低资...发现资讯3周前01880
Amazon Nova 2 – 亚马逊推出的第二代自研AI模型系列,支持文本、图像、视频和语音多模态任务。亚马逊推出第二代自研大模型Nova2系列,涵盖多模态、推理、语音等四款新品。Nova 2 Lite(成本优化的文本生成模型,支持文本、图像和视频处理);Nova 2 Pro(高级推理模型,适用于复杂任...发现资讯3周前02460
可灵2.6 – 快手可灵推出音画同出的AI视频生成模型,支模型持文生音画和图生音画两种模式可灵推出视频生成2.6模型,该模型提供了里程碑式的“音画同出”能力,彻底改变了传统AI视频生成模型“先无声画面、后人工配音”的工作流程,用户仅需输入一段文字或一张图片,即可自动产出融合自然语音、精准音...发现资讯3周前02160
Seedream 4.5 – 字节跳动推出的AI图像创作模型,精准响应复杂的文字指令字节跳动最新发布的AI图像生成模型Seedream 4.5在火山引擎上线。新模型在主体一致性、指令遵循精准度、空间逻辑理解及美学表现力等方面实现迭代,进一步提升了图像生成的整体质量与稳定性。模型支持广...发现资讯4周前03180
MemMachine – 开源AI记忆系统,实现高效记忆管理MemMachine是解决AI Agent长期记忆问题的开源项目,通过双层记忆系统实现真正的记忆功能,而非简单的RAG检索。MemMachine通过情景记忆、语义记忆和用户画像记忆,帮助AI应用学习...发现资讯4周前02090
Mistral 3 – Mistral AI推出的最新多模态大模型系列,同时处理文本和图像输入Mistral 3 是由 mistral ai 正式发布的全新一代开源人工智能模型系列,支持256k超长上下文窗口,可轻松处理百万字长文档、模型支持多模态(文本和图像)与多语言功能。Mistral 3...发现资讯4周前03970
twitch官网入口,twitc登录教程twitch是一款全球超火的游戏直播、教学、玩法攻略流媒体平台,它是美国最大的一家游戏视频直播网站,内容几乎涵盖了市面上所有游戏种类。对跨境电商卖家而言,Twitch是很好的营销引流平台。无论是游戏还...发现资讯4周前01730
NEO – 商汤联合南洋理工开源的全新多模态模型架构,训练仅需1/10数据量,达到顶尖的视觉感知能力商汤科技联合南洋理工大学S-Lab发布并开源全新多模态模型架构NEO。该架构号称是行业首个实现深层次融合的原生视觉语言模型,通过原生图块嵌入、三维旋转位置编码和多头注意力机制创新,实现视觉与语言在底层...发现资讯4周前01420
Alpamayo-R1 – 英伟达发布首款推理版视觉-语言-动作模型随着芯片成为AI发展的核心,英伟达发布了新的开源软件Alpamayo-R1,旨在利用人工智能(AI)中的一些最新“推理”技术加快自动驾驶汽车的开发。模型的核心创新包括:构建因果链(CoC)数据集,通过...发现资讯4周前01670
PixVerse V5.5 – 爱诗科技推出的视频生成大模型,支持音频和视频同步生成PixVerse V5.5是爱诗科技推出的最新一代AI视频生成大模型,模型基于自研的多模态视觉语言(MVL)架构,采用Diffusion与Transformer混合设计,支持音画同步生成,简化从构思到...发现资讯4周前01580