LongCat-Video是美团LongCat团队开源的136亿参数的AI视频生成模型,在文本到视频(Text-to-Video)、图像到视频(Image-to-Video)和视频续写(Video-Continu...
LongCat-Video是美团LongCat团队开源的136亿参数的AI视频生成模型,在文本到视频(Text-to-Video)、图像到视频(Image-to-Video)和视频续写(Video-Continu...
ChatGPT for any role是OpenAI官方推出的 ChatGPT 提示词模板,能帮助用户更高效地使用 ChatGPT 完成各种工作任务。模板覆盖从邮件撰写、会议协作到决策分析...
ValueCell 是开源的金融多智能体平台,通过 AI 技术加速金融投资研究与决策。将投研流程中的各种能力模块拆分为独立的智能体(Agent),如市场研究、数据抓取...
豆包视频生成模型1.0 pro fast(Doubao-Seedance-1.0-pro-fast)是火山引擎推出的高效AI视频生成模型。模型在继承上一代核心优势的基础上,实现生成速度最高...
Hailuo 2.3 是MiniMax推出的先进 AI 视频生成模型,基于 Hailuo 02 升级而来。模型在肢体动作、微表情、风格化表现及物理真实性方面实现显著提升,能生成更加...
Glyph 是智谱联合清华大学 CoAI 实验室开源的创新框架,能通过视觉 - 文本压缩解决大语言模型(LLM)上下文过长的问题。框架将长文本渲染为图像,用视觉语言...
GigaBrain-0 是新型的视觉-语言-行动(VLA)基础模型,由世界模型生成的数据驱动。模型通过大规模生成多样化数据,减少了对真实机器人数据的依赖,显著提升了...
SoulX-Podcast 是 Soul AI Lab 推出的多说话人文本到语音(TTS)模型,专为生成长篇播客对话设计。模型参数为1.7B,支持普通话、英语及多种汉语方言(如四川...
FlowithOS是Flowith推出的全球首个智能体操作系统,使其能像人类一样与数字世界互动。FlowithOS具备浏览器、终端和脚本使用功能,能自动执行复杂任务,如文件...
Speech 2.6 是MiniMax推出的全新语音生成模型,专为新一代语音智能体设计,具备超低延时(低于250毫秒),确保实时对话流畅;支持多种语言的网址、邮箱、电话...
FIBO 是首个开源的、原生支持 JSON 的文本生成图像模型,专为长结构化描述训练而成。模型在超过 1 亿条结构化 JSON 描述(每条约 1,000 字)上训练,能精确、...
Sonic-3是Cartesia最新发布的语音AI引擎,是当前市场上速度最快、最自然的实时语音对话模型。采用创新的“状态空间模型”(SSM)架构,非传统的Transformer模型...
Composer 是Cursor推出的自研编码模型,专为低延迟的智能体式编码设计。模型生成速度极快,每秒可达 250 个 token,是同等智能模型的 4 倍,大多数任务在 30 ...
Firefly Image 5 是 Adobe 发布的最新图像生成模型。具备原生400万像素输出能力,能直接生成高分辨率图像,细节表现力大幅提升。在人物渲染方面,新模型优化...
Kimi Linear 是月之暗面推出的新型混合线性注意力架构,专为提升大型语言模型(LLMs)在长序列任务中的效率和性能设计。核心组件 Kimi Delta Attention(KDA...
Music 2.0 是MiniMax最新推出的先进音乐创作模型。模型能精准捕捉和还原人声的细腻情绪与器乐的动态张力,支持多种唱法和风格切换,如流行、爵士、摇滚等,还...
Aardvark 是 OpenAI 推出的基于 GPT-5 的智能体,能自动发现和修复代码中的安全漏洞。Aardvark通过不间断地分析源代码仓库,识别漏洞、评估可利用性、划分严...
WOWService 是美团 LongCat 团队发布的智能交互系统,通过融合大型语言模型(LLMs)和多智能体架构,优化用户体验并降低成本。系统针对智能交互领域的五大挑...
LTX-2 是 Lightricks 开发的先进 AI 视频生成模型,专为高质量视频创作设计。能以原生 4K 分辨率和 50fps 的帧率生成电影级视频,支持多模态输入,包括文字、...
Game-TARS是字节跳动Seed团队开发的通用型游戏智能体,基于统一的键盘-鼠标动作空间训练,可在操作系统、网页与模拟环境中进行大规模预训练。依托超5000亿标...
SWE-1.5 是AI独角兽 Cognition 推出的专为软件工程设计的高性能 AI 编程模型。拥有数百亿参数,具备接近最先进水平的编码能力,同时在速度上取得重大突破,推...
LongCat-Flash-Omni 是美团 LongCat 团队开源的全模态大语言模型,基于 LongCat-Flash 系列高效架构设计,创新性地集成多模态感知和语音重建模块,拥有 5600 ...
AI Research Foundations是Google DeepMind与伦敦大学学院(UCL)联合推出的免费在线课程。课程能帮助学习者深入理解Transformer模型,通过实践掌握现代语言...
Open AgentKit(OAK)是零一万物开源的AI Agent开发平台,能为开发者提供开放、通用的Agent开发解决方案。平台受OpenAI AgentKit启发,支持多种模型和生态系...