GptEngineer 是一个基于 AI 技术通过简单的文本提示快速生成网页应用原型的开源工具。用户只需描述需求,AI 能自动编写并执行代码,支持与 GitHub 同步和一键...
GptEngineer 是一个基于 AI 技术通过简单的文本提示快速生成网页应用原型的开源工具。用户只需描述需求,AI 能自动编写并执行代码,支持与 GitHub 同步和一键...
Imagine Yourself 是Meta公司推出的个性化AI图像生成模型,突破了传统方法的局限,无需对每个用户进行单独调整,通过单一模式即可满足不同用户需求。模型采用...
STranslate是专为Windows用户设计的多功能翻译和OCR工具。支持多种语言翻译,具备划词、截图、监听剪贴板等多种翻译方式,并提供多家翻译服务接口。还拥有基...
Bark是Suno AI 推出的开源文本到音频模型,能生成逼真的多语言语音和多种音频类型,包括音乐、背景噪音等,同时支持非语言交流如笑声和哭泣。Bark提供预训练...
LTM-2-mini是Magic公司推出的支持1亿token上下文AI模型,能处理相当于1000万行代码或750本小说的内容。LTM-2-mini采用序列维度算法,计算效率比Llama 3.1 405...
eSearch是一款开源的跨平台AI桌面应用,集成了截屏、OCR识别、搜索翻译、贴图、以图搜图和屏幕录制等功能。eSearch基于Electron框架开发,适用于Linux、Windo...
VectorVein 是一款开源的无代码AI工作流工具,通过简化的拖拽操作,让用户无需编程知识即可构建智能工作流,实现日常任务的自动化。它支持数据处理、分析和知...
Sapiens是Meta实验室推出的AI视觉模型,专为理解图片和视频中的人类动作设计。支持二维姿势预估、身体部位分割、深度估计和表面法线预测等任务,采用视觉转换...
OpenCity是由香港大学联合华南理工大学和百度共同研发的交通预测模型。OpenCity采用Transformer架构和图神经网络,通过大规模预训练学习交通数据的时空依赖关...
Eagle是英伟达推出的多模态大模型,擅长处理高达1024×1024像素的图像,显著提升视觉问答和文档理解能力。Eagle模型采用多专家视觉编码器架构,通过简单高效的...
PGTFormer是先进的视频人脸修复框架,通过解析引导的时间一致性变换器来恢复视频中的高保真细节,同时增强时间连贯性。该方法无需预对齐,基于语义解析选择最...
HivisionIDPhoto 是一款基于 AI 的轻量级证件照制作工具,它能智能识别和抠图,快速生成符合多种规格的证件照。支持自定义背景色和尺寸,未来还将推出美颜和...
Step-1X 是阶跃星辰推出的AI图像生成大模型,采用自研的 DiT 架构,擅长深度语义理解和细节生成。Step-1X支持长达2000字符的复杂指令,能精准匹配图文,适用...
Melty是一款开源AI编程助手,专为提升开发者的编码效率和代码质量而设计。Melty通过实时理解开发者的编程活动,从终端操作到 GitHub 交互,提供智能协作和代...
Yi-Coder是零一万物推出的开源编程助手系列模型,专为提升代码生成、理解、调试和补全等任务的效率而设计。Yi-Coder系列模型包含1.5B和9B两种参数规模的版本...
VideoGameBunny(VGB)是一个专为视频游戏设计的开源大型多模态模型,由加拿大阿尔伯塔大学研究团队开发。它能理解和生成多种语言的游戏相关内容,支持高度定...
LanceDB 是一款专为人工智能应用设计的无服务器向量数据库,支持向量搜索、全文搜索和SQL查询,优化了多模态数据处理。它采用向量索引技术,实现高效相似度搜...
NNanoFlow 是一个高性能的服务框架,专为大型语言模型(LLMs)设计,以提高模型的推理吞吐量。它通过在单个设备内部并行使用计算、内存和网络资源,优化了模...
ChatLearn 是由阿里云推出的一个灵活、易用、高效的大规模Alignmant 训练框架。ChatLearn是为了支持大型语言模型(LLMs)的 Alignment 训练而设计的。ChatLea...
Docmatix 是一个用于文档视觉问答(Document Visual Question Answering,简称 DocVQA)任务设计的大规模数据集。它包含了240万张图像和950万个问题答案对,...
Kotaemon 是一款基于 RAG 技术的开源工具,支持用户通过自然语言与文档进行互动,快速检索和理解信息。适合需要处理大量文档的场合,如学术研究、企业文档管...
Stable Diffusion整合包是B站UP主秋葉aaaki发布的SD绘画本地部署解决方案,包含了Stable Diffusion WebUI、必要的运行环境、预装模型以及一些常用插件的集合...
MiniCPM 3.0是面壁智能推出的一款高性能端侧AI模型,具备4B参数,以较小的模型规模实现了超越GPT-3.5的性能表现。MiniCPM 3.0采用LLMxMapReduce技术,支持无...
Reflection 70B是HyperWrite公司推出的开源AI大模型,以卓越的性能在多个基准测试中超越了GPT-4o和Llama 3.1。Reflection 70B基于Meta的Llama 3.1 70B Instru...