NotesGPT - 开源的AI语音笔记工具,实时转录文本自动生成行动项
NotesGPT是一款开源的AI驱动语音笔记工具,能将用户的语音笔记快速转录成文本,自动生成行动项。工具基于包括Convex数据库、Next.js框架、Together推理模型、...
NotesGPT是一款开源的AI驱动语音笔记工具,能将用户的语音笔记快速转录成文本,自动生成行动项。工具基于包括Convex数据库、Next.js框架、Together推理模型、...
MEXMA是由Meta AI推出的一种新型的预训练跨语言句子编码器。基于结合句子级和词语级的目标提升句子表示的质量。在训练过程中,MEXMA用一种语言的句子表示预测...
Lingua 是 Meta AI推出的一个轻量级且独立的代码库,旨在助力大规模训练语言模型。基于易于修改的 PyTorch 组件,便于研究人员尝试新的模型架构、损失函数和...
VideoAgent是一种自改进的视频生成系统,由斯坦福大学、滑铁卢大学、DeepMind等机构的研究人员共同推出。根据图像观察和语言指令生成视频计划,转换为机器人...
Llama Tutor 是一个基于AI的个性化学习平台,由 Llama 3.1 和 Together AI 技术驱动,是一个完全开源的项目。支持用户输入想要学习的主题和教育水平,生成一...
ComfyGen是由NVIDIA和特拉维夫大学研究人员推出的一种文本到图像生成系统,基于大型语言模型(LLM)自动创建与用户文本提示相匹配的工作流,提升图像生成的质...
restorePhotos.io 是一个开源的AI项目,专注于修复老旧和模糊的人脸照片。用GFPGAN机器学习模型,基于Next.js API路由处理上传的照片,再返回修复后的照片。...
PDFtoChat 是一个开源的创新AI项目,支持用户基于自然语言对话的方式与 PDF 文件互动。工具基于最新的 AI 技术,包括 Together AI 和 Mixtral,理解用户的查...
Self-Taught Evaluators是一种新型的模型评估方法,基于自我训练的方式提高大型语言模型(LLM)的评估能力,无需人工标注数据。从未经标记的指令开始,用迭代...
TurboSeek是一个开源的AI搜索引擎,由Together.ai提供技术支持。基于现代化的技术栈,包括Next.js、Tailwind、Bing搜索API及先进的语言模型Mixtral 8x7B和Lla...
Napkins.dev是一个创新的开源项目,基于AI技术将用户的截图或线框图快速转换成可运行的网页应用程序。该、项目背后依托于Meta的Llama 3.1 405B大型语言模型和...
Matryoshka Diffusion Models(MDM)是由苹果公司研究人员推出的一种新型扩散模型框架,旨在解决生成高分辨率图像和视频时面临的计算和优化挑战。MDM基于在多...
mPLUG-DocOwl 1.5是由阿里巴巴集团推出的多模态大型语言模型,专注于OCR-free(无需光学字符识别)的文档理解。模型基于统一结构学习,强化对文本丰富图像如...
Fluid是由Google DeepMind和MIT共同推出的文本到图像的自回归生成模型,基于连续标记和随机生成顺序的方法,在视觉质量和评估性能上取得突破性进展。模型在扩...
SaRA是一种新型的预训练扩散模型微调方法,由上海交通大学和腾讯优图实验室共同推出。基于重新激活预训练过程中看似无效的参数,让模型能适应新任务。SaRA基...
Quanta Quest是一款面向个人用户的开源AI时代智能数据库产品,基于将个人数据如Gmail、Dropbox、Notion等整合到一个平台上,用RAG技术提供AI搜索功能,帮助用...
BiGR是一种新型的条件图像生成模型,用紧凑的二进制潜在代码进行生成训练,增强图像的生成质量和表示能力。作为首个在同一框架内统一生成和判别任务的模型,B...
MoE++是一种新型的混合专家(Mixture-of-Experts)架构,由昆仑万维2050研究院与北大袁粒团队联合推出。基于引入零计算量专家,即零专家、复制专家和常数专家...
Granite 3.0 是 IBM 推出的一系列先进的AI模型,能在多个学术和企业基准测试中展现出卓越的性能。模型设计用在企业级应用,能执行各种任务,包括文本生成、分...
Project Turntable是Adobe在2024年MAX大会上推出的一款创新AI工具。工具能让用户像操作3D对象一样旋转2D矢量图像,即时生成图像所需的隐藏部分。用AI模型填充...
OmniAI是一个强大的AI文档处理平台,基于先进的OCR技术,支持对PDF、DOCX、图片等多种文件格式进行快速处理和数据提取。平台支持用户轻松创建文档处理管道,...
TaskWeaver是由微软推出的一个代码优先的AI智能体框架,专注于无缝规划和执行数据分析任务。基于代码片段解释用户请求,高效协调各种插件(以函数形式)执行...
Stable Diffusion 3.5是Stability AI公司最新推出的一系列先进的AI图像生成模型,包括Stable Diffusion 3.5 Large、Stable Diffusion 3.5 Large Turbo和即将...
Mochi 1是Genmo公司推出的开源视频生成模型,在动作质量和遵循用户提示方面表现出色。Mochi 1基于Apache 2.0许可证发布,支持个人和商业用途的免费使用。模型...