AI工具
发布文章-
发布了文章 2个月前
Phi-baidu094-baidu09reasoning – 微软推出的Phi-baidu094推理模型系列
Phi-4-reasoning 是微软推出的 140 亿参数的推理模型,专为复杂推理任务设计。通过监督微调(SFT)训练而成,使用了 OpenAI 的 o3-mini 模型生成的高质量推理演示数据。模型能生成详细的推理链,在...
-
发布了文章 2个月前
Phi-baidu094-baidu09Multimodal – 微软最新推出的多模态语言模型
Phi-4-Multimodal 是微软最新推出的多模态语言模型,拥有 56 亿参数,能将语音、视觉和文本处理集成到一个统一架构中。模型在多个基准测试中表现优异,在自动语音识别(ASR)和语音翻译(ST)任务中,以 6.14...
-
发布了文章 2个月前
Phi-baidu094-baidu09Mini – 微软推出专注于文本任务的小型语言模型
Phi-4-Mini 是微软 Phi-4 系列中最新推出的专注于文本任务的小型语言模型,参数量为 38 亿。基于密集的解码器-only Transformer 架构,结合分组查询注意力(Grouped-Query Atten...
-
发布了文章 2个月前
Phi-baidu094 – 微软开源的14B参数小语言模型,擅长数学等领域的复杂推理
Phi-4是微软推出的14亿参数小型语言模型,在数学等领域的复杂推理以及传统语言处理方面表现出色。Phi-4用数据质量为核心训练重点,大量融入合成数据,提升模型在STEM问答和数学竞赛问题上的表现。Phi-4引入新的训练范式...
-
发布了文章 2个月前
Phi-baidu093.5 – 微软推出的新一代AI模型,mini、MoE混合和视觉模型
Phi-3.5是微软推出的新一代AI模型系列,包含 Phi-3.5-mini-instruct、Phi-3.5-MoE-instruct 和 Phi-3.5-vision-instruct 三个版本,分别针对轻量级推理、混合...
-
发布了文章 2个月前
Phi-baidu093 – 微软最新推出的新一代小模型系列
Phi-3是微软研究院推出的新一代系列先进的小语言模型,包括phi-3-mini、phi-3-small和phi-3-medium三个不同规模的版本。这些模型在保持较小的参数规模的同时,通过精心设计的训练数据集和优化的算法,...
-
发布了文章 2个月前
Phantom – 字节跳动推出的主体一致视频生成框架
Phantom是字节跳动智能创作团队推出的用在主体一致视频生成(Subject-to-Video, S2V)的框架。基于跨模态对齐技术,结合文本和图像提示,从参考图像中提取主体元素并生成与文本描述一致的视频内容。...
-
发布了文章 2个月前
PeterCat – AI问答机器人,自动抓取 GitHub 上的文档和 issue 作为知识库
PeterCat是开源的智能答疑机器人助手。PeterCat能帮助开发者和社区维护者更高效地解决技术问题,提升社区支持效率。PeterCat基于自动构建知识库,能与GitHub的issue、PR和Discussion进行互动...
-
发布了文章 2个月前
PersonaTalk – 字节跳动推出的实现高保真和个性化视觉配音框架
PersonaTalk是字节跳动推出的基于注意力机制的两阶段框架,用在实现高保真度和个性化的视觉配音。PersonaTalk能在合成与目标音频精准唇形同步的视频的同时,保留说话者的独特说话风格和面部细节。...
-
发布了文章 2个月前
PersonaMagic – 高保真人脸定制技术,根据肖像无缝生成新角色
PersonaMagic 是创新的高保真人脸定制技术,通过阶段调节的文本条件策略实现个性化图像生成。基于简单多层感知机(MLP)网络学习一系列动态嵌入,在特定时间步间隔内准确捕获人脸概念。...
-
发布了文章 2个月前
PersonaCraft – 首尔国立大学推出的单参考图像生成多身份全身图像技术
PersonaCraft是韩国首尔国立大学推出的个性化全身图像合成技术,结合扩散模型和3D人类建模,能从单一参考图像生成多个人物的逼真、个性化全身图像。PersonaCraft能有效处理人物间的遮挡问题,支持用户自定义身体形...
-
发布了文章 2个月前
Perplexideez – 开源本地AI搜索助手,智能搜索信息来源追溯
Perplexideez是本地AI助手,支持用户在网络和自托管应用中快速搜索信息。Perplexideez项目以Postgres数据库为基础,支持Ollama或OpenAI兼容的端点,用SearXNG实例进行网络搜索。Per...
-
发布了文章 2个月前
Perplexica – 开源AI搜索引擎,支持多种搜索模式、实时信息更新
Perplexica是开源的AI驱动搜索引擎,是Perplexity AI的开源替代品。基于机器学习算法和自然语言处理技术理解用户查询,提供精确答案。Perplexica支持多种搜索模式,包括全网搜索、写作助手、学术搜索、Y...
-
发布了文章 2个月前
Perception-baidu09as-baidu09Control – 阿里通义实验室推出的图像动画框架
Perception-as-Control是阿里巴巴通义实验室推出的图像动画框架,能根据用户意图实现细粒度的运动控制。Perception-as-Control基于构建3D感知运动表示,将相机和物体运动转化为直观、一致的视觉...
-
发布了文章 2个月前
Pemo – AI文档管理工具,支持一键翻译智能总结文献摘要
Pemo是AI驱动的文档管理工具。工具支持PDF、Epub、Word等多种格式文档的导入与管理,具备一键翻译、智能总结、思维导图生成等功能,帮助用户快速理解复杂文献,提升阅读效率。Pemo提供沉浸式阅读体验,用户自定义阅读模...






























