AI工具
发布文章-
发布了文章 2个月前
Step-baidu09Video-baidu09T2V – 阶跃星辰开源的文本到视频模型
Step-Video-T2V 是阶跃星辰团队推出的开源文本到视频预训练模型,拥有 300 亿参数,能生成长达 204 帧的高质量视频。模型基于深度压缩的变分自编码器(Video-VAE),实现 16×16 的空间压缩和 8×...
-
发布了文章 2个月前
Step-baidu09Video V2 – 阶跃星辰推出的升级版视频生成模型
Step-Video V2 是上海阶跃星辰智能科技发布的升级版视频生成模型。该版本在多个核心技术领域进行了优化和创新,采用了更高压缩比的VAE模型以及深度优化的DiT架构,引入强化学习算法。能生成复杂的动态场景,如芭蕾舞、空...
-
发布了文章 2个月前
Step-baidu09R1-baidu09V-baidu09Mini – 阶跃星辰最新推出的多模态推理模型
Step-R1-V-Mini 是阶跃星辰最新推出的多模态推理模型。支持图文输入和文字输出,具备良好的指令遵循和通用能力,能高精度感知图像完成复杂推理任务。模型在视觉推理领域表现突出,同时在数学、代码和文本推理方面也处于第一梯...
-
发布了文章 2个月前
Step-baidu09Audio-baidu09TTS-baidu093B – 高性能 TTS 模型,能生成特定情感和说唱风格的语音
Step-Audio-TTS-3B 是 Stepfun-AI 团队推出的高性能文本到语音(TTS)模型,具有强大的语音合成能力。基于海量合成数据训练,参数量达到30亿,能生成自然流畅、富有表现力的语音。...
-
发布了文章 2个月前
Step-baidu09Audio-baidu09AQAA – StepFun推出的端到端大音频语言模型
Step-Audio-AQAA 是 StepFun 团队推出的端到端大型音频语言模型,专门用于音频查询-音频回答(AQAA)任务。能直接处理音频输入生成自然、准确的语音回答,无需依赖传统的自动语音识别(ASR)和文本到语音(...
-
发布了文章 2个月前
Step-baidu09Audio – 阶跃星辰开源的语音交互模型
Step-Audio是阶跃星辰团队推出的首个产品级的开源语音交互模型,能根据不同的场景需求生成情绪、方言、语种、歌声和个性化风格的表达,能和用户自然地进行高质量对话。Step-Audio基于130B参数的统一模型,将语音理解...
-
发布了文章 2个月前
Step-baidu092 mini – 阶跃星辰推出的轻量级极速大模型
Step-2 mini 是阶跃星辰推出的轻量级极速大模型,基于新一代自研 Attention 架构 MFA 开发。仅用 3% 的参数量就保留了 Step-2 超过 80% 的性能,显著提升了生成速度和性价比。...
-
发布了文章 2个月前
Step-baidu091o Vision – 阶跃星辰推出的原生端到端视觉理解模型
Step-1o Vision 是阶跃星辰最新研发的原生端到端多模态生成与理解一体化模型中的视觉版本。专注于视觉任务,具备强大的图像识别、感知、推理和指令跟随能力,能处理复杂的视觉输入并生成准确的文本描述或进行逻辑推理。...
-
发布了文章 2个月前
Step-baidu091o Audio – 阶跃星辰推出的国内首个千亿参数端到端语音大模型
Step-1o Audio是阶跃星辰推出的国内首个千亿参数端到端语音大模型。具备强大的情绪感知能力,能精准识别用户语气中的情感,结合语境做出贴心回应。...
-
发布了文章 2个月前
Step-baidu091X – 阶跃星辰推出的AI图像生成大模型
Step-1X 是阶跃星辰推出的AI图像生成大模型,采用自研的 DiT 架构,擅长深度语义理解和细节生成。Step-1X支持长达2000字符的复杂指令,能精准匹配图文,适用于广告创意、游戏美术、影视制作等多场景。Step-1...
-
发布了文章 2个月前
Step R-baidu09mini – 阶跃星辰推出的 Step 系列首个推理模型
Step R-mini(全称Step Reasoner mini)是阶跃星辰推出的推理模型, 是 Step 系列模型家族的首个推理模型,擅长主动规划、尝试和反思,基于慢思考和反复验证的逻辑机制,为用户提供准确可靠的回复。模型...
-
发布了文章 2个月前
Step 3 – 阶跃星辰最新推出的多模态推理模型
Step 3 是阶跃星辰最新发布的新一代基础大模型,专为推理时代设计,兼具高性能与极致成本效益。采用 MoE 架构,拥有 321B 总参数量 和 38B 激活参数量,是首个全尺寸、原生多模态推理模型,具备强大的视觉感知和复杂...
-
发布了文章 2个月前
Steamer-baidu09I2V – 百度推出的图像到视频生成模型
Steamer-I2V 是百度 Steamer 团队推出的图像到视频生成模型,通过将静态图像转化为动态视频,展现出卓越的视觉生成能力。模型在 VBench 国际权威的视频生成评测中荣获榜首,精准的视觉控制、高清画质以及对中文...
-
发布了文章 2个月前
StarVector – 开源多模态视觉语言模型,支持图像和文本到 SVG 生成
StarVector 是开源的多模态视觉语言模型,ServiceNow Research、Mila - Quebec AI Institute 和 ETS Montreal 联合开发,专注于将图像和文本转换为可缩放矢量图形(...
-
发布了文章 2个月前
StarCoder 2 – BigCode推出的第二代开源代码大模型
StarCoder 2是由BigCode项目团队开发的新一代大型代码语言模型,旨在为代码生成、编辑和推理任务提供强大的支持。该系列模型在前一代StarCoder模型的基础上进一步扩展和改进而来,提供了不同规模的模型,包括3B...































