模型制作与设计
-
发布了文章 2个月前
Time-baidu09R1 – 基于3B参数模型的时间推理语言模型
Time-R1是伊利诺伊大学香槟分校研究团队开发的基于3B参数的语言模型,通过独特的三阶段强化学习训练方法,在时间推理能力上取得了显著突破。...
-
发布了文章 2个月前
Sky-baidu09T1 – NovaSky 开源的推理 AI 模型,可从零开始复现该模型
Sky-T1是加州大学伯克利分校Sky Computing实验室的研究团队NovaSky发布的开源推理AI模型,名为Sky-T1-32B-Preview。是首个开源推理模型,训练数据集和代码均已公开,用户可以从零开始复现该模...
-
发布了文章 2个月前
Qwen2.5-baidu09Coder – 阿里Qwen团队开源的全系代码模型,覆盖六个主流模型尺寸
Qwen2.5-Coder 是阿里Qwen 团队推出的全系列代码生成模型,推动开源代码语言模型的发展。在代码生成、代码推理、代码修复等任务上表现出色。系列涵盖了不同规模的模型1.5B/7B/0.5B/3B/14B/32B的六...
-
发布了文章 2个月前
PixelWave Flux – AI图像生成模型,基于FLUX.1-baidu09dev模型微调版本
PixelWave Flux.1-dev 03是基于FLUX.1-dev模型在NVIDIA 4090上微调的AI图像生成模型,有卓越的模型泛化能力,模型在处理多种艺术风格、摄影和动漫图像方面表现出色,在审美、写实和动漫风格上...
-
发布了文章 2个月前
Phi-baidu093.5 – 微软推出的新一代AI模型,mini、MoE混合和视觉模型
Phi-3.5是微软推出的新一代AI模型系列,包含 Phi-3.5-mini-instruct、Phi-3.5-MoE-instruct 和 Phi-3.5-vision-instruct 三个版本,分别针对轻量级推理、混合...
-
发布了文章 2个月前
Molmo 72B – 开源的多模态AI模型,基于Qwen2-baidu0972B模型,超越Llama 3.2
Molmo 72B是由艾伦人工智能研究所(Ai2)推出的一个开源多模态AI模型,专门设计用于处理和理解图像和文本数据。基于Qwen2-72B模型,使用OpenAI的CLIP作为视觉编码器。Molmo 72B在多个学术基准测试...
-
发布了文章 2个月前
QwQ-32B与DeepSeek-R1:32B模型能否挑战671B参数模型?
...
-
发布了文章 2个月前
Llama 4模型:Meta AI开源的最佳模型
...
-
发布了文章 2个月前
Llama 3.2 – Meta推出的中小型视觉语言模型和轻量级文本模型
Llama 3.2是Meta公司最新推出的开源AI大模型系列,包括小型和中型视觉语言模型(11B和90B参数)以及轻量级纯文本模型(1B和3B参数)。Llama 3.2模型专为边缘设备和移动设备设计,支持128K令牌的上下文...
-
发布了文章 2个月前
GPT-baidu094o Long Output模型 – OpenAI最新推出的超长输出模型
GPT-4o Long Output模型是OpenAI最新推出的超长输出AI模型,支持高达64k tokens的长文本输出,相当于约200页小说。相较于原GPT-4o模型,输出能力提升16倍,但输入上限降至64k token...
-
发布了文章 2个月前
EXAONE 3.5 – LG 推出的开源AI模型,擅长长文本处理降低模型幻觉问题
EXAONE 3.5是LG AI研究院推出的开源AI模型,包含24亿、78亿和320亿参数的三个版本。EXAONE 3.5擅长长文本处理,在基准测试中表现优异,特别是在实际应用、长文本处理和数学方面。模型采用检索增强生成技术...
-
发布了文章 2个月前
AnimePro FLUX – 动漫风格图像生成模型,基于Flux.1 Shnell模型微调
AnimePro FLUX是基于Apache 2.0许可的动漫风格图像生成模型,专为生成高质量二次元插画设计。AnimePro FLUX基于Flux.1 Shnell模型微调,克服DEV版本的许可限制,产生媲美Dev和Pro...
-
发布了文章 2个月前
AniDoc – 2D动画上色AI模型,基于视频扩散模型自动将草图序列转换成彩色动画
AniDoc是香港科技大学、蚂蚁集团、南京大学、浙江大学和香港大学共同推出的简化2D动画上色AI模型,基于视频扩散模型自动将草图序列转换成彩色动画,遵循参考角色设计。模型用对应匹配技术处理角色设计与草图之间的差异,实现色彩和...
没有更多内容

























