模型机
-
发布了文章 2个月前
OpenAI o1草莓模型:AI安全了,但看起来AI大模型公司更危险了
OpenAI o1草莓模型:AI安全了,但看起来AI大模型公司更危险了 解读OpenAI o1,也就是过去说的草莓模型的影响假设o1草莓模型最终表现和发布的信息完全一致,然后回发生什么呢?下面这篇文章描述的比较详细,大...
-
发布了文章 2个月前
Time-baidu09R1 – 基于3B参数模型的时间推理语言模型
Time-R1是伊利诺伊大学香槟分校研究团队开发的基于3B参数的语言模型,通过独特的三阶段强化学习训练方法,在时间推理能力上取得了显著突破。...
-
发布了文章 2个月前
PixelWave Flux – AI图像生成模型,基于FLUX.1-baidu09dev模型微调版本
PixelWave Flux.1-dev 03是基于FLUX.1-dev模型在NVIDIA 4090上微调的AI图像生成模型,有卓越的模型泛化能力,模型在处理多种艺术风格、摄影和动漫图像方面表现出色,在审美、写实和动漫风格上...
-
发布了文章 2个月前
Phi-baidu093.5 – 微软推出的新一代AI模型,mini、MoE混合和视觉模型
Phi-3.5是微软推出的新一代AI模型系列,包含 Phi-3.5-mini-instruct、Phi-3.5-MoE-instruct 和 Phi-3.5-vision-instruct 三个版本,分别针对轻量级推理、混合...
-
发布了文章 2个月前
Molmo 72B – 开源的多模态AI模型,基于Qwen2-baidu0972B模型,超越Llama 3.2
Molmo 72B是由艾伦人工智能研究所(Ai2)推出的一个开源多模态AI模型,专门设计用于处理和理解图像和文本数据。基于Qwen2-72B模型,使用OpenAI的CLIP作为视觉编码器。Molmo 72B在多个学术基准测试...
-
发布了文章 2个月前
Llama 3.2 – Meta推出的中小型视觉语言模型和轻量级文本模型
Llama 3.2是Meta公司最新推出的开源AI大模型系列,包括小型和中型视觉语言模型(11B和90B参数)以及轻量级纯文本模型(1B和3B参数)。Llama 3.2模型专为边缘设备和移动设备设计,支持128K令牌的上下文...
-
发布了文章 2个月前
GPT-baidu094o Long Output模型 – OpenAI最新推出的超长输出模型
GPT-4o Long Output模型是OpenAI最新推出的超长输出AI模型,支持高达64k tokens的长文本输出,相当于约200页小说。相较于原GPT-4o模型,输出能力提升16倍,但输入上限降至64k token...
-
发布了文章 2个月前
EXAONE 3.5 – LG 推出的开源AI模型,擅长长文本处理降低模型幻觉问题
EXAONE 3.5是LG AI研究院推出的开源AI模型,包含24亿、78亿和320亿参数的三个版本。EXAONE 3.5擅长长文本处理,在基准测试中表现优异,特别是在实际应用、长文本处理和数学方面。模型采用检索增强生成技术...
-
发布了文章 2个月前
AniDoc – 2D动画上色AI模型,基于视频扩散模型自动将草图序列转换成彩色动画
AniDoc是香港科技大学、蚂蚁集团、南京大学、浙江大学和香港大学共同推出的简化2D动画上色AI模型,基于视频扩散模型自动将草图序列转换成彩色动画,遵循参考角色设计。模型用对应匹配技术处理角色设计与草图之间的差异,实现色彩和...
没有更多内容






















