Krisnile.SpiritScript

多模态学习—对比语言-图像与训练模型（CLIP）

在这个大模型（LLM）横行的时代，我们对AI的需求不仅仅是文本生成文本，很多平台都提供了文本生成图像（Text-to-Image）的功能，比如GPT-4o两个月前推出的融合自回归模型（可见上一篇文章）和扩散模型等算法进行图像生成的新功能，在互联网...

在图像生成领域，深度学习模型正以前所未有的速度发展，为计算机视觉和自然语言处理提供了许多创新解决方案。GPT-4o基于自回归模型主干的图像生成架构最近很热门，可以生成各种“吉卜力风格”的图案，而且效果很好。但是我们传统流行的图像生成模型是扩散模型，和...

v### 关于技术革命与霸权冲击中国人工智能企业深度求索（DeepSeek）于2025年初推出的开源大模型DeepSeek-R1，凭借其低成本、高性能的特点，迅速引发国际社会震动。长期以来，中美两国在人工智能领域的主要矛盾集中在“中方电力资源丰富...