Li Fangzheng

The use of CLIP

Basic Structure pre-training 架构,对于输入的同一个图像和文本pair对,使他们的相似度越大越好,这就引出了对比学习的方法。简单来讲就是对角线的相似度最大,其他位置最小,以此来训练模型。 核心代码 图像编码器 图像编码器使用的是ViT(简单来讲,就是将图片切割为大小相同的patch,每个patch可以看做是一个token,剩余的做法和普...

How to use Large Language Model

大模型调优方法 这三种技术在性能、效率和适用范围上各有千秋。选择哪种方法取决于具体的应用需求。 提示工程(Prompt Engineering) 输入prompt给large language model,大语言模型就根据这个输入来生成回应。然后得到我们想要的结果。这实际上是一种精确的输入方法,旨在引导模型产生相应的输出。大多数情况下prompts指的是文本,尤其是以自然语言...

Generative AI with its development

Background 一般而言,深度学习模型可以分为判别式模型(Discriminative model)与生成式模型(Generative model)。判别模型需要输入变量,通过 某种模型来预测。生成模型是给定某种隐含信息,来随机产生观测数据。举个简单的例子, 判别模型:给定一张图,判定图中的动物是什么类别 生成模型:给一系列猫的图片,生成一张新的猫咪 由于反向传播 (...