Pytorch Accelerate multi-GPU Training Inference

Pytorch Accelerate multi-GPU Training Inference enhance the training speed in around 2 times easy to use the mix way in training to perform the acceleration #GPU fp16 ...

Apr 19, 2024 Generative AI, Artificial Intelligence

The use of CLIP

Basic Structure pre-training 架构，对于输入的同一个图像和文本pair对，使他们的相似度越大越好，这就引出了对比学习的方法。简单来讲就是对角线的相似度最大，其他位置最小，以此来训练模型。核心代码图像编码器图像编码器使用的是ViT（简单来讲，就是将图片切割为大小相同的patch，每个patch可以看做是一个token，剩余的做法和普...

Feb 19, 2024 Generative AI, Artificial Intelligence

Break points in AI

Contrastive learning Contrastive learning SimCLR –it is a self-supervise learning Momentum Contrast for Unsupervised Visual Representation Learning MoCo why combine crossEntropy with softmax...

Feb 10, 2024 Machine Learning, Artificial Intelligence

How to use Large Language Model

大模型调优方法这三种技术在性能、效率和适用范围上各有千秋。选择哪种方法取决于具体的应用需求。提示工程（Prompt Engineering）输入prompt给large language model，大语言模型就根据这个输入来生成回应。然后得到我们想要的结果。这实际上是一种精确的输入方法，旨在引导模型产生相应的输出。大多数情况下prompts指的是文本，尤其是以自然语言...

Jan 14, 2024 Large Language Model, Artificial Intelligence

Generative AI with its development

Background 一般而言，深度学习模型可以分为判别式模型（Discriminative model）与生成式模型（Generative model）。判别模型需要输入变量，通过某种模型来预测。生成模型是给定某种隐含信息，来随机产生观测数据。举个简单的例子，判别模型：给定一张图，判定图中的动物是什么类别生成模型：给一系列猫的图片，生成一张新的猫咪由于反向传播 (...

Jan 2, 2024 Generative AI, Artificial Intelligence

Transformer

Before Transformer 深度学习做 NLP 的方法，基本上都是先将句子分词，然后每个词转化为对应的词向量序列。这样一来，每个句子都对应的是一个矩阵 $X = (x_1,x_2,…,x_t)$, 其中$x_i$都代表着第i个词的向量（行向量），纬度（d），$X\in R^{n*d}$问题就变成了编码这些序列了。第一个基本的思路是 RNN 层，RNN 的方案很简单，递归...

Dec 28, 2023 Transformer, Artificial Intelligence

Language Model

Language Usage for NLP task Speech Recognition 语音识别 P(“We built this city on rock and roll”) > P(“We built this city on sausage rolls”) Spelling correction 拼写更正 P(“… has no mistakes”) > ...

Dec 26, 2023 Language Model, Artificial Intelligence

Pandas Data Cleaning

pandas 字符串处理常用函数大小写转换 lower() upper() 去除首尾空格 strip() 以特定字符串开始 startwith() 替换特定数据 replace() 将某列拆成多列 split() 个性化处理数据 lambda 函数 import pandas as pd data = pd.read_excel('d...

Sep 9, 2023 python, Pandas

Pytorch Tricks

为何将batch size设置为1？通常的项目为了将GPU的算力充分利用，会将batch size设置为一个较大的值在pytorch version中关于目标检测的训练脚本，将batch size设置为了1是因为：不同尺寸的图片打成同一个batch送到网络之前必然要resize（比如padding）成同一个尺寸，为了避免resize带来的干预，所以让一个batch只有一个图片...

Jun 27, 2023 machine learning

Pytorch Baseline

核心流程数据获取神经网络输入比较灵活，这里需要手动确定输入形式（图片，文本）模型定义根据input来定义网络结构训练定义loss, optimizer, Train&Valid, 保存模型权重测试根据训练结果测试数据海华中文阅读理解挑战赛基于bert的baseline bert 基础 ...

Jun 26, 2023 machine learning