Pytorch Tricks
为何将batch size设置为1? 通常的项目为了将GPU的算力充分利用,会将batch size设置为一个较大的值 在pytorch version中关于目标检测的训练脚本,将batch size设置为了1是因为: 不同尺寸的图片打成同一个batch送到网络之前必然要resize(比如padding)成同一个尺寸,为了避免resize带来的干预,所以让一个batch只有一个图片...
为何将batch size设置为1? 通常的项目为了将GPU的算力充分利用,会将batch size设置为一个较大的值 在pytorch version中关于目标检测的训练脚本,将batch size设置为了1是因为: 不同尺寸的图片打成同一个batch送到网络之前必然要resize(比如padding)成同一个尺寸,为了避免resize带来的干预,所以让一个batch只有一个图片...
核心流程 数据获取 神经网络输入比较灵活,这里需要手动确定输入形式(图片,文本) 模型定义 根据input来定义网络结构 训练 定义loss, optimizer, Train&Valid, 保存模型权重 测试 根据训练结果测试数据 海华中文阅读理解挑战赛 基于bert的baseline bert 基础 ...
Jacques Qu from Channel Planning & Forecast share us stories make something wonderful 交代了2005年演讲背后的故事 为期半年 Steve利用给自己发邮件的方式记录了hint 发觉怎么 data -> knowledge -> hint -> insight ->...
在 Python 中,and、or、not 和 &、|、~ 都是逻辑运算符,但它们的行为有些不同。 and 和 or 是短路逻辑运算符,也就是说,如果第一个操作数已经确定了整个表达式的结果,那么就不会再计算第二个操作数。具体来说: 对于 and 运算符,当第一个操作数为假(False)时,整个表达式的结果就是假;否则,需要继续计算第二个操作数,返回第二个操...
What is Machine Learning Joshua Gans和Avi Goldfarb在《预测机器》一书中所说,“人工智能的新浪潮实际上并没有给我们带来智能,而是智能的关键组成部分 - 预测”。你可以用机器学习做各种美好的事情。唯一的要求是将你的问题框定为预测问题。想从英语翻译成葡萄牙语吗?然后构建一个 ML 模型,在给定英语句子时预测葡萄牙语句子。想要识别人脸?然后创建一...
Exponential Smothing Model 一种时序预测算法,可用于所有时序 平稳时间序列 (Stationary Time Series) 1)任意t,其均值为常数 2)任意t,s.自相关系数以及自方差仅依赖于时间差t-s 平稳又包括:严平稳、宽平稳。 ...
background 大数据时代中,在推荐、广告领域样本的获取从来都不是问题,似乎适用于小样本学习的伪标签技术渐渐淡出了人们的视野,但实际上在样本及其珍贵的金融、医疗图像、安全等领域,伪标签学习是一把锋利的匕首,简单而有效。 definition of Pseudo-Labelling 伪标签的定义来自于半监督学习,半监督学习的核心思想是通过借助无标签的数据来提升有监...
量化投资的基本概念 量化投资是一种基于数学和统计学原理的投资策略。它使用大量数据和算法来预测市场走势,并进行交易。量化投资分为两种类型:高频交易和组合管理。高频交易是使用计算机程序来进行高速交易的技术,而组合管理则是使用数学模型来管理投资组合的策略。 金融数据 金融数据是量化投资的基础,包括股票价格,指数,基金等。在量化投资中,通常使用历史数据进行回测和验证策略,也可...
高质量的论文期刊 CVPR, ECCV, ICCV, AAAI, NIPS, ICLR, ICML 高引用量的论文 同行间认可,参考,借鉴的论文 知名团队 Yoshua Bengio, Yann LeCun, Geoffrey Hinton, Andrew Ng 重视有代码的论文 paper with code 在新领域的时候要阅读综述性的文章 如何...
冻结预训练模型参数 Pytorch 如何精确的冻结我想冻结的预训练模型的某一层? 四种方法,假设目前有模型如下 ```python class Char3SeqModel(nn.Module): def init(self, char_sz, n_fac, n_h): super().init() self.em = nn.Embeddi...