批量计算

云计算

即插即用!Batch Transformer

28

发布于 2024-04-08

©作者 |侯志 单位 | 悉尼大学 大家好,这里是NewBeeNLP。最近在知乎看到一个非常有意思的问题,『为什么没有做batch attention的?』今天就分享一篇相关的顶会论文~ 当前的深度神经网络尽管已经取得了巨大的成功,但仍然面临着来自于数据稀缺的各种挑战,比如数据不...

阅读(2150)赞 (0)

云计算

不同维度矩阵相乘[通俗易懂]

8

发布于 2023-08-09

目录 前言 二维乘一维 三维乘一维 二维乘二维 三维乘二维 三维乘三维 1-(2,2,2)*(2,2,2) 2-(2,2,2)*(1,2,2) 3-(3,2,2)*(2,2,2)–失败 多维乘多维 参考资料 前言 在深度学习中经常会遇到不同维度的矩阵相乘的情况,本文会通过一些例子...

阅读(3108)赞 (0)

云计算

PyTorch-数据处理流程

1

发布于 2023-04-10

“ 在此记录对PyTorch框架学习过程中的思考。” 数据加载处理是深度学习模型训练的前奏,是很重要的一部分。这一过程需要把原始数据,影像或者文本等进行封装、转换,并以合适的格式传递给模型。这个过程依赖torch.utils.data模块,常用以上三个类: torch.utils...

阅读(889)赞 (0)

云计算

重新抽象图形API

发布于 2023-03-20

这次抽象,我几乎全盘否定了之前的抽象。 本来,RHI的抽象已经基本完成了,可以开心的写基础的光照阴影这些功能了。 但是,在QQ群里无意间看到大佬们聊起来bindless, 然后去查了查资料,发现bindless性能又好,抽象又好做,于是果断入bindless的坑。 在bindle...

阅读(2574)赞 (0)

云计算

NLP之NER:商品标题属性识别探索与实践

22

发布于 2023-03-20

作者 | 康洪雨 单位 | 有赞科技 整理 | PaperWeekly 最近一段时间在做商品理解的工作,主要内容是从商品标题里识别出商品的一些属性标签,包括不限于品牌、颜色、领型、适用人群、尺码等等。这类任务可以抽象成命名实体识别(Named Entity Recognition...

阅读(1604)赞 (0)

云计算

双塔模型如何选择负样本?

3

发布于 2023-03-20

作者 | 雨下 整理 | NewBeeNLP 之前有一段时间做过双塔的召回模型[1],线上各个指标有了不错的提升。目前双塔模型也是被各大公司钟爱的召回模型。对主流召回模型的分享整理在:总结下自己做过的深度召回模型 双塔模型在训练时是对一个batch内样本训练。一个batch内每个...

阅读(1626)赞 (0)

云计算

总结!语义信息检索中的预训练模型(下)

4

发布于 2023-03-20

作者 | Chilia 哥伦比亚大学 nlp搜索推荐 整理 | NewBeeNLP 上一篇中,我们介绍了预训练模型在建立倒排索引中的应用:总结!语义信息检索中的预训练模型 这一篇将介绍预训练模型在深度召回和精排中的应用。 4. 预训练模型在深度召回中的应用 在深度召回中,我们使用...

阅读(812)赞 (0)

云计算

bat 剪切文件_bat延时命令

发布于 2022-12-24

大家好,又见面了,我是你们的朋友全栈君。 扩展名是bat(在nt/2000/xp/2003下也可以是cmd)的文件就是批处理文件。 首先批处理文件是一个文本文件,这个文件的每一行都是一条DOS命令(大部分时候就好象我们在DOS提示符下执行的命令行一样),你可以使用DOS下的Edi...

阅读(1674)赞 (0)

云计算

Linux 命令(185)—— batch 命令

发布于 2022-11-21

文章目录 1.命令简介 2.命令格式 3.选项说明 4.常用示例 参考文献 1.命令简介 batch 在系统空闲的时候执行任务。 与 at 命令不同的地方在于 batch 命令不需要指定时间,自动在系统空闲的时候执行指定的任务。系统空闲指的是系统负载平均值低于 0.8 或 atd...

阅读(591)赞 (0)

云计算

VLAN配置实例_ipsec配置步骤

14

发布于 2022-11-21

大家好,又见面了,我是你们的朋友全栈君。 实验拓扑图 说明:图上当时把端口编号托错位置—互换LSW2和LSW3上相连端口编号。此图下的图上为正确图 实验要求: 1.PC1和PC3所在接口为access;PVLAN VLAN2 PC2/4/5/6 处于同一网段;其中PC2可以访问P...

阅读(3018)赞 (0)

云计算

BN层理解_理解六层次总结

发布于 2022-11-16

bn层计算的均值和方差是 channel的 输入数据是nchw,求得的均值和方差均是长度为c的向量 mini-batch指的是一个batch的所有样本对应通道组合成一个minibatch,1个nchw的数据有c个mini-batch 一个mini-batch在一起进行求均值和方差...

阅读(275)赞 (0)

云计算

这个开源神器,让你更懂你的 GPU!

12

发布于 2022-11-09

大家好,我是小 G。 深度推荐模型(DLRMs)已经成为深度学习在互联网公司应用的最重要技术场景,如各平台的视频推荐、购物搜索、广告推送等流量变现业务,极大改善了用户体验和业务商业价值。但海量的用户和业务数据,频繁地迭代更新需求,以及高昂的训练成本,都对 DLRM 训练提出了严峻...

阅读(2642)赞 (0)

云计算

半监督之mixmatch

9

发布于 2022-11-04

大家好,又见面了,我是你们的朋友全栈君。 自洽正则化:以前遇到标记数据太少,监督学习泛化能力差的时候,人们一般进行训练数据增广,比如对图像做随机平移,缩放,旋转,扭曲,剪切,改变亮度,饱和度,加噪声等。数据增广能产生无数的修改过的新图像,扩大训练数据集。自洽正则化的思路是,对未标...

阅读(2611)赞 (0)