1. Problem用一块新的Nvidia的 Jetson NX板编译时遇到一个报错,如下:CMake Error: The following variables are used in this project, but they are set to NOTFOUND.Please set them or make sure they are set and tested correctly in the CMake files:CUDA_cublas_device_LIBRARY (ADV
Will_Ye | 开发语言:其他 | 发布时间:2023-03-29 |
最近有需要在新的领域进一步训练BERT,因此参照了hugging face官方文档写了相应的代码。本文采用的是hugging face提供的checkpoint,并在相应的task special领域进行了微调。由于项目的保密协议代码数据不便全部公开,下面只给出关键的部分。BERT MLM重新训练BERT主要是在自己的数据集上实现Masked Language Model的预测任务。我忘记了在哪篇论文里看到Next Sentence Prediction对下游的任务的增益其实并不大(如果有误还请指出),
五月的echo | 开发语言:其他 | 发布时间:2023-03-15 |
? 深度语义向量 + 传统聚类方法:(1)通过Bert计算得到语句的深度语义向量(2)通过HDBSCAN进行聚簇处理(3)通过c-tfidf进行调整聚簇的粒度并提取主题关键词链接:
银河小铁骑plus | 开发语言:其他 | 发布时间:2023-03-15 |
预训练语言模型(PLMs)是在大规模语料库上以自监督方式进行预训练的语言模型。在过去的几年中,这些PLM从根本上改变了自然语言处理社区。传统的自监督预训练任务主要涉及。在对这些PLM进行预训练后,可以对下游任务进行微调。按照惯例,这些微调包括。在下游任务上对PLM进行微调通常会带来非凡的性能提升,这就是plm如此受欢迎的原因。在本教程中,从两个角度提供广泛而全面的介绍:为什么这些PLM有效,以及如何在NLP任务中使用它们。
marasimc | 开发语言:其他 | 发布时间:2023-03-15 |
机器学习-支持向量机(svm)
笑起来贼好看 | 开发语言:其他 | 发布时间:2023-02-01 |
朴素贝叶斯法(Naive Bayes)是一种基础分类算法,它的核心是贝叶斯定理+条件独立性假设。
禺垣 | 开发语言:其他 | 发布时间:2023-01-31 |
APS(Assisted Parking System) 系统应可以识别可停放的车位,确定目标停车位置并计算停车轨迹。APS是通过横纵向控制讲车辆引导至目标停车位置。在到达指定位置之后,需要保证驻车控制且需要保证停车位置相对于目标位置的精度控制在一定的范围内。总体来讲,APS可以识别两种车位类型:一种是两参考障碍物组成的空间车位,另一种是绘制车位线定义的车位类型。在上述的两种类型中,水平和垂直均可以识别到。此外,我想补充一点:部分主机厂可能会存在多一种车位类型定义:混合车位。
菜鸡小詹 | 开发语言:其他 | 发布时间:2023-01-30 |
通过使用python大数据的方法来建立信用评分模型,能提高效率,降低了人为决策的成本。对于金融机构来说,可以根据这个分数决定授信与否,授信额度,利率等。而对于客户来说,通过了解自己的信用分数,可以更好的做出决策。本次实验最后构建的模型为线性回归模型,模型平均绝对误差为3.36,均方误差为18.29,R方为0.68,模型效果一般,还有待提高。通过这次Python项目实战,我学到了许多新的知识,这是一个让我把书本上的理论知识运用于实践中的好机会。
艾派森 | 开发语言:其他 | 发布时间:2023-01-30 |
本文的作者发现,行业内目前还没有一次全面的实验来实际解释如何用深度学习获得更好的结果,只有一些博客文章、社交媒体等有一些零星的尝试结果,或是在论文的附录中简略介绍一下技巧,也有关于某个特定项目或pipeline的实例研究。随着深度学习技术的成熟,并对世界产生更大的影响,社区需要更多的资源,涵盖更多有价值的模型recipe,包括所有的工程细节,这对获得好的结果是非常关键的。文中的重点是超参数调整的过程,同时也涉及了深度学习训练的其他方面,如pipeline的实现和优化,但对这些方面的描述并不完整。
机器学习社区 | 开发语言:其他 | 发布时间:2023-01-29 |
python anaconda3 tensorflow
sanshou | 开发语言:其他 | 发布时间:2023-01-29 |
抄自quack的ppt
仰望星空的蚂蚁 | 开发语言:其他 | 发布时间:2023-01-29 |
1.train_word2vec生成word2vec词向量模型,train_word2vec中会调用corpusprocess(对中文文本进行预处理和切词操作)3.prepare_data根据w2id,划分训练集x_train, y_trian和验证集 x_val , y_val。2.generate_id2wec会根据此向量模型,生成w2id,和嵌入权重embedding_weights。数据处理时,应该以utf-8编码,不然读出来的数据较乱,修改数据形式,读取Excel文件,以utf-8编码。
Python代码大全 | 开发语言:其他 | 发布时间:2023-01-29 |
机器学习定义及其主要类型
yangmishiwonvshen | 开发语言:其他 | 发布时间:2023-01-29 |
因子分析法(Factor Analysis)是一种利用降维的思想,从研究原始变量相关矩阵内部的依赖关系出发,把一些具有错综复杂关系的变量归结为少数几个综合因子的一种多变量统计分析方法。其优势在于不仅可以在减少大量指标分析的工作量的同时保证分析结果的合理性,还能够使得提取的公因子更具有对研究对象的解释性和客观性。设随机变量XX1X2XpXX1?X2?Xp?, 其中EXμDX∑EXμDX∑;同时有几个难以观测的随机变量FF1F2Fmm。
Sun_Sherry | 开发语言:其他 | 发布时间:2023-01-29 |
现有一个猫狗分类网络模型,当输入一张云的图像进行判断时,假设这朵云比较像狗,则机器提取的特征也会偏向于狗的特征。假设特征对应的概率分别为:[狗,猫] = [x1,x2] = [0.6,0.4],那么采用L2范数(L2 = x1 ^ 2 + x2 ^ 2)可以很好达到放大特征的效果,最终图像越来越像狗。先对图像连续做二次等比例缩小,该比例是1.5,之所以要缩小,图像缩小是为了让图像的像素点调整后所得结果图案能显示的更加平滑,过程主要是抑制了图像的高频成分,放大了低频成分。
胖墩会武术 | 开发语言:其他 | 发布时间:2023-01-29 |
(1)工业界推荐系统-小红书推荐场景及内部实践【业务指标、链路、ItemCF】(2)工业界推荐系统-小红书推荐场景及内部实践【UserCF、离线特征处理】(3)工业界推荐系统-小红书推荐场景及内部实践【矩阵补充、双塔模型】(4)工业界推荐系统-小红书推荐场景及内部实践【正负样本选择】(5)工业界推荐系统-小红书推荐场景及内部实践【线上召回和模型更新】(6)工业界推荐系统-小红书推荐场景及内部实践【其他召回通道】(7)工业界推荐系统-小红书推荐场景及内部实践【冷启动问题1】(8)工业界推荐系统-
NLP_wendi | 开发语言:其他 | 发布时间:2023-01-29 |
慢慢的将实体识别及关系识别大致了解下,将其研究深入。了解透彻都行啦的回事与打算。
big_matster | 开发语言:其他 | 发布时间:2023-01-29 |
个人学习笔记
Micoreal | 开发语言:其他 | 发布时间:2023-01-28 |
正交矩阵与正交化
守树人 | 开发语言:其他 | 发布时间:2023-01-28 |
常用8种聚类算法汇总与代码举例
scott198510 | 开发语言:其他 | 发布时间:2023-01-28 |