MOSS量化模型部署记录

怼烎@ 2023-09-27 19:02 14阅读 0赞

发表评论取消回复

表情：

评论列表（有 0 条评论，14人围观）

还没有评论，来说两句吧...

相关阅读

相关基于LMDeploy部署大模型和量化

背景大模型具有庞大的参数量，内存开销大，7B模型仅权重就需要14+G内存，采用自回归生成token，需要缓存Attention 的k/v带来巨大的内存开销；动态sh...

矫情吗；*/ 2024年04月20日 11:53/ 0 赞/ 76 阅读

相关模型量化（pytorch）

模型量化（基于pytorch） 1、量化简介 1.1、量化介绍 1.2、量化方法 1.2.1、训练后动态量化（Post

小咪咪/ 2024年04月02日 04:22/ 0 赞/ 95 阅读

相关 PyTorch训练（四）：模型量化训练【①模型训练完毕后的动态量化、②模型训练完毕后的静态量化、③模型训练中开启量化】

一、概述在深度学习中，量化指的是使用更少的bit来存储原本以浮点数存储的tensor，以及使用更少的bit来完成原本以浮点数完成的计算。这么做的好处主要有如下几点：

ゝ一纸荒年。/ 2023年09月29日 15:26/ 0 赞/ 44 阅读

相关 MOSS模型结构

MOSS模型结构 """ PyTorch Moss model.""" from typing import Optional, Tuple, Un

川长思鸟来/ 2023年09月27日 19:07/ 0 赞/ 135 阅读

相关 MOSS量化模型部署记录

一、MOSS仓库代码下载及环境准备下载本仓库内容至本地/远程服务器 `git clone https://github.com/OpenLMLab/MOSS.g

怼烎@/ 2023年09月27日 19:02/ 0 赞/ 15 阅读

相关 PyTorch模型量化工具学习

官方教程(英文)： [https://pytorch.org/docs/stable/quantization.htmlpytorch.org][https_pytorch

﹏ヽ暗。殇╰゛Y/ 2023年01月22日 04:56/ 0 赞/ 252 阅读

相关 pytorch模型量化

模型量化是为了减少模型的大小，以便在边缘设备上进行计算首先建网络: import torch import torch.nn as nn from

你的名字/ 2022年12月15日 02:23/ 0 赞/ 232 阅读

相关神经网络模型量化方法简介

笔记mark： jpg算法中就用到了量化。 png压缩算法中用到了霍夫曼编码。本文主要梳理了模型量化算法的一些文章，阐述了每篇文章主要的内核思想和量化过程，整理了

ゝ一世哀愁。/ 2022年10月06日 13:49/ 0 赞/ 316 阅读

相关 threejs：模型轻量化

参考链接：[https://blog.csdn.net/ALLENJIAO/article/details/80830700][https_blog.csdn.net_ALLE

ゝ一纸荒年。/ 2022年02月21日 04:23/ 0 赞/ 353 阅读

相关模型压缩，剪枝，量化，加速总结

最近有朋友问我做过的L1剪枝方法怎么样，有没有资源；因为这个是公司的事情，我也不能直接给资源，但是我还是将我使用过得压缩方法总结一下。（还是由于自己忘性大，留给自己回忆

谁借莪１个温暖的怀抱￠/ 2021年12月21日 09:34/ 0 赞/ 355 阅读