台部落marsggbo

transformers 庫裏實現的很多模型會有這麼兩個函數 get_output_embeddings和 get_output_embeddings。以 SwitchTransformer 爲例 class SwitchTransform

2024-05-06 13:23:33

在深入探討 PyTorch 中的 Storage 類以及其在參數 offload 場景中的應用之前，讓我們首先了解一下 PyTorch 和它的基礎組件。PyTorch 是一個廣泛使用的開源機器學習庫，它不僅提供了強大的計算圖功能和自動梯度計

2024-04-22 13:23:44

1註冊賬號先在網頁上註冊賬號，之後需要聯繫導師或者管理員把你添加到對應的集羣裏去，例如我加入的是 Lonestar6 集羣。之後需要跟着這個教程綁定 MFA 軟件（可以是 DUO 或者 1password）之後登錄賬號,系統會要求先

2024-04-11 13:23:43

原文：從continuous batching到vLLM中的batching - 不知叫什麼好的文章 - 知乎 https://zhuanlan.zhihu.com/p/688551989

2024-04-04 13:23:34

1. Block 概覽 vLLM 的一個很大創新點是將物理層面的 GPU 和 CPU 可用內存切分成若干個 block,這樣可以有效降低內存碎片化問題。具體而言，vLLM 的 block 分爲邏輯層面（logical）和物理層面（physi

2024-03-24 13:23:32

標題黨一下，順便蹭一下 OpenAI Sora大模型的熱點，主要也是回顧一下擴散模型的原理。 1. 簡單理解擴散模型簡單理解，擴散模型如下圖所示可以分成兩部分，一個是 forward，另一個是 reverse 過程： forwar

2024-02-23 13:23:41

1. Quick Start 創建如下代碼，命名爲 run.py from vllm import LLM, SamplingParams prompts = [ "Have you followed marsggbo in Zhihu

2024-02-05 13:27:47

我的環境如下： nvidia-smi 顯示 cuda 版本是 11.7 目前最新vllm 要求的 torch 版本是 2.1.2，該版本要求的 cuda 版本是 11.8，所以不匹配。執行安裝會遇到如下錯誤 RuntimeError:

2024-01-16 13:24:38

原文： https://zhuanlan.zhihu.com/p/144697348

2023-12-17 13:28:31

論文 DeepSpeed-MoE: Advancing Mixture-of-Experts Inference and Training to Power Next-Generation AI Scale 1. Introduction

2023-12-08 13:26:55

這個報錯原因很好解決，只需要在引入包的時候調用下面的語句就可以了 import torch.fx

2023-12-03 13:42:43

以下筆記參考huggingface 官方 tutorial： https://huggingface.co/learn/nlp-course/chapter6 下圖展示了完整的 tokenization 流程，接下來會對每個步驟做進一步

2023-12-02 13:24:11

閒言碎語我在剛開始接觸 huggingface （後簡稱 hf）的 transformers 庫時候感覺很冗雜，比如就模型而言，有 PretrainedModel, AutoModel，還有各種 ModelForClassifica

2023-12-02 13:24:11

下面這邊文章講的非常清晰，原文鏈接：https://blog.csdn.net/ljp1919/article/details/113616226

2023-11-27 14:04:07

更詳細的查看 https://github.com/marsggbo/Megatron-DeepSpeed/blob/main/tutorials/gpt2_wikipedia.md 下載Wikipedia壓縮數據集（enwiki-la

2023-11-27 14:03:17