当前位置:首页 > 文章中心 > 正文内容

Windows 11上部署本地DeepSeek模型并投喂知识的详细流程

dgx6668个月前 (04-28)文章中心34

以下是在Windows 11上部署本地DeepSeek模型并投喂知识的详细流程:

---

### **一、部署DeepSeek本地模型**

#### **1. 环境准备**

- **安装Python**

- 访问 [Python官网](
https://www.python.org/downloads/) 下载3.8+版本。

- 安装时勾选 `Add Python to PATH`。

- **安装CUDA和PyTorch**

- 确认显卡支持CUDA(NVIDIA显卡),安装 [CUDA Toolkit 11.8+](
https://developer.nvidia.com/cuda-toolkit)。

- 安装PyTorch(带CUDA支持):

```bash

pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118

```

- **安装依赖库**

```bash

pip install transformers huggingface_hub accelerate sentencepiece

```

#### **2. 下载DeepSeek模型**

- 访问Hugging Face官网,搜索官方模型(如 `
deepseek-ai/deepseek-llm-7b-chat`)。

```python

from huggingface_hub import snapshot_download

snapshot_download(repo_id="deepseek-ai/deepseek-llm-7b-chat", local_dir="deepseek-model")

```

> 注:模型较大(约15GB+),需确保磁盘空间充足。若无权限,需申请访问。

#### **3. 运行本地模型**

- 创建 `inference.py` 文件:

```python

from transformers import AutoTokenizer, AutoModelForCausalLM


model_path = "deepseek-model"

tokenizer = AutoTokenizer.from_pretrained(model_path)

model = AutoModelForCausalLM.from_pretrained(model_path, device_map="auto")


prompt = "你好,请介绍一下你自己。"

inputs = tokenizer(prompt, return_tensors="pt").to(model.device)

outputs = model.generate(**inputs, max_new_tokens=100)

print(tokenizer.decode(outputs[0], skip_special_tokens=True))

```

- 运行脚本:

```bash

python inference.py

```

---

### **二、投喂知识(以RAG方法为例)**

#### **1. 准备知识文档**

- 将知识整理为文本文件(如 `knowledge.txt` 或 `docx`、`PDF`),内容示例:

```

公司名称:XX科技

成立时间:2010年

核心业务:人工智能解决方案

```

#### **2. 安装RAG工具库**

```bash

pip install langchain chromadb tiktoken unstructured

```

#### **3. 构建知识库**

- 创建 `rag_setup.py`:

```python

from langchain.document_loaders import DirectoryLoader

from langchain.text_splitter import CharacterTextSplitter

from langchain.embeddings import HuggingFaceEmbeddings

from langchain.vectorstores import Chroma


# 加载文档

loader = DirectoryLoader('knowledge/', glob="**/*.txt")

documents = loader.load()


# 分割文本

text_splitter = CharacterTextSplitter(chunk_size=500, chunk_overlap=50)

texts = text_splitter.split_documents(documents)


# 生成向量数据库

embeddings = HuggingFaceEmbeddings(model_name="sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2")

db = Chroma.from_documents(texts, embeddings, persist_directory="knowledge_db")

db.persist()

```

#### **4. 集成到DeepSeek模型**

- 创建 `rag_inference.py`:

```python

from langchain.vectorstores import Chroma

from langchain.embeddings import HuggingFaceEmbeddings

from transformers import AutoTokenizer, AutoModelForCausalLM


# 加载向量数据库

embeddings = HuggingFaceEmbeddings(model_name="sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2")

db = Chroma(persist_directory="knowledge_db", embedding_function=embeddings)


# 加载DeepSeek模型

tokenizer = AutoTokenizer.from_pretrained("deepseek-model")

model = AutoModelForCausalLM.from_pretrained("deepseek-model", device_map="auto")


# 检索增强生成

query = "XX科技的核心业务是什么?"

docs = db.similarity_search(query, k=1)

context = docs[0].page_content


prompt = f"基于以下信息回答问题:{context}\n\n问题:{query}"

inputs = tokenizer(prompt, return_tensors="pt").to(model.device)

outputs = model.generate(**inputs, max_new_tokens=200)

print(tokenizer.decode(outputs[0], skip_special_tokens=True))

```

---

### **三、注意事项**

1. **硬件要求**

- 至少16GB内存,推荐使用NVIDIA显卡(8GB+显存)。

- 若显存不足,可在加载模型时设置 `device_map="cpu"` 或使用量化版本。

2. **模型选择**

- 如果显存不足,可尝试较小模型(如 `deepseek-1.3b`)或量化版本(加载时添加 `load_in_4bit=True` 参数)。

3. **知识更新**

- 新增知识时,重新运行 `rag_setup.py` 更新向量数据库。

4. **高级微调(可选)**

- 如需深度定制,准备JSON格式数据集,使用以下代码微调:

```python

from transformers import TrainingArguments, Trainer


training_args = TrainingArguments(

output_dir="output",

per_device_train_batch_size=4,

num_train_epochs=3

)

trainer = Trainer(model=model, args=training_args, train_dataset=dataset)

trainer.train()

```

---

通过以上步骤,您可以在Windows 11上部署DeepSeek模型并为其投喂专业知识。RAG方法无需训练即可快速集成新知识,适合大多数场景。

扫描二维码推送至手机访问。

版权声明:本文由第六芝士网发布,如需转载请注明出处。

本文链接:http://www.dgx666.com/post/1180.html

分享给朋友:

“Windows 11上部署本地DeepSeek模型并投喂知识的详细流程” 的相关文章

AMD AFMF驱动级帧生成将迎2.1版本:提高帧质量,硬件要求不变

IT之家 2 月 25 日消息,外媒 VideoCardz 北京时间昨日深夜表示,AMD Fluid Motion Frames(AFMF)帧生成技术将迎来 2.1 版本,可在硬件要求不变的同时提升生成帧的画面质量。AFMF 是一项驱动级帧生成技术,与英伟达推出的类似功能 Smooth Motion...

AutoCAD 软件介绍、软件安装

第一章 AutoCAD入门必读本章目标& 了解AutoCAD的含义、应用领域及发展历程& 实操软件安装与注册& 掌握界面组成及应用& 掌握命令操作方法& 熟记选取图形的几种方式并应用& 实操坐标输入与动态输入内容讲解:第1天——兴趣启发,原来黑底白线的CAD可以这样有意思。今天,展英飞来找老师补习功...

2014CAD激活后闪退,解决方法

之前在电脑上安装了一个CAD软件,是2014版的,平时用的很少,用的时候打开用用。昨天有个文件需要用CAD软件打开,提示需要激活,然后我在网上下载了一个激活工具,按照操作步骤,最终是激活成功了。我再次打开软件的时候,快到打开界面的时候直接退出了,试了好几次,都是这种情况,我搜索了一下,还真有人也遇到...

CAD入门基础内容

CAD制图会有入门和中高级之分,一开始要有很多知识点要记,但很多刚开始学的小伙伴可能还不了解,下面是我就来介绍一下CAD入门基础内容,希望大家能有所收获!打开CAD2007绘图界面,点击“绘图”,在下拉菜单中选择“点”。然后选择“单点”,命令窗口中将出现“指定点”的命令,在绘图界面中可以绘制单点。绘...

CAD2007怎么安装?CAD2007中文版的安装教程

CAD2007是很多从事建筑设计,尤其是结构设计最经常使用的一款专业绘图软件。不少网友下载了CAD2007安装包之后,却不会安装CAD2007,因为他下载的CAD2007的英文版,而一些网友下载了CAD2007中文版的网友,却因为不是在NET2.0以上的安装环境而安装失败。今天,小编就给大家演示一下...

怎么把备忘录放桌面 怎么在桌面显示备忘录便签里的内容

手机上自带的备忘录app是很多人都使用过的一款软件,以iPhone为例,自从iOS系统升至iOS14版本以来,就新增了桌面小组件功能。为了方便自己的使用,提高查看内容的效率,怎么把备忘录放桌面?怎么在桌面显示备忘录便签里的内容?要想在iOS14及以上版本的iPhone手机桌面上摆放备忘录很简单,首先...