当前位置：首页 > 文章中心 > 正文内容

Windows 11上部署本地DeepSeek模型并投喂知识的详细流程

dgx6668个月前 (04-28)文章中心34

以下是在Windows 11上部署本地DeepSeek模型并投喂知识的详细流程：

---

### **一、部署DeepSeek本地模型**

#### **1. 环境准备**

- **安装Python**

- 访问 [Python官网](
https://www.python.org/downloads/) 下载3.8+版本。

- 安装时勾选 `Add Python to PATH`。

- **安装CUDA和PyTorch**

- 确认显卡支持CUDA（NVIDIA显卡），安装 [CUDA Toolkit 11.8+](
https://developer.nvidia.com/cuda-toolkit)。

- 安装PyTorch（带CUDA支持）：

```bash

pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118

```

- **安装依赖库**

```bash

pip install transformers huggingface_hub accelerate sentencepiece

```

#### **2. 下载DeepSeek模型**

- 访问Hugging Face官网，搜索官方模型（如 `
deepseek-ai/deepseek-llm-7b-chat`）。

```python

from huggingface_hub import snapshot_download

snapshot_download(repo_id="deepseek-ai/deepseek-llm-7b-chat", local_dir="deepseek-model")

```

> 注：模型较大（约15GB+），需确保磁盘空间充足。若无权限，需申请访问。

#### **3. 运行本地模型**

- 创建 `inference.py` 文件：

```python

from transformers import AutoTokenizer, AutoModelForCausalLM

model_path = "deepseek-model"

tokenizer = AutoTokenizer.from_pretrained(model_path)

model = AutoModelForCausalLM.from_pretrained(model_path, device_map="auto")

prompt = "你好，请介绍一下你自己。"

inputs = tokenizer(prompt, return_tensors="pt").to(model.device)

outputs = model.generate(**inputs, max_new_tokens=100)

print(tokenizer.decode(outputs[0], skip_special_tokens=True))

```

- 运行脚本：

```bash

python inference.py

```

---

### **二、投喂知识（以RAG方法为例）**

#### **1. 准备知识文档**

- 将知识整理为文本文件（如 `knowledge.txt` 或 `docx`、`PDF`），内容示例：

```

公司名称：XX科技

成立时间：2010年

核心业务：人工智能解决方案

```

#### **2. 安装RAG工具库**

```bash

pip install langchain chromadb tiktoken unstructured

```

#### **3. 构建知识库**

- 创建 `rag_setup.py`：

```python

from langchain.document_loaders import DirectoryLoader

from langchain.text_splitter import CharacterTextSplitter

from langchain.embeddings import HuggingFaceEmbeddings

from langchain.vectorstores import Chroma

# 加载文档

loader = DirectoryLoader('knowledge/', glob="**/*.txt")

documents = loader.load()

# 分割文本

text_splitter = CharacterTextSplitter(chunk_size=500, chunk_overlap=50)

texts = text_splitter.split_documents(documents)

# 生成向量数据库

embeddings = HuggingFaceEmbeddings(model_name="sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2")

db = Chroma.from_documents(texts, embeddings, persist_directory="knowledge_db")

db.persist()

```

#### **4. 集成到DeepSeek模型**

- 创建 `rag_inference.py`：

```python

from langchain.vectorstores import Chroma

from langchain.embeddings import HuggingFaceEmbeddings

from transformers import AutoTokenizer, AutoModelForCausalLM

# 加载向量数据库

embeddings = HuggingFaceEmbeddings(model_name="sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2")

db = Chroma(persist_directory="knowledge_db", embedding_function=embeddings)

# 加载DeepSeek模型

tokenizer = AutoTokenizer.from_pretrained("deepseek-model")

model = AutoModelForCausalLM.from_pretrained("deepseek-model", device_map="auto")

# 检索增强生成

query = "XX科技的核心业务是什么？"

docs = db.similarity_search(query, k=1)

context = docs[0].page_content

prompt = f"基于以下信息回答问题：{context}\n\n问题：{query}"

inputs = tokenizer(prompt, return_tensors="pt").to(model.device)

outputs = model.generate(**inputs, max_new_tokens=200)

print(tokenizer.decode(outputs[0], skip_special_tokens=True))

```

---

### **三、注意事项**

1. **硬件要求**

- 至少16GB内存，推荐使用NVIDIA显卡（8GB+显存）。

- 若显存不足，可在加载模型时设置 `device_map="cpu"` 或使用量化版本。

2. **模型选择**

- 如果显存不足，可尝试较小模型（如 `deepseek-1.3b`）或量化版本（加载时添加 `load_in_4bit=True` 参数）。

3. **知识更新**

- 新增知识时，重新运行 `rag_setup.py` 更新向量数据库。

4. **高级微调（可选）**

- 如需深度定制，准备JSON格式数据集，使用以下代码微调：

```python

from transformers import TrainingArguments, Trainer

training_args = TrainingArguments(

output_dir="output",

per_device_train_batch_size=4,

num_train_epochs=3

)

trainer = Trainer(model=model, args=training_args, train_dataset=dataset)

trainer.train()

```

---

通过以上步骤，您可以在Windows 11上部署DeepSeek模型并为其投喂专业知识。RAG方法无需训练即可快速集成新知识，适合大多数场景。

扫描二维码推送至手机访问。

本文链接：http://www.dgx666.com/post/1180.html

标签: office2010 toolkit

分享给朋友：

返回列表

上一篇：微软决心移除 Windows 中已用 27 年的旧技术，VBScript 走向末路!

下一篇：那些年我们用过HTML5开发工具（html5开发工具哪个好）

“Windows 11上部署本地DeepSeek模型并投喂知识的详细流程” 的相关文章

AMD AFMF驱动级帧生成将迎2.1版本:提高帧质量，硬件要求不变

IT之家 2 月 25 日消息，外媒 VideoCardz 北京时间昨日深夜表示，AMD Fluid Motion Frames（AFMF）帧生成技术将迎来 2.1 版本，可在硬件要求不变的同时提升生成帧的画面质量。AFMF 是一项驱动级帧生成技术，与英伟达推出的类似功能 Smooth Motion...

AutoCAD 软件介绍、软件安装

第一章 AutoCAD入门必读本章目标& 了解AutoCAD的含义、应用领域及发展历程& 实操软件安装与注册& 掌握界面组成及应用& 掌握命令操作方法& 熟记选取图形的几种方式并应用& 实操坐标输入与动态输入内容讲解：第1天——兴趣启发，原来黑底白线的CAD可以这样有意思。今天，展英飞来找老师补习功...

2014CAD激活后闪退，解决方法

之前在电脑上安装了一个CAD软件，是2014版的，平时用的很少，用的时候打开用用。昨天有个文件需要用CAD软件打开，提示需要激活，然后我在网上下载了一个激活工具，按照操作步骤，最终是激活成功了。我再次打开软件的时候，快到打开界面的时候直接退出了，试了好几次，都是这种情况，我搜索了一下，还真有人也遇到...

CAD入门基础内容

CAD制图会有入门和中高级之分，一开始要有很多知识点要记，但很多刚开始学的小伙伴可能还不了解，下面是我就来介绍一下CAD入门基础内容，希望大家能有所收获！打开CAD2007绘图界面，点击“绘图”，在下拉菜单中选择“点”。然后选择“单点”，命令窗口中将出现“指定点”的命令，在绘图界面中可以绘制单点。绘...

CAD2007怎么安装?CAD2007中文版的安装教程

CAD2007是很多从事建筑设计，尤其是结构设计最经常使用的一款专业绘图软件。不少网友下载了CAD2007安装包之后，却不会安装CAD2007，因为他下载的CAD2007的英文版，而一些网友下载了CAD2007中文版的网友，却因为不是在NET2.0以上的安装环境而安装失败。今天，小编就给大家演示一下...

怎么把备忘录放桌面怎么在桌面显示备忘录便签里的内容

手机上自带的备忘录app是很多人都使用过的一款软件，以iPhone为例,自从iOS系统升至iOS14版本以来，就新增了桌面小组件功能。为了方便自己的使用，提高查看内容的效率，怎么把备忘录放桌面？怎么在桌面显示备忘录便签里的内容？要想在iOS14及以上版本的iPhone手机桌面上摆放备忘录很简单，首先...

第六芝士网

Windows 11上部署本地DeepSeek模型并投喂知识的详细流程

“Windows 11上部署本地DeepSeek模型并投喂知识的详细流程” 的相关文章

AMD AFMF驱动级帧生成将迎2.1版本:提高帧质量，硬件要求不变

AutoCAD 软件介绍、软件安装

2014CAD激活后闪退，解决方法

CAD入门基础内容

CAD2007怎么安装?CAD2007中文版的安装教程

怎么把备忘录放桌面怎么在桌面显示备忘录便签里的内容

滇ICP备2024046894号-17