自存一些笔记

张

张建站

2026/6/6 7:17:03

10分钟阅读

1.vllm部署方式windows对vllm的支持不太好可以选用wsl2dockerlinux系统三者之一这里选用linux2.WSL是什么Windows Subsystem for Linux———一个轻量级 Linux 子系统你需要 Linux 环境但电脑是 Windows。而 WSL2 就是目前 Windows 上跑 Linux 的最佳方案。3.Ubuntu是什么Ubuntu是一种基于Linux的免费、开源的操作系统我们可以在计算机或虚拟专用服务器上使用Ubuntu。Ubuntu具有图形用户界面GUI使其类似于其他流行的操作系统如Windows。操作系统将应用程序表示为图标或菜单选项我们可以直接对其进行操作。4.为什么安装WSL要安装Ubuntu必须安装一个 Linux 发行版WSL 才能使用而 Ubuntu 是比较好的选择5.为什么要用VLLM部署模型vLLM 是一个高效、易用的大语言模型LLM推理和服务框架优化推理速度和吞吐量尤其适合高并发的生产环境5.1 VLLM缓存优化1传统的KV Cache管理方式大模型计算复杂度最高的就是自注意力QKV的计算如果每输出一个字符都要从头计算的话成本太高所以可以把中间阶段的K和V值存入缓存这就是KV Cache。传统KV Cache是直接分配一段物理显存这段物理显存随着prompt变长和输出序列变长会不断增长更糟糕的是由于输出序列长度无法预测无法为KV Cache量身分配大小导致大量显存浪费。2vllm的改进-PageAttention在显存上分配一块固定大小的连续空间vllm中默认为16类似于内存页多个进程运行时可以每个进程分配自己的虚拟内存虚拟内存通过块表block table关联到内存页只有进程内存不足时才会请求增加每次增加一个内存页最坏的结果就是最后一个内存页没写满.这种方式显存的利用率能达到96%

避开这些坑！STC8H硬件IIC调试经验与常见问题排查指南

STC8H硬件IIC调试实战：从波形分析到寄存器配置的深度排错指南当你在深夜调试STC8H的硬件IIC接口时，是否遇到过这样的场景：所有寄存器配置看起来都正确，但逻辑分析仪上的波形就是不对劲？作为一款在国内嵌入式领域广泛应…...

2026/5/25 19:43:39 阅读更多 →

【立体视觉（五）】之SGM算法：从代价聚合到视差优化的实战解析

1. SGM算法为什么能成为立体匹配的标杆？ 我第一次接触SGM算法是在2016年做自动驾驶项目时，当时试遍了各种立体匹配方法，最后发现还是SGM的效果最稳。这个由Hirschmller在2005年提出的算法，至今仍是工业界的首选方案，特…...

2026/5/26 7:32:53 阅读更多 →

3分钟快速上手：魔兽世界GSE高级宏编译器的终极完整指南

3分钟快速上手：魔兽世界GSE高级宏编译器的终极完整指南【免费下载链接】GSE-Advanced-Macro-Compiler GSE is an alternative advanced macro editor and engine for World of Warcraft. 项目地址: https://gitcode.com/gh_mirrors/gs/GSE-Advanced-Macro-Compi…...

2026/5/24 7:16:58 阅读更多 →

AI辅助创作的临界点已至（2024全球创意工作者生产力白皮书核心发现）

更多请点击： https://intelliparadigm.com 第一章：AI辅助创作的临界点已至（2024全球创意工作者生产力白皮书核心发现） 2024年，全球创意产业迎来关键拐点：AI不再作为边缘工具，而是深度嵌入创意工…...

2026/6/4 2:47:58 阅读更多 →

双稳态核心记忆架构：解决人工智能长期上下文断裂的极简底层范式

双稳态核心记忆架构：解决人工智能长期上下文断裂的极简底层范式开源声明本文完全开源、无版权限制、公开通用，允许所有开发者、科研机构、技术团队无偿引用、落地、迭代、二次开发，助力人工智能长期记忆体系技术革新。作者：杨建…...

2026/6/4 4:33:24 阅读更多 →

单片机IIC实验

单片机 ：STM32F407 开发板：DMF407电机开发板平台：keil V5.31HSE 为8MHZ HSI为16MHZ原理图：主函数：int main(void) {uint8_t key;uint16_t i 0;uint8_t datatemp[TEXT_SIZE];HAL_Init(); …...

2026/6/3 16:15:35 阅读更多 →