第6页谢先斌的博客
-
Java Hutool 使用介绍
Hutool 是一个小而全的 Java 工具类库,通过静态方法封装,降低相关 API 的学习成本,提高工作效率,使 Java 拥有函数式语言般的优雅
-
Java Lombok 自动生成 Java 样板代码
Project Lombok 是一个 Java 库,它通过注解的方式,在编译期自动生成 Java 类的样板代码(boilerplate code),从而极大地简化了 Java 类的编写,提高了开发效率和代码的可读性。
-
LVS/IPVS 高可用的负载均衡实现介绍
LVS (Linux Virtual Server)是一个基于 Linux 内核的高性能、高可用的负载均衡解决方案。它通过将客户端请求分发到后端一组真实服务器(Real Servers)来工作。 -
SSE 介绍
SSE(Server-Sent Events)是 HTML5 规范中的一种技术,允许服务器通过 HTTP 协议主动向客户端(如浏览器)推送数据。它基于单向通信模型(服务器 -> 客户端),适用于需要服务器实时更新数据的场景(如新闻推送、实时监控等)。2025-05-11 http/https http,sse,websocket,js,ts,javascript+2 -
Redis 主从高可用集群
Redis 主从高可用集群搭建
2025-05-05 redis redis,keepalived,master,slave -
vLLM 介绍与使用
vLLM 是一个用于大型语言模型 (LLM) 推理加速的开源库,它以其卓越的性能和易用性而闻名。vLLM 的核心优势在于其创新的PagedAttention算法,该算法有效解决了传统注意力机制在处理长序列时内存碎片化的问题,从而显著提高了吞吐量和降低了延迟。
2025-05-04 ai ai,model,LLM,vLLM,PagedAttention,DynamicBatching+2 -
Unsloth 介绍
LLM 的微调与强化学习。 使用更少的 70% VRAM,将 OpenAI gpt-oss、DeepSeek-R1、Qwen3、Gemma 3、TTS 的训练速度提高 2 倍。
-
阿里云 BladeLLM 推理引擎
BladeLLM 是一款专为大语言模型(LLM)优化的推理引擎,旨在提供高性能的模型部署服务。面对 LLM 领域不断涌现的新机遇与挑战,BladeLLM 通过其先进的技术架构、友好的用户体验和卓越的性能表现,成为企业用户部署和推理 LLM 模型的理想选择。
-
PyTorch 卷积神经网络示例
本文详细介绍如何基于 PyTorch CPU 构建一个卷积神经网络 (CNN) 来对 CIFAR-10 图片进行分类。
-
Huggingface cli 命令行工具使用
HuggingFace_Hub Python 软件包带有一个名为
huggingface-cli的内置 CLI,支持用于通过命令行与 Hugging Face Hub (Hugging Face 模型和数据集的中心仓库) 进行交互2025-05-02 ai ai,huggingface -
GGUF 大模型文件格式及 LLM 模型量化类型介绍
GGUF(GPT-Generated Unified Format)是一种二进制格式文件的规范,原始的大模型预训练结果经过转换后变成 GGUF 格式可以更快地被载入使用,并消耗更低的资源 -
mongodb 8.0 集群部署
使用 docker-compose 部署 mongodb 8.0 集群部署
-
llama.cpp 介绍
使用 C/C++ 的 LLM 推理
-
n8n 原生支持 AI 的工作流平台
n8n 原生支持人工智能功能的工作流程自动化平台,它支持可视化构建与自定义代码、自托管或云、400 多个集成工作节点相结合
-
blackbox_exporter: prometheus 黑盒探测程序
blackbox_exporter是一种 prometheus 实现的黑盒探测程序,允许通过 HTTP、HTTPS、DNS、TCP、ICMP 和 gRPC 对端点进行黑盒探测。2025-04-13 monitor linux,prometheus,blackbox_exporter -
Influxdb v3.x 介绍
InfluxDB 3 Core 是 InfluxDB 3 的开源版本
-
logger 命令
logger命令用于将 Linux 日志写入系统日志 -
Nginx mirror 流量复制模块
nginx
ngx_http_mirror_module模块(自 1.13.4 实现)通过创建后台镜像子请求(mirroring of an original request)来实现原始请求的镜像,镜像子请求的响应将被忽略。2025-04-04 nginx nginx,mirror,limit_except -
gorm-paginate 基于 gorm 的分页插件
gorm-paginate 基于 gorm 的分页插件,支持分页,条件搜索,排序等
2025-03-30 open-sources open-sources,golang,gorm,paginate -
chroma 向量数据库介绍
Chroma 是一个开源的向量数据库,专为机器学习和大语言模型(LLM)应用设计,用于高效存储、检索和匹配高维向量数据(如文本、图像等嵌入向量)。