你好! 我是阿男👋
在这里我会分享独立开发、DevOps、容器化和 AI 辅助开发的实践经验,用代码解决生活里的真实问题。
近期博客
查看更多L40S 大模型部署实录④:160 道题考三个大模型,赢家出乎意料
跑得最快的模型,长文本全部超时。参数最多的模型,总分垫底。最终胜出的是参数最少的那个——76.6% vs 69.7% vs 69.1%。这篇记录 160 道题、6 个维度的完整评测过程,以及为什么"参数大 ≠ 质量好"。
L40S 大模型部署实录③:同一张卡跑三个模型,速度差了 8 倍
Qwen3.5-27B:18 tok/s。Qwen3.6-35B:11 tok/s。gemma-4-26B 双卡:93 tok/s。同样是 L40S,模型选错速度差 8 倍。这篇用真实测试数据告诉你,哪个模型值得你的 GPU 时间。
L40S 大模型部署实录②:48GB 显存塞两个模型——7 个让我崩溃的坑
Free memory: 0.41 GiB。这是我第一次尝试在一张卡上跑两个模型时,vLLM 启动日志里的数字。然后它 crash 了。从第一次 OOM 到三组模型稳定运行,中间经历了 7 种不同的失败姿势。这篇是完整的踩坑记录。
L40S 大模型部署实录①:单卡 48GB,能跑多大的模型?
单卡 L40S,48GB 显存。公司给了一台 EKS GPU 节点,有 3 张 L40S 可用,每张卡独立部署一个模型做横向对比。目标:找出单卡 L40S 上跑 27B-35B 大模型的最优方案。最终结论——Qwen3.5-27B-FP8 单卡 18 tok/s,96% 显存利用率。这篇记录从零搭建的完整过程。
日均开发实录⑤:SwiftUI + SwiftData 实践笔记
日均的技术栈很简单:SwiftUI + SwiftData,纯 iOS 原生开发。没有后端,没有第三方依赖,数据通过 iCloud 同步。
日均开发实录④:小红书 + App Store 的获客漏斗——211 次下载背后的故事
日均上线后的前两周,我没花一分钱投广告,累计获得了 211 次下载。
个人特点
独立开发者
用 SwiftUI + SwiftData 做 iOS App「日均」,从产品定位、设计系统到 App Store 上架,一个人完成全流程。相信好产品来自克制,不是功能堆砌。
DevOps 实践者
日常工作在 Docker、Kubernetes、GitLab CI/CD 的世界里。擅长离线环境部署、容器化改造和自动化流水线搭建,用工程化思维解决运维问题。
AI 辅助开发探索者
用 AI 工具提升开发效率,探索人机协作的边界。3 小时用 AI 重构整个网站不是噱头,是真实的实践记录。