Jack的个人测试网
一个人的技术学习与实验记录

这里是我业余时间的技术折腾笔记
记录学习、踩坑和一些小实验

我是一名喜欢动手的开发者,平时对人工智能、语音、物联网、计算机视觉这些方向都挺感兴趣。这个站点用来整理我自己学习过程中的笔记、跑过的小 Demo,以及一些零碎的想法。

内容大多是边学边记,可能不严谨,纯属个人兴趣,欢迎一起交流。

本站为个人学习 / 测试用途的非经营性网站

最近在折腾什么

业余时间断断续续做的几个练手小项目,纯学习目的。

🎙️

实时语音翻译小实验

试着把语音识别、翻译和语音合成串起来,做了个能边说边出译文的小 Demo,顺便研究了下延迟和断句的处理。

ASR · 翻译 · TTS
🔌

给小板子写后端

买了块 ESP32 玩,自己写了个简单的后端服务跟它通信,折腾了 MQTT、WebSocket,还顺手研究了下语音唤醒。

ESP32 · IoT · WebSocket
📚

检索问答(RAG)练手

把一堆自己的笔记喂给向量库,做了个能"问文档"的小工具,体会了下切分、召回和流式输出这几步的坑。

RAG · 向量检索 · LLM
💬

多人聊天室 Demo

用来练习实时通信的小玩具,多个人进一个房间收发消息,主要是想搞明白 WebSocket 的连接管理和房间状态。

实时通信 · 房间管理

这些年折腾过的方向

从学生时代到现在断断续续摸过的一些技术领域,大多是兴趣驱动、边学边做的练手项目,按方向大致归个类。

🗣️

语音与对话

对"让机器听懂并开口说话"这件事很着迷,试过把语音识别、翻译、语音合成串成实时管线,也做过多人语音房间和语音助手的小玩具。

语音识别实时翻译语音合成语音对话 Agent
🔌

物联网与嵌入式

喜欢买各种小板子回来折腾。写过给 ESP32、树莓派用的后端服务,研究过 MQTT、串口通信和一堆传感器模块,做过能联网说话的小音箱。

ESP32树莓派MQTT串口 / 传感器
🚁

飞控与地面站

对无人机和遥控设备很感兴趣,研究过 MAVLink 通信协议,自己写过简单的地面站界面,也玩过云台 / 摄像头的控制和画面传输。

MAVLink地面站 UI云台控制视频流
👁️

计算机视觉

用 OpenCV 和一些模型练手,做过图像里的缺陷 / 测量、文字 OCR 识别,还研究过基于物理模型的颜色测量与配色,挺有意思的小课题。

OpenCV缺陷检测OCR颜色测量
🧠

大模型应用

大模型火起来之后跟着学,做过 RAG 检索问答、对话 Agent,也试过让模型把一段自然语言整理成结构化的数据,体会了不少 prompt 和工程上的坑。

RAG对话 Agent结构化抽取Prompt
🧰

全栈与小工具

为了把上面这些 Demo 跑起来,前后端都得自己来。常用 React / Vue 写界面,FastAPI / Node 写后端,偶尔用 Docker 打包,做点自用的小工具。

React / VueFastAPI / NodeDocker自用工具

一些零碎笔记

学习过程里随手记的东西,主要给自己回顾用。

关于我 / 联系方式

就是个普通的技术爱好者,喜欢在业余时间瞎折腾点东西。这个站点纯粹是个人用来记录和分享学习心得的地方,不涉及任何商业用途。

邮箱jackli@hotmail.co.nz

关于个人 · 非经营性 · 仅代表个人观点