阿呆的blog

2026年6月1日

IPCAMM NVR - 前導篇

前言:

前面在寫ONVIF Client Lab時提到，在開發ONVIF相關的Side Project，其實就是NVR。
我回看PRD日期，最早大概從2026-03-21開始，也就是3月底左右，到現在2026-06-01，約2個多月的時間，有空閒就開發它，目前推測進度大概70%左右。
因為好一段時間了，雖然還沒有成果，但我想可以先把目前的規劃、實做進行描述。
因為架構比預期大，之後打算用Gitlab Page或Wiki讓AI撰寫系統架構、設計、Models之類的。

發想:

首先，這個NVR預計會是雙授權型式，AGPL與Commercial。
對的，AGPL開源與商用雙授權。
AGPL允許在不改程式碼的情況下，或者開源的情況下可以修改與使用，甚至以安裝方式提供商用服務，唯一要求就是開源。
Commercial，提供商用，但我還沒想清楚到底怎麼商用法。
會特別提的原因是，程式碼是開源的，但上面包括License設計和實做，對的，你沒看錯，程式碼開源還包括License設計與實做在裡面 😆，這在看到時可能覺得疑惑，怎麼要註冊，但是又有程式碼，授權又是AGPL。

我第一份工作就是NVR，負責Linux平台和整合，對NVR有設計的遺憾。
我原本以為自從中國成為監控大國之後，監控產業大概都趴了，在上幾份工作時寫停車場系統才發現，NVR對於公司竟然還是香噴噴的，因此，AI開發計畫中，就有NVR在裡面。

NVR完成後不會是這個Side Project的結束，後面會延續進一步推進Analysis Service以及GIS Service，最終目標是做出Dashboard，能像之前美國國防部記者會時的操作界面，有個地圖(戰場/非戰場)會有圖釘標示哪裡有攻擊(事件)，滑鼠移動過去後點擊，會出現當時的影片片段。

當然，無人機這麼熱，不湊熱度說不過去，對吧。

設計規劃:

這次實做花很多時間的原因是，設計的架構比預期大和複雜。

後端系統以微服務設計，分為4部份：

Streammer: 接Camera串流、分發串流
Recorder: 錄影寫檔案
Manager: CRUD服務，REST API和資料管理
Gateway: 前端應用程式的對接口，後端接Streammer、Recorder、Manager

微服務的底層設計邏輯是，各自處理各自的事務，所有事務獨立，體現在幾個點：
調Record、查Record Status、Disk Status，都由Recorder處理
Camera介接、串流，都由Streammer處理
DB設定更新、CRUD API，都由Manager處理
和Client對接，Client的Protocol轉換，StreamBus -> WebSocket、gRPC <-> WebSocket、Manager反向代理，都由Gateway處理

主要設計邏輯和核心協定：

微服務(Streammer、Recorder、Manager、Gateway)間透過3個主要協定通訊：

gRPC: REST API與WebSocket類的API，Playback的串流都透過gRPC傳輸
自定義的StreamBus Protocol: RTSP串流的訂閱轉發通訊協定
MQTT Protocol (EventBus): Event的訂閱轉發協定使用MQTT為基底

各個微服務設計特點：

Streammer：

Streammer主要功能是轉發，包括串流和Event(事件)，串流轉發使用StreamBus，Event轉發使用EventBus。
Streammer串流轉發的設計受到Publish/Subscribe設計和mediamtx影響，當然還有AI的建議，Streammer內部使用c#的Channels實做，但額外設計3種對外接口，分別是Named Pipeline、TCP、UDP，Streammer內的串流擴展可直接在內部透過StreamBus實做模塊擴展，Streammer外可以透過TCP、UDP、Named Pipeline串接，Gateway與Recorder就是用外部串接方式和Streammer對接。
Streammer Event轉發使用MQTT為基底，設計上，本身是MQTT Server，也可以用外部MQTT Server，Event則透過MQTT推送到MQTT Server上。
Streammer有gRPC Service服務，主要用於傳入CMD，例如：ReloadCamera，gRPC有Event Trigger API，但Event Trigger透過MQTT注入更方便，兩種都有設計，主要透過MQTT。

Recorder：

Recorder主要功能是錄影寫檔案。
但因為以前整合時吃了太多磁碟IO的虧，Recorder核心設計包括IndexCache、RecCache以及IOWorker。
Recorder包括3個Cache，Playback用的錄影檔案Cache，Index讀寫的LRU Cache，預錄影的RingBuffer Cache。
Recorder在Cache下層寫入磁碟時，會透過IOWorker Pool，IOWorker能在appsettings.json內設定同時的Read IOWorker數量、Write IOWorker數量，所有IO都透過IOWorker Pool動作。
Recorder設定時指定多個實體路徑寫入，透過Consistent Hashing(一致性哈希)平均分散資料到實體路徑內。
保留軟體RAID(Erasure Code)實做設計。

Manager：

Manager提供CRUD，Camera的增/刪/查/找，使用者登入認證都在這裡。前端應用程式的API，主要都是對Manager。有個比較特殊的，ONVIF Discovery是在Manager觸發和搜尋。
目前設定都透過DB儲存，原則上至少支援SQLite和PostgreSQL，Microsoft SQL Server有支援，但問題在於，c# SQL Server的SQLClient目前不完全支援AoT。

Gateway：

Gateway顧名思義，是入口。Client端連入會是透過Gateway，Web版的網站程式也會放在Gateway。
Gateway對Client就2個協定，WebSocket和REST API，REST API主要是反向代理到Manager，其他都透過WebSocket，像是Streammer的StreamBus，StreamBus -> WebSocket，Recorder的gRPC API，WebSocket <-> Recorder gRPC API。

認證有2組：

使用者的認證以及微服務間的認證。
使用者認證就是透過Manager的Auth API進行認證後拿到JWT，然後後續不論是WebSocket或是其他REST API都透過這組JWT。
微服務間的認證，在每個服務的appsettings.json內會有個Internal API Key，要填入相同的密碼，服務間的gRPC會用Internal API Key加密Timestamp後送出，另一端會用Internal API Key解密，並判斷Timestamp是否在一段時間內(是的，每個服務所在的電腦，要對時，我記得會查30秒內吧)。

License設計：

License會以線上登錄序號的方式，登錄註冊後提供license.lic檔案，放入系統中作用。
目前這段細節我還沒想清楚，目前考慮鎖在Streammer就好，但考慮到叢集多電腦微服務運作，我還沒完全想清楚授權怎麼處理。
License預設會有2種，一種是已經完成的license.lic，另一種是USB License Key的形式，不論哪種，核心加密都使用AES + ECDSA簽章。

使用者和群組設計：

DB中，包括幾個跟User有關的Table，包括users, groups, permissions這3個主要的Table以及用於Mapping group和permission的group_permissions Mapping Table。
權限可以概略分2類，1類是NVR操作的使用者權限，一類是MQTT的服務權限。
包括NVR類的：nvr_admin, nvr_power_user, nvr_user, nvr_viewer
以及MQTT類的：mqtt_admin, mqtt_rw, mqtt_ro

權限會對應到group，因此Group包括：
admins, power_users, users, operators, mqtt_services, mqtt_clients

每個使用者都屬於特定1個群組，但群組可以包括多種權限。
直接的體現是，admin這個使用者是admins群組，admins群組的帳號可以同時登入MQTT Server和NVR Client，同樣的道理，mqtt_services群組的成員，只能登入MQTT Server，NVR Client是不能登入的。

Client設計：

Client應用程式預計為跨平台，會先提供Linux版和網頁版，使用UNO Platform開發。

AI規劃：

設計階段就在想，既然是全新開發NVR，那有沒有什麼新的想法能夠引入?
尤其是AI，既然AI這麼熱門，到底使用者對於AI的想像是什麼? 如何引入?
在和AI討論後，目前想定的設計分2塊，NVR階段的以及Dashboard(中控)階段的。
我對AI之於應用程式的想像是這樣，我要如何如何時，直接跟AI說或對話，AI直接幫我處理，以及AI能夠跟我說發生了什麼事情。
也就是說，延續監控產業的一脈路線，什麼是監控產業的一脈路線?
從最傳統的能錄影 -> 能根據時間調出錄像 -> 有Event -> 能智能的根據Event主動通知

那麼，當進入AI時代後，我對這一脈路線的想定是，Event的通知對象不再是人，而是AI，由AI主動分析Event，並提供給人狀況、建議行為。

因此，我把AI規劃分為低階跟高階，高階放在Dashboard(中控)，低階下放在NVR內。
NVR內放的AI，能夠根據文字窗口給與指示，
例如：
給我看第三支Camera目前畫面。
播放第2支Camera昨天下午3:00的錄像。
幫我看看，這兩天有哪些Camera斷線過?

而高階的，則能夠根據Event進行細部推斷，
例如：
目前分析系統偵測到大廳有多人聚集，或者大廳人數眾多。

而兩者差異體現在2塊，1個是AI的智能程度，NVR原則上用的就指令遵循型，能夠提供Live、Playback的自動化操作，而Dashboard(中控)的，就可能需串接雲端，提供目前過往的Event資訊，或者觸發Event時打到雲端AI，讓雲端AI能有完整的Event進行判斷。

我們更白話的說，AI的判斷能力，取決於我們給哪些Event + AI的智能程度，低階的做單純的UI操作，不具備分析，高階的能獲得更多Event訊息，並能深入分析。

目前NVR階段，已能在UNO Platform上面透過按鈕觸發特定連續頁面操作。

Client實做進展：

目前已實做和串接部份，錄影進度條已經能正常顯示，Event能正常顯示，Device清單能正常顯示，錄影狀態串接中。
Device Search功能正常，但UI還需優化，Schedule UI和設定正常。
PTZ能夠功能正常，UI還需優化。
影像部份，Linux版本Live有畫面，但穩定性還有問題。

Client截圖：

2026年5月3日

Dell Wyse 3040 - Debian 13 Read-Only Rootfs設定

前言：

買了一台二手雷射事務機，因為不帶網路，打算找個小機器當列印伺服器。列印問題其實不大，但事務機的麻煩是掃描，掃描通常驅動程式要原廠提供，

而事務機基本上只提供x86/x64的驅動程式，不太會有ARM的版本。很久前我為了這事情我弄了個Intel-Galileo，結果從來沒成功用上那台就壞了，現在連維修料件都沒庫存了。不過時代不同了，現在有ThinPC可以買，又有淘寶可以淘，價格今非昔比，小主機的硬體效能和相容性也和Intel-Galileo不能比，因此找了Dell Wyse 3040。 (Intel-Galileo是Intel Pentium魔改，x86 32-bits，Debian 13不再提供x86 32-bits支援了)

硬體簡介：

Dell Wyse 3040 CPU是Intel Cherry Trail x5 Z-8350，

Intel Cherry Trail x5 Z-8350是手機用的CPU，因此具有一些特色：

電源是5V
內嵌Ethernet是Realtek r8168
界面是SD

儲存是eMMC
WiFi是特規SDIO WiFi

不過它有標準的USB2.0和USB3.0，可以接USB WiFi。

緣由：

這台的eMMC很慢，存取跟樹莓派差不多速度，這台又是用在列印伺服器，希望斷電可靠度好些。

因此在Debian 13上面設定Read-Only Rootfs，也就是OverlayFS。

設定：

按照一般方式安裝和設定Debian 13，接著

# apt install overlayroot

修改 /etc/overlayroot.conf

最後面加上

overlayroot="tmpfs"

PS: 如果希望只有rootfs是read-only，參數用：

overlayroot="tmpfs:recurse=0"

接著修改

/usr/lib/systemd/system/systemd-remount-fs.service

加上如下：

[Service]

Environment=LIBMOUNT_FORCE_MOUNT2=always

再來重新開機就可以了。

2026年4月19日

AI超人之ONVIF Client Lab

前言:

最近興趣在寫這東西，想說這不是老黃曆了嗎，但沒關係，就自己用AI尻尻看。
目前進度約4~5成，還早，但這幾個有趣的過程可以貼。
ONVIF Client完全免費並開發友善的其實就SharpOnvif，最難得的是，作者目前非常熱血，更新頻率很高，支援的ONVIF Profile也非常完整，License是MIT，相當佛。

緣由：

我希望有個AOT-safe、License Free的ONVIF Client，C/C++或c#都可以，結果發現非常難找，C/C++幾乎沒有，原因是ONVIF官方網站與SOAP幾乎都推薦gSOAP，這是正確的，但gSOAP是雙授權，明言GPLv2/Commercial，產生的程式碼也是，要嘛付費給它解鎖，否則就是GPL，這種寫明授權的做法，就是開源商業化。
c#反而友善，Microsoft的svcutil沒有授權問題，但這個有年代了，使用的是依靠反射的WCF和XmlSerializer，設計聰明，但如果AOT-safe會更好。
於是，在繼mediasdk_h264/h265_parser之後，我讓Claude-Code嘗試看看。

成果：

Sharp ONVIF Lab

過程：

我讓Claude-Code(GLM-5.1)分析SharpOnvif，然後實際用svcutil產生Reference.cs讓它分析和修改，發現這條路不太對。
接著我讓它用gSOAP Binary透過WDSL產生C/C++程式碼，然後發現，它產生的程式碼全都是GPL，並且官方網站寫明了授權方式。
我詢問WDSL到底是什麼？它跟我說了個xsd.exe工具(咦?)。

然後我想想，AI你為何要改生成的東西，能否自己用xsd工具產生Model，我們自己寫API？

然後我找到xsd.exe和xscgen，讓它分析xsd.exe和xscgen，讓它xscgen執行看看，試看看能不能用WSDL產生出Model，這些Model能不能用？

Claude-Code(GLM-5.1)在嘗試後非常篤定的跟我說，沒問題，Client加上去就可以了，而Client它會寫(儘管我還是讓它參考了SharpOnvif)。

然後它就寫好了。😲

雜談：

上面的過程像是念經😂，其實描述了我最近發現AI的互動方式有些變化(或者說新的用法？)，AI分析程式碼的能力和速度遠比人類快得多，這可能是因為AST加上Model更強了的雙重因素，但目前的高階推理模型已經可以根據你給它的需求分析整個程式碼，並且給出它和你需要的部份，並且判斷和抽取出程式碼內容，這已經不是半年前給它一個專案，它給出專案概述和描述分析這麼簡單，而是它已經有能力判斷出這份東西裡面有沒有完成任務需要的內容，而且能夠篤定的跟我說有/沒有，可以/不可以，可行/不可行。

要知道一點，上面列出的，每一個都是一份完整專案和程式碼，資深工程師如果領域內的，要拆解可能也要一些時間，領域外的可能找入口就要2~3天，但AI已經能夠根據你給的需求，分析這個專案程式碼是否有可以用的程式，或者直接執行並分析執行結果，搭配程式碼分析，給出如何做？能否用？😲

AI超人之影像編/解碼器 (H264Parser, H265Parser)

前言:

最近在寫H264和H265的硬體編碼解碼器程式。
發現在Linux選項不多，只有FFMpeg的libav、GStreamer，但我想找授權乾淨的(無GPL、Library GPL)，並且支援VA-API的，於是就試著讓AI寫看看。

成果：

MediaSDK H264 Parser

MediaSDK H265 Parser

過程：

我要求Claude-Code(GLM-5.1)參考OneVPL(MediaSDK)，並要求它直接抄OneVPL(MediaSDK)，跟它說，它的授權是MIT，不用擔心，但你盡量不要自己實做，以它寫的為準，做法是，複製它的程式碼後，修剪。

最終完成品，就是成果的程式碼。

我在使用時，還有發現bug，所以我無法保證沒有bug，目前H265解碼時會間歇性出現灰畫面，但我在交叉使用ffplay時有些來源也會這樣，我還無法準確判斷是影像來源問題，還是它實做的有bug，但以完成度、穩定度來說，基本上沒問題。

雜談：

先前看到新聞說Claude Opus能夠參考並實做出程式語言編譯器，GLM-5.1雖然能力差一點，但基本能夠超越Opus的上一代，弱於這一代。
這次讓它直接參考並抄寫、改寫、修改OneVPL(MediaSDK)，並且成功重構出mediasdk_h264_parser和mediasdk_h265_parser，以程式碼分析與修改能力而言，我認為能力已經超越我了，因為我自己看和分析，是無法做到的，要知道，OneVPL可以一路追朔到Intel IPP，裡面程式碼龐大且經過多年迭代 + 重構，加上是根據H264, H265 Spec. 實做的，基本上有特殊的Domain專業以及複雜的程式脈絡，但Claude-Code已經能夠分析、拆解，並根據功能抽取和改出需要的程式碼，再組出Library，非常強大。😲

2026年3月22日

碼農二三事之加密~JWT

前言:

在我百寶箱中，JWT不常用，但幾乎每個實做都用了，因為JWT基本上已經嵌入在.NET中開箱即用了。😁

說明：

我一般會形容JWT是鑰匙，你通過了認證並授權後，就發給你一把鑰匙，拿著鑰匙就有權限進行操作，這把鑰匙可以有時效，也可以沒有時效，端看需求。

JWT是標準，有標準格式，它標準格式分成3段，每段用.隔開，第二段和第三段是重點，第二段放了所有資訊，JWT標準中規範了必要和可選的資訊，必要的包括sub(subject), iss(issuer), exp(expired), nbf(NotBeFore), iat(IssueAt)。

其中必要中的必要是exp，這個標記了JWT的到期時間。

JWT沒有明確規定時間是哪種Timestamp，但一般用UTC。

第三段則是第二段的簽章，用加密算法把第二段用特定密碼算一個簽章放第三段，因此第二段 + 密碼計算簽章後，必定等於第三段，如果不等於，就是被竄改了。第三段的JWT規範是BASE64。

目前的登入Token，幾乎都用JWT，.NET c# 直接做好JWT中間件，套用即可，基本上是業界標準了。

JWT的第二段資訊顯然是關鍵，第二段資訊稱為Payload，是json用BASE64編碼後的字串。

這裡畫重點，是BASE64編碼後的字串，這表示它沒有加密，JWT不具備加密功能，只具備簽章功能，能夠驗證JWT是否合法沒被竄改，而根據合法JWT，則可以判斷是否過期，並根據sub(Subject)判斷持有者是不是本人，根據iss(Issuer)判斷簽發者是不是授權簽發者。

好～說完了～但JWT故事還沒結束，有沒有特殊用法？

特殊用法：

既然我們知道JWT是根據第二段的Payload紀錄資訊，Payload本身是json，那我們完全可以自行設計非標準的JWT格式，對吧！？

在c#/Java中，我們只需要建立一個Model，我一般取名為AuthToken，裡面參考JWT放入sub,iss,exp,iat,nbf。

使用時

var token = new AuthToken() {

sub = "{user}",

iss = "{BestServer}",

exp = now + 1440 timestamp,

iat = now timestamp,

nbf = now - 5secs timestamp

}

var SpecifyJWT = AESCipher.Encrypt(token.toJson());

打完收工。

當然，檢查一樣，反過來，先用AESCipher解密，接著依序檢查 exp, nbf 。

一個具有加密效果的AccessToken就完成了，如果原本用c# JWT中間件，那只要實做一個自己的中間件替換上去，就完成高強度客製化的認證Token設計了。

JWT用法：

實務上，我常用JWT系列，因為它是分散式的，不受限Session，任何後端都能檢核。

但它可以有幾種變種：

後端統一用一台認證服務簽發和檢核JWT，所有服務都先把Client端JWT送來檢核，變成認證授權與服務分離
後端服務都使用同一個Jwt工具包進行簽發和檢核
資料庫中設計黑名單，特定JWT寫入黑名單後失效，新認證不予簽發JWT
資料庫中設計白名單，所有JWT簽發後都寫入資料庫，檢核時查找資料庫，如果使用者異常，從資料庫中刪除或註記這筆JWT，新認證不予簽發JWT，這種做法等同於把JWT當作AccessToken使用，差別是，AccessToken較短，通常是隨機字串，沒有隱含資訊，JWT則比較長，但有隱含資訊

碼農二三事之加密~非對稱加密~ECC(橢圓曲線加密)

前言:

在我百寶箱中，最近新入的是ECC(橢圓曲線加密)，它可以做為RSA非對稱加密的平替。
ECC的特點是，它是開放的，不是公司產品。
ECC相關的實做和過程學習，基本上完全是AI實做，但因為要進入百寶箱，我有查核和測試過程式碼。

程式碼:

這份程式碼裡面包括多個程式語言的ECDH和ECIES實做，也是我百寶箱中新加入的工具。

https://gitlab.com/ycfunet/my_ecdh_ecies_code_test

說明：

ECC包括3種，ECDH、ECIES、ECDSA，其中ECDSA是簽章用的，這裡不談，ECIES是我們要用的，但它是ECDH的擴展，因此要先從ECDH說起。

ECDH：

ECDH邏輯是，我有我的公鑰和私鑰，你有你的公鑰和私鑰，我用「我的私鑰+你的公鑰」可以生成共享金鑰，你用「你的私鑰+我的公鑰」可以生成相同的共享金鑰，沒錯，這就是神奇的地方，「我的私鑰+你的公鑰」，「你的私鑰+我的公鑰」都可以生成相同金鑰。那麼這個共享金鑰就可以拿來當AES金鑰加密和解密資料。

ECDH使用時，不會直接給共享金鑰，而是雙方會把公鑰給對方，加密和解密前，才會組合出共享金鑰後，再用共享金鑰以AES加密解密資料，所以ECDH又稱為「交換金鑰加密系統」。

ECIES：

ECIES可以做為RSA的平替，它是以ECDH為基礎的擴展。
使用概念上，一樣是接收端先建立一組公鑰和私鑰，然後把公鑰給對方，自己保留私鑰。

但在邏輯上，如何套入ECDH？
ECIES引入「臨時金鑰」的概念，我(後稱接收端）會先產生一組公私鑰，公鑰提供，私鑰保存。
發送端拿著我的公鑰，在每次傳送資料時，都先產生一組公私鑰，這組公私鑰就稱為「臨時金鑰」，發送端會用「臨時金鑰的私鑰+我的公鑰」「產生共享金鑰」，用這組共享金鑰以AES加密資料。

還記得AES提到加鹽的IV技巧嗎？這裡一樣的行為，發送端會把加密後的資料，在最前面加上「臨時金鑰的公鑰」，因此整個資料變成
臨時金鑰的公鑰 + AES編碼後密文

接收端收到後，用「我的私鑰 + 臨時金鑰的公鑰」產生共享金鑰後，用共享金鑰以AES解密密文。
因為臨時金鑰的公鑰長度不一定，AI在最前面加上4 Bytes，記載臨時金鑰的字元數，所以完整資料變成

臨時金鑰的公鑰長度數值(4Bytes) + 臨時金鑰的公鑰 + AES密文

因為這樣的設計，儘管加密解密流程比較複雜，但包裝後可以完全平替RSA的非對稱加解密，接收端只要產生一組公私鑰，公鑰提供後，不論是臨時金鑰、AES加解密，其實都包裝在Encrypt和Decrypt裡面了。

RSA是公司產品，同時也有專利，我懷疑ECIES是為了規避RSA專利而用ECDH流程設計出的標準。

碼農二三事之加密~非對稱加密~RSA

前言:

在我百寶箱中，使用頻率也很高的，就是RSA加解密。

程式碼:

這份程式碼裡面包括多個程式語言的RSA實做，也是我自己常用的百寶箱工具。

https://gitlab.com/ycfunet/my_rsa_code_test

說明:

RSA包括幾種功能，這裡只說加解密，不說憑證、簽章。

AES是對稱式加解密，就是固定用密碼把字串加密和解密，但一個情境是，我不能讓人知道我的密碼(金鑰)，但我要能讓別人能加密，我能解密，這就是非對稱加解密，常見的是RSA。

RSA是RSA公司的產品，因為是公司產品，使用簡單，不用管細節，是業界標準。

RSA就3個Function：

GenerateKey: 產生一組公私鑰，公鑰給別人加密，私鑰自己留著解密。
Encrypt: 用公鑰加密明文成密文。
Decrypt: 用私鑰解密密文成明文。

咦...就這樣...對...就這樣，簡單吧 🤣。

公私鑰格式說明:

比較要注意的知識點是公私鑰的格式，一般有2種，PEM和XML。

c#用XML，其他通常用PEM，PEM以 -----BEGIN...----- 和 -----END...----- 當作開頭標記和結尾標記

另外，在Java中，Java要求的格式是PEM去除標記，只有Key的內容。

碼農二三事之加密~AES

前言:

這篇不會跟你解釋AES裡面怎麼XOR、怎麼移位，這篇我想說的是哪幾個規格以及怎麼寫。
在我的百寶箱中，使用頻率最高也最重要的莫過於加密相關，其中AES是重點之一。

程式碼:

這份程式碼裡面包括多個程式語言的AES實做，是我自己常用的百寶箱工具。
裡面的AES程式碼基本上相互驗證過，原則上都能互相正常編碼解碼(除了my_browser_js_test，能編碼，不能解碼)。

https://gitlab.com/ycfunet/my_aes_code_test

說明:

AES是對稱加密演算法，邏輯是你用一個密碼把字串加密，另一個人用同一個密碼把字串解密，密碼就是鑰匙，關鍵字叫金鑰(Key)，加密後的資料叫密文，未加密的原始字串叫明文。

AES的核心邏輯是，用固定長度的金鑰，把固定長度的明文加密成密文，反過來，固定長度的密文用固定長度的金鑰解密成明文。

因此，最基本的認知是，金鑰長度固定，明文長度也固定，咦...我使用時，沒聽說明文規定長度啊，有些AES金鑰也沒規定長度啊。

這時引出兩個AES的重點，一個叫金鑰雜湊，一個叫Padding。

因為密碼(金鑰)可能長度不一，為了讓密碼(金鑰)可以是任意長度，通常會用SHA256把密碼進行雜湊，就能取出固定長度的金鑰，而這個長度就跟使用的加密規格相關，例如AES256，就表示256 Bits，SHA也用256 Bits。

Padding翻譯叫填充，剛剛提到加密和解密時，明文必須是固定長度，不固定長度怎麼辦呢？會把明文填充固定字元，讓它長度固定。

Padding有多種填充內容，直覺想到填0，對這是一種，目前常用的是根據空白數量填數字，例如空3格就填0x03 0x03 0x03，這種目前是主流叫做PKCS7Padding。

到這裡，我們知道能用SHA256把密碼雜湊成密文，能用Padding把明文填充成固定長度，這時候會發現，固定的金鑰+固定的明文=固定的密文。

這很OK，但感覺每次的密文都一樣好像怪怪的，有沒有辦法讓它每次密文都不同？這時引出加密常見的重點，加鹽(Salt)。

所謂的加鹽，真的如字面意思，就是加料，在AES中，規範了多種模式，我們只要記得常用的2種，ECB和CBC，ECB就是上面寫的未加鹽的就稱為ECB，加鹽的模式就稱為CBC。

AES-CBC的加鹽是說，CBC規定了一個欄位，稱為IV，這個欄位就是加鹽的鹽巴，AES-CBC加密時將密鑰+IV當密鑰，一起將明文加密，解密時將密鑰+IV當密鑰，一起將密文解密。IV通常是16字元(128Bits)。

因為IV是鹽巴，通常會用亂數產生，那既然是亂數產生，解密時如何知道？

一般會把IV加在密文最前面，變成

IV(16個字)+密文

解密時，先切割出IV和密文，然後把設定IV和手上的密鑰，把密文解密成明文。

IV放密文最前面是慣例，也可以和密文一起放在兩端，傳送時只傳送密文，但既然是加鹽，通常目的是讓密文判讀性更低，放在密文最前面會讓密文每次都不一樣，減少一致性。

最後一個知識點，實作會發現，AES加密後的密文，是Bytes的Binary，這不好處理呀。

在最後要提供密文時，Binary不容易使用，通常會編碼讓它字串化，一般都用BASE64或HEX，這裡有個小小誤區，BASE64有2種，一種是一般的BASE64，但一般的BASE64會有特殊字元，在網頁傳輸時，可能因為HTTP GET不支援的字元，因此有個變形是BASE64 URLEncoding，這兩種BASE64的結果是不同的。

以上就是AES知識點，還是蠻長的，但不用管底層XOR、移位邏輯。

結論:

這次的文章放了一陣子，圖片是Claude-Code (GLM-5/GLM-4.7) 用Excalidraw MCP畫的。

2026年2月14日

MustOn Cluster - Cluster & PostgresqlLib & DeployLib & FSM Sample

前言:

延續上次的 MustOn Cluster。
實做進行中，這次先把開發中的PostgresqlLib、DeployLib以及FSM Sample Code放上來。
另外，覺得MustOn這名字不錯，順手把mustoncluster.com註冊了。

成果:

https://gitlab.com/mustoncluster/messagelib_clusterapp
https://gitlab.com/mustoncluster/postgresqllib
https://gitlab.com/mustoncluster/deploylib
https://gitlab.com/ycfunet/my_csharp_fsm_test

實做過程:

幾個點，首先，上次放上gitlab的MessagesLib & ClusterApp有問題，AI騙了我，我跟它說要用Raft Cluster的Metadata進行狀態共享，結果AI偷雞用Thrift API實做，好笑的是，我跟它說：「你好髒喔」，它還知道用Thrift API偷雞是不正確的作法。
這次一樣是用Claude Code搭配GLM-4.7開發，寫到後來基本上有點崩。Cluster目錄\用submodule的方式加入MessagesLib、PostgresqlLib、DeployLib，AI光是用git就差點把本地程式碼和遠端repo(家裡的)的程式碼給刪了。
再來，這樣的架構目前開發，AI經常卡住，改程式碼容易亂改，要嘛改錯東西，要嘛刪除無關的程式碼。感覺這樣的程式碼體積和複雜度，GLM-4.7就有點頂不住了，正好最近GLM-5.0剛發表，初步可能伺服器資源不太夠，反應非常慢，一個問題可能要5分鐘才回覆，但品質看起來不錯，等它穩定性好些，反應速度快些，說不定能提昇目前的處理能力。
再一點是，我嘗試用OpenCode替代Claude-Code進行開發，變成OpenCode + GLM的開發模式，目前還在熟悉和習慣中，OpenCode有不少特異功能，它直接內置Server，讓界面和操作可分離，界面可以是應用程式，也可以是CLI，Model不綁定，可直接用Google Gemini、GLM系列，彈性比較大。

程式還在開發中，正如上面講的，架構比較大，程式碼比較複雜，開始寫得卡卡的，今天情人節，就用這些更新來過吧，農曆新年也要繼續努力。

2026年2月1日

MustOn Cluster - Cluster & Message Layer

前言:

上次提到想嘗試開發分散式儲存系統 - GreeStorage，分散式儲存系統有很多塊，但不論哪一塊，分散式系統的基底，訊息中心和通訊層是最核心的部份，這部份也是分散式系統的主軸，因此先從這個部份開始。

成果:

整份專案在
https://gitlab.com/mustoncluster/messagelib_clusterapp

設計過程:

在和AI討論的過程和Storage思考設計過程，避免不了WAL，所有儲存系統的資料寫入都是強一致性行為，無法迴避WAL，而在分散式儲存系統中，WAL就不只跨磁碟，也需要跨網路，跨網路的WAL必定會有Cluster和Message Layer，先攻破這塊。
有趣的事情是，在查找WAL時，想先從既有WAL的應用著手，赫然想到DB HA、DB DR，這需求在之前不只一家公司也不只一次遇到，DB和儲存系統很像，也需要WAL，而DB的WAL在DB中都已經做好了，所以也許可以先從DB HA(高可用性)、DB DR(異地備援)應用著手，既能熟悉WAL也能做出一個應用。
MustOn的名稱由來很好玩，查找DB高可用性當然要看Microsoft SQL Server的Solution，赫然發現，Microsoft把SQL Server的高可用性解決方案重新設計了，設計方向感覺跟OpenAI最近PostgreSQL的優化設計有點像，我懷疑Microsoft的SQL Server在針對AI應用情境優化設計，但我沒有證據 😂
喔～離題了，Microsoft新的SQL Server高可用性設計稱為AlwaysOn，於是我就問AI找個always同義詞，Usually不行，頻率比Always低，這表示比較容易故障，那Must如何～於是MustOn名字就出現了。
原本MustOn應該是DB高可用性方案名字，結果AI亂套，把Cluster命名用上了，那就.....這樣吧 😂

實做過程:

這次基本上都是Claude Code搭配GLM-4.7開發，設計階段則是用Google AI Studio聊天方式討論設計的。
因為現在新的Cluster好像從Paxos演算法改用Raft演算法，因此實做就用Raft的Cluster套件實做，但實做發現，Raft演算法只有Leader -> Follower，並沒有Follower -> Leader，所有訊息都是由Leader往外推送，而不是往內收，因此，基本上無法透過Raft層進行資料傳輸，說人話就是，dotNext Raft的實做就是Raft Cluster的實做，不包括其他API訊息處理，因此dotNext自己另外有一包ASP.NET Core的版本，透過ASP.NET HTTP API做這塊，dotNext官方網站也提到它們有多種傳輸方式，顯然意思都是，Raft Cluster只有Raft唷～其他傳輸行為要另外定義API，這既合理又方便。
我在設計選型階段，就考慮用Apache Thrift當API訊息層傳輸，因為Thrift跟gRPC一樣直接有IDL可以定義出API名稱和參數(gRPC是protobuf)，這會讓API設計更乾淨、清楚，我認為這在Cluster的通訊層設計很重要，因為既然是通訊層，就很容易設計一堆通訊用API和Model，如果不透過IDL或protobuf管理，寫到後面就整個大混亂，完全不知道API有哪些，作用是什麼。
而不用gRPC的原因很簡單，Thrift是binary格式，而gRPC是json文字格式，這表示要傳遞檔案或資料，Thrift也能處理，傳輸內容也會稍微小一點。

結論:

GLM-4.7開發後端的確相當不錯，穩定性很好，趁著特價，我也入坑了。😂
最近好像有龍蝦之亂，看起來能用GLM玩龍蝦，最近很熱門，過陣子有心得，如果很特別再貼吧。

2026年1月27日

開源AI-Agent聊天室 (OpenSource AI-Agent ChatRoom) - SongAiChat

前言:

之前曾在Threads上分享過別人寫的AI-Agent聊天室的MCP工具，但我用起來總覺得沒有很好用。
我在開發時，會遇到需要不同AI-Agent間通訊的問題，常見的就是跟AI-Agent說：
你給我一段說明，我轉給另一個處理的AI-Agent，然後問另一個AI-Agent，你看了有什麼疑問要我轉達？
或者是跟AI-Agent說：
你撰寫一份串接文件，我給其他AI-Agent閱讀和實做。
不論哪種，都要人工轉發，那是否能夠有一個聊天室，讓每個AI-Agent在裡面自己對話，我也能在裡面參與或了解對話內容呢？能夠紀錄更好。
於是，就有了寫個聊天室的念頭。

成果:

整份專案在
https://gitlab.com/ycfunet/songaichat

設計過程:

這套聊天室的設計過程很復古。😆
我其實想的原型是很早期的CGI聊天室，那種一堆人在裡面，然後一直洗版的那種聊天室，因此版面和系統設計借鑒了早期那種聊天室設計，加上了WebSocket(這邊我用的是SignalR)長連接的功能，達到即時通知的功能。
名字雖然是Song，但跟唱歌一點關係都沒有😂，它的命名是起源於高中松山工農時期的BBS站～松間小棧，我是那時候的站長😅。

因為源於松山 - Songshan，因此取前面的Song😁。

設計過程很復古吧。

實做過程:

這次實做換成Gemini-CLI實做。
Gemini-CLI使用感覺反應慢很多，可能是現在很多人在使用，很容易忙碌吧。
但以寫程式碼的穩定性，尤其是前端，感覺比GLM-4.7穩，React + FluentUI基本上一次完成，版型也沒什麼大問題，配色也是標準正常。
不過Gemini-CLI很多時候問它問題，它想到就直接改下去了，然後改的方向或作法可能是錯的，這時候就得從git退版，因此Gemini-CLI和GLM-4.7的git版控很重要，要經常讓它commit，有問題隨時退版。

這個版本目前算是v0.8.5 Beta，基本能用，還沒有仔細測試，每次測試都會修改增加功能或調整，因此沒有完整一輪測完，但基本功能使用上沒什麼問題。

雜談:

DotPusher之後，我原本寫OmniPusher，實做Electron版的WebFcm和WebPush推播，但實做差不多了才發現，Electron在WebFcm與WebPush相容性有問題，靠～於是就放著了。
另一點是，OmniPusher用GLM-4.7實做前端，寫的有點卡，讓它計劃書內畫Wireframe都畫了，結果實做時直接偷工，Sidebar沒處理乾淨，Main Content直接沒做，叫它用FluentUI做，又做成HTML簡易版，連基本的標題列和副標題列樣式都沒處理，變成單純的HTML，然後越改越撞busy，蠻昏倒的，寫到真的是不想看。

另一個點是這樣的，SongAiChat主要作用是AI-Agent間對話用的，我在考慮撰寫用AI開發比較大的專案，目前打算寫套名為GreeStorage的儲存系統，GreeStorage名字取自Great Storage的諧音。
以前有段時間專門在弄Ceph，Ceph是Object Storage分散式儲存系統，架構比較大，那個作者很妙，作者就寫Ceph，一路寫一路發Paper，寫了10幾篇寫完博士讀完😆，然後就成立了公司賣儲存系統，接著又被RedHat收購。重點是，因為架構比較大，各組件也多，我在想有沒有可能定好架構後，一段一段讓AI寫，可能每個AI負責一段，然後就透過聊天室互相溝通和串接。這目前還在初期想法階段，如果能做出來，應該很屌😆。

訂閱：文章 (Atom)

2026年6月1日

IPCAMM NVR - 前導篇

2026年5月3日

Dell Wyse 3040 - Debian 13 Read-Only Rootfs設定

2026年4月19日

AI超人之ONVIF Client Lab

AI超人之影像編/解碼器 (H264Parser, H265Parser)

2026年3月22日

碼農二三事之加密~JWT

碼農二三事之加密~非對稱加密~ECC(橢圓曲線加密)

碼農二三事之加密~非對稱加密~RSA

碼農二三事之加密~AES

2026年2月14日

MustOn Cluster - Cluster & PostgresqlLib & DeployLib & FSM Sample

2026年2月1日

MustOn Cluster - Cluster & Message Layer

2026年1月27日

開源AI-Agent聊天室 (OpenSource AI-Agent ChatRoom) - SongAiChat

搜尋此網誌

標籤

網誌存檔

好友連結