2026年4月19日

AI超人之影像編/解碼器 (H264Parser, H265Parser)

 前言:

最近在寫H264和H265的硬體編碼解碼器程式。
發現在Linux選項不多,只有FFMpeg的libav、GStreamer,但我想找授權乾淨的(無GPL、Library GPL),並且支援VA-API的,於是就試著讓AI寫看看。

成果:


過程:

我要求Claude-Code(GLM-5.1)參考OneVPL(MediaSDK),並要求它直接抄OneVPL(MediaSDK),跟它說,它的授權是MIT,不用擔心,但你盡量不要自己實做,以它寫的為準,做法是,複製它的程式碼後,修剪。
最終完成品,就是成果的程式碼。

我在使用時,還有發現bug,所以我無法保證沒有bug,目前H265解碼時會間歇性出現灰畫面,但我在交叉使用ffplay時有些來源也會這樣,我還無法準確判斷是影像來源問題,還是它實做的有bug,但以完成度、穩定度來說,基本上沒問題。

雜談:

先前看到新聞說Claude Opus能夠參考並實做出程式語言編譯器,GLM-5.1雖然能力差一點,但基本能夠超越Opus的上一代,弱於這一代。
這次讓它直接參考並抄寫、改寫、修改OneVPL(MediaSDK),並且成功重構出mediasdk_h264_parser和mediasdk_h265_parser,以程式碼分析與修改能力而言,我認為能力已經超越我了,因為我自己看和分析,是無法做到的,要知道,OneVPL可以一路追朔到Intel IPP,裡面程式碼龐大且經過多年迭代 + 重構,加上是根據H264, H265 Spec. 實做的,基本上有特殊的Domain專業以及複雜的程式脈絡,但Claude-Code已經能夠分析、拆解,並根據功能抽取和改出需要的程式碼,再組出Library,非常強大。😲

沒有留言: