寧波格密鏈網(wǎng)絡(luò)科技有限公司一直致力于全同態(tài)加密的應(yīng)用研究。最近陳智罡博士的團隊開發(fā)了一個將SEAL全同態(tài)加密庫映射到Python上的接口,解
寧波格密鏈網(wǎng)絡(luò)科技有限公司一直致力于全同態(tài)加密的應(yīng)用研究。最近陳智罡博士的團隊開發(fā)了一個將SEAL全同態(tài)加密庫映射到Python上的接口,解決了機器學(xué)習(xí)庫與全同態(tài)加密庫對接的問題,極大的方便了機器學(xué)習(xí)領(lǐng)域人員使用全同態(tài)加密算法,為其它領(lǐng)域需要用到全同態(tài)加密庫的人們提供便利的工具。該庫已經(jīng)在GitHub上開源(github.com/Huelse/pyseal)。全世界各地的工程技術(shù)人員都可以使用該庫。
微軟的SEAL全同態(tài)加密庫包含BFV和CKKS兩種全同態(tài)加密方案,陳智罡博士團隊要做的就是將這個庫的所有可用接口都映射到Python上來,并使之在Python上正確運行。顯然這是一個全新的項目。
經(jīng)過分析討論,技術(shù)路線確定為使用微軟最新的SEAL庫(3.3版本)做為基礎(chǔ),與Pybind11官方頭文件庫作為中間件綁定,使用Setuptools或CMake編譯生成動態(tài)鏈接庫。這樣就可供Python上調(diào)用SEAL庫接口。技術(shù)框架如下:
這不是一個簡單問題。初期,他們遇到了復(fù)雜的環(huán)境和標準問題,經(jīng)過反復(fù)確認,團隊選擇使用是C++17標準和Python3.6.8的穩(wěn)定版作為開發(fā)環(huán)境。然而接下來團隊碰到了三個棘手問題。
第一個問題,在最新版的SEAL庫中,其使用的是一個名為MemoryPoolHandle的類和MemoryManager基類作為計算過程中的指針與內(nèi)存池管理。因為Python的內(nèi)存管理是自動化的,所以這個在Python里是無法直接實現(xiàn)。于是團隊在wrapper綁定文件中,將其作為一個參數(shù)類導(dǎo)入,最終達成了相同的功能。
第二個問題,SEAL庫的Cipertext明文類中有一個關(guān)鍵參數(shù)scale,在測試環(huán)節(jié)中是要做到可自定義修改的,但問題在于這是一個私有變量。在C++中,定義好共有方法后,可通過應(yīng)用的方式對其賦值,但在Python中因為其語言特性,同樣不可能實現(xiàn)對私有變量的直接修改。所以經(jīng)過研究,團隊的解決方法是在Cipertext類中增加一個共有方法set_scale(),該函數(shù)方法是整個項目唯一對SEAL庫做出修改的地方,也僅應(yīng)用于測試環(huán)節(jié)的使用,對全同態(tài)加密整體是無影響的。
第三個問題,出自于Python的內(nèi)存管理,這是一個技術(shù)難點與重點。提前說明一下,Python中假如我們在代碼文件里定義一個變量a=0,我們再寫一個帶參數(shù)的函數(shù)foo(a),然后函數(shù)里會對a變量進行一系列運算使之改變。當我們將a帶入到這個函數(shù)并使之運行后我們發(fā)現(xiàn),在該函數(shù)里,a這個變量的確被運算過了,但是在這個函數(shù)體之外的那個a,它的值并不會變。通過id()方法觀察內(nèi)存,最終確認是這樣的。
而在C++里通過指針的方式實現(xiàn)對傳入?yún)?shù)的修改,SEAL庫多處的encode和decode函數(shù)都是這樣使用的。要在盡可能不改變SEAL庫源碼的情況下將其轉(zhuǎn)移到Python上來,且Python不能操控指針,僅這個問題困擾了團隊很久。最終團隊給出的方案是自定義一個變量類。
雖然在Python中單一的變量作為參數(shù)不會發(fā)生改變,但如果是一個類作為參數(shù)傳入,那它的改變是全局性的。比如uIntVector類在c++中的原型是std::vector,DoubleVector類其原型是std::vector。團隊對類的包裝完成了這兩者最基本的數(shù)據(jù)交互,這樣CKKS方案就能完美運行。至此陳智罡博士團隊的Pyseal項目的主要工作也已完成。
最后,陳智罡博士的團隊使用Pyseal將SEAL官方給出的6個樣例在Python上全部實現(xiàn),且運行效率也并未減少。接口已經(jīng)在Github上開源。
寧波格密鏈網(wǎng)絡(luò)科技有限公司一直致力于全同態(tài)加密的研究與開發(fā),希望能給全世界更多的技術(shù)工程人員帶來便利,更加方便地使用全同態(tài)加密庫。(致遠博士)