摘要:浙江大學(xué)計算機科學(xué)與技術(shù)學(xué)院吳堅平團隊在《大數(shù)據(jù)》發(fā)表論文《 基于聯(lián)邦學(xué)習(xí)的政務(wù)大數(shù)據(jù)平臺應(yīng)用研究 》,該研究聚焦數(shù)字政府建設(shè)中政務(wù)大數(shù)據(jù)平臺的隱私數(shù)據(jù)安全與合規(guī)難題,分析
浙江大學(xué)計算機科學(xué)與技術(shù)學(xué)院吳堅平團隊在《大數(shù)據(jù)》發(fā)表論文《基于聯(lián)邦學(xué)習(xí)的政務(wù)大數(shù)據(jù)平臺應(yīng)用研究》,該研究聚焦數(shù)字政府建設(shè)中政務(wù)大數(shù)據(jù)平臺的隱私數(shù)據(jù)安全與合規(guī)難題,分析了隱私數(shù)據(jù)采集、分類分級、共享三大管理挑戰(zhàn),提出基于聯(lián)邦學(xué)習(xí)的推薦算法和隱私集合求交技術(shù)解決方案,為政務(wù)大數(shù)據(jù)跨域安全共享提供了重要參考。

當前我國數(shù)字政府建設(shè)已進入深水區(qū),截至2022年9月,全國已上線26個省級、257個市級、355個縣級政務(wù)大數(shù)據(jù)平臺,形成省市縣一體化數(shù)據(jù)底座。但隨著《數(shù)據(jù)安全法》《個人信息保護法》的實施,政務(wù)數(shù)據(jù)共享與隱私保護的矛盾日益凸顯,“數(shù)據(jù)孤島”問題仍未有效破解,隱私數(shù)據(jù)的采集適用性、分類一致性、共享安全性等成為關(guān)鍵痛點。
針對這些問題,團隊提出三大核心解決路徑。在數(shù)據(jù)采集環(huán)節(jié),采用聯(lián)邦學(xué)習(xí)隱私集合求交技術(shù),實現(xiàn)數(shù)據(jù)需求方與數(shù)源方的安全數(shù)據(jù)回流,通過屏蔽重復(fù)數(shù)據(jù)、精準篩選目標數(shù)據(jù),避免過度歸集和數(shù)據(jù)冗余,同時保障數(shù)據(jù)鮮活性與一致性。
分類分級方面,構(gòu)建國家、省、市、縣四級統(tǒng)一的聯(lián)邦學(xué)習(xí)分類分級模型,由國家級平臺作為服務(wù)器節(jié)點,各級平臺作為參與方協(xié)同維護分類指標,數(shù)源方為回流數(shù)據(jù)打上分類分級標簽,大幅降低人工參與度,避免敏感信息泄露,確保分類分級合規(guī)統(tǒng)一。
數(shù)據(jù)共享環(huán)節(jié),創(chuàng)新融合聯(lián)邦推薦系統(tǒng)與隱私集合求交技術(shù),通過隱私保護因子分解機算法構(gòu)建跨層級推薦模型。數(shù)據(jù)需求方從本級平臺發(fā)起申請,未達可信閾值時自動向上級平臺逐級請求,實現(xiàn)跨領(lǐng)域、跨層級數(shù)據(jù)供需精準匹配,在“數(shù)據(jù)不出域”的前提下完成高質(zhì)量共享,有效解決數(shù)據(jù)共享中的度量難、管控難問題。
研究同時指出,聯(lián)邦學(xué)習(xí)在政務(wù)大數(shù)據(jù)應(yīng)用中仍面臨隱私保護、通信效率、數(shù)據(jù)異構(gòu)三大挑戰(zhàn),未來需通過差分隱私、同態(tài)加密等技術(shù)強化安全防護,優(yōu)化傳輸機制提升通信效率,破解多源異構(gòu)數(shù)據(jù)融合難題。
該研究為國家一體化政務(wù)大數(shù)據(jù)體系建設(shè)提供了技術(shù)支撐,其提出的解決方案已在旅游精準營銷、政務(wù)服務(wù)推薦等場景初步驗證,有望推動政務(wù)數(shù)據(jù)從分析式共享向生成式共享轉(zhuǎn)變,為數(shù)字政府高質(zhì)量發(fā)展注入新動能。