国产精品偷伦精品视频,欧美厨房性猛交xx乱大交,《隔壁女邻居3》中文,亚洲特级毛片,欧美色图亚洲色,在线免费看污视频,亚洲福利视频一区二区三区,国产91会所洗浴女技师
法治政府建設

蘇宇:公共數據質量的制度保障

摘 要:公共數據質量不僅直接或間接影響公民和法人權益,也因影響數據驅動型判斷和決策的結果而深刻影響公共利益。我國在保障公共數據質量方面已制定了系列法律規范和政策文件,并采取了一定治理舉措,但公共數據質量的體系化保障依然面臨法律關系界定、參與途徑設置和監測體系擴展等方面的難題。解決這些難題應秉持“通過設計的精細保護”思路,建立公共數據法益確認制度、質量缺陷參與治理制度和數據質量深度監測制度,強化公共數據的質量保障。

關鍵詞:公共數據;數據污染;數據質量;數字行政法

數字政府需要高質量的公共數據。公共數據的質量缺陷不僅顯著影響個人和組織的合法權益、損害相對人依法獲取行政給付、行政獎勵乃至行政許可的機會,更將深刻影響依賴公共數據的判斷與決策,關涉“數據驅動型”政務決策和公共治理的能力。“數據要素×”在國家治理和公共行政領域也將發揮“杠桿作用”和“乘數效應”,公共數據質量的提升或下降日益可能產生倍數乃至指數級別的正負面間接影響,因而保障公共數據質量必將成為數字政府建設的重中之重。

全面保障公共數據質量并非易事。某一項特定公共數據質量的保障任務或許可以通過運動式治理、集中人力財力的方式完成,但對體量極其龐大的公共數據穩定實現整體的質量保障則需要法律制度的系統性支持。在未來數十年間,已基本可預見數字行政過程將逐步取代傳統行政過程,然而行政法學對于公共數據質量保障問題尚未給予充分關注,導致相關方面的行政法治建設缺乏系統和清晰的理論指引。對此,強化相關理論與制度供給刻不容緩。

一、公共數據質量缺陷的來源與影響

公共數據質量缺陷主要是指公共數據在適用性、客觀性、時效性等方面的欠缺,導致數據難以被正常利用,或者存在導致利用數據的判斷或計算結果偏離正常值的風險。公共數據質量缺陷來源復雜,影響深遠。法律治理必須首先辨識相關缺陷的來源及影響,方能因事制宜、精準施策。

(一)公共數據質量缺陷的主要形態與原因

公共數據質量缺陷的具體形態相當豐富,實踐中廣泛存在的主要缺陷形態包括數據粒度(granularity)不佳、時效性不足、客觀性與完整性缺失等方面,其原因則主要包括數據收集不當、處理鏈條停滯和數據污染。

1.公共數據質量缺陷的主要形態

數據客觀性與完整性的缺失是公共數據質量缺陷的最主要形態。此種缺陷廣泛存在,部分數據的質量問題尤為突出。例如,四川省廣元市在2023年6月專項工作開展之初,住房公積金數據的數據質量評估僅得48.66分,涉及數據12萬余條,數據項合格率92.43%。數據指標合格率僅為45.26%。數據客觀性缺陷的具體事例可謂隨處可見:大件運輸車輛因軸重等檢測錯誤數據重復過磅,復檢后數據正確,車輛重新駛入高速,但初始錯誤數據未刪除,導致系統依然誤判為超限數據。湖南文理學院大量學生的數據出現錯誤,多名學生名下被登記房產信息,被辦公積金、經營許可證,名下辦結的業務還包括“出租汽車駕駛員從業資格注冊”“防雷裝修竣工驗收”,甚至還有“領養證明”等。這些基礎性的缺陷廣泛制約著公共數據質量的提升。

數據時效性不足是影響公共數據價值利用的關鍵原因。利用數據的本質是利用其中的信息,而信息的價值會隨時間推移而變化。盡管時間推移對于信息價值變化的影響非常復雜,但一般情況下,信息會伴隨時間推移而貶值;反過來,獲取決策信息的成本通常會隨時間推移而降低,因為越新近的信息越是稀缺和難以獲取。每一項數據的價值時效性不同,部分數據的高價值時間窗口非常短,因而收集和利用“過期”數據幾乎沒有什么意義。公共數據時效性不足包括兩個方面的問題:一是政府和公共機構獲取的數據時效性不足,二是公眾可獲取的開放公共數據時效性不足,后者往往更為常見。在政務數據開放平臺和統計部門發布的數據中,部分數據已無法發揮高價值時間窗口時期的價值。部分城市的政府數據開放平臺的數據更新整體滯后。另一方面,不少城市在經濟金融、勞動就業、教育科研、醫療衛生、科技創新等關乎群眾切身利益、產業發展的重要領域的數據更新不及時。數據越接近實時,數據收集與后續處理成本越高,數據時效性不足的問題或許需要通過更強的制度激勵解決。

數據粒度不佳是制約公共數據利用價值的另一重要原因。現實中的決策往往是基于不完備決策系統進行跨數據粒度的決策,而不完備多粒度標記決策系統存在最優粒度選擇問題。在利用不同粒度信息進行挖掘、判斷和決策時,需要遵循可證粒度原則(the principle of justifiable granularity),這一原則提供了兩個關鍵標準用于評估信息粒度的合理性:覆蓋標準衡量我們所關心的目標信息被信息粒度包含的程度,特異性標準則表示信息粒度的具體程度,這兩個標準在實踐中往往存在沖突,難以兼顧。因此,并非所有公共數據都處于最優粒度狀態,數據粒度過粗的問題在人口統計數據等公共數據中不同程度地存在。數據的粒度與數據利用需求不匹配往往導致公共數據的價值利用受限。例如,傳統交通檢測數據由于檢測粒度粗,只能在單一方面刻畫交叉口的交通需求,無法全面表征交叉口的交通需求特征,也為后續的人工智能訓練造成了不便;粗粒度的數據難以充分表達致災因子、孕災環境和承災體的時空差異,不利于開展區域精細尺度極端氣候事件風險識別與評估工作;等等。提升數據粒度亦受成本約束,很可能同時增加數據采集、存儲、加工等各種處理成本,如果采取非自動化方式采集,還可能增加采集對象的治理負擔,因此數據粒度不佳的問題在實踐中并不容易克服。

2.公共數據質量缺陷的主要原因

實踐中,數據收集方式、工具、程序以及數據來源等方面的缺陷是公共數據質量缺陷的最主要原因。數據收集缺陷既來源于通過登記、錄入、掃描等方式向數據庫輸入數據過程中人為篡改、處理失誤或操作不規范等情形,也來源于通過觀測、爬取、檢索等技術手段獲取的數據本身不準確、不可靠。易言之,數據收集缺陷的主要原因包括對象和過程兩方面,前者是數據來源本身的問題,后者則包括人為惡意影響、操作規范欠缺和技術工具缺陷等。迄今為止,數據收集缺陷過程中的操作性和技術性原因可能是導致公共數據質量缺陷的主要成因,由此而造成的數據連續性缺失等問題制約了公共數據質量的提升和保障。如后續數據清洗和管理不足,這些缺陷就將伴隨公共數據持續存在。部分數據收集任務涉及跨區域協調難題。例如,對保障性住房進行數據采集相關流程而言,由于其在采集相關數據的過程中缺少規范上的統一,并且不同區域及相關機構之間出現“信息孤島”等現象,相互難以進行相關數據傳遞,從而極易導致工作出現重復化,不但浪費了大量的人力資源,而且也難以有效保障數據采集質量。

在數據來源導致的質量缺陷中,爬取數據的缺陷比較復雜。利用技術工具自動化觀測獲得的數據,如果操作規程及工具本身并無問題,一般不會在獲取數據方面出現明顯缺陷。爬取數據則不然,爬取的數據既有可能本身不真實、不可靠,也有可能被“投毒”。特別是利用爬取數據訓練模型時,機器獲得的數據中可能隱含著各種形式的后門,在一定條件下觸發模型的有害表現。盡管已有技術可以協助模型管理者發現和凈化被毒害的參數,相關技術在不斷變換的攻擊方式面前仍然難言成熟,并且也將為政務類領域模型的運行帶來不可忽視的安全負擔。

在數字時代,數據污染正日益成為公共數據質量缺陷的重要來源。“數據污染”(data contamination)主要包含兩種含義:(1)數據集中存在異常值的情況,這些異常值可能來自由于記錄錯誤、在非標準或預期條件下進行測量而產生的觀測值;(2)(人工智能模型訓練時)任何違反在實驗規程中對數據集嚴格控制要求的情況,包括指導方針污染、文本污染和注釋污染等。此外,訓練數據中可能包含測試數據的情形也經常被作為大模型的數據污染討論,但不在本文的研究范圍。前述兩種情形都有可能對公共數據質量造成影響,而以數據集記錄錯誤、被人為篡改或發生處理失誤之情形為甚。

人為篡改、刪除和網絡攻擊都可以被視為對公共數據的污染。如果未經授權的人或系統對數據進行了更改,無論是故意還是意外,都可能導致數據完整度(integrity)喪失,不僅直接影響相對人和利害關系人的合法權益,也可能導致繼續使用受污染的系統或損壞的數據形成不準確的判斷或決策。外部攻擊導致的公共數據污染則早已不乏實例,如2023年9月斯里蘭卡政府云系統遭受一次大規模勒索軟件攻擊,導致長達三個多月的公共數據永久丟失;2017年蘭州公安部門破獲公安部督辦網安專案,打掉了一支通過入侵政府網站、非法寫入人員信息并制販假證的犯罪團伙。犯罪嫌疑人共入侵政府網站獲取管理員身份信息3000多條、非法寫入辦理假證人員信息7.3萬余條,涉及甘肅、青海等28個省市、自治區的90余個政府網站。此種情形下,數據污染與網絡安全問題交織,更考驗防治責任主體的技術能力與管理水平。

在大模型時代,對公共數據的污染并不一定僅針對數據處理系統、平臺及傳輸數據的網絡節點進行,面向人工智能模型的“數據投毒”更具技術性,也在風險治理上更具挑戰。“數據投毒”和數據集中的后門植入可以惡意影響乃至在特定條件下操縱大模型的表現。無論是基于開源還是閉源模型研發的政務類領域模型,此種后門在模型研發或更新參數時就已經留存、潛伏,待滿足一定條件后再發動攻擊。此種隱蔽的攻擊為未來公共數據質量保障造成了不可忽視的潛在挑戰。

上述種種可能影響公共數據價值可靠、充分利用的情形,都可以被籠統地歸納為“公共數據質量缺陷”。這一包羅甚廣的概念為公共數據質量缺陷的治理帶來了認知上的含混和復雜性,系統性梳理公共數據質量缺陷的影響尤為棘手。

(二)公共數據質量缺陷的主要影響

由于公共數據質量缺陷來源多樣,產生影響的路徑和特點自然亦有所差別。整體上,公共數據質量缺陷導致對組織、個人合法權益和社會公共利益的侵害路徑相當復雜,需要根據影響鏈條的不同而區分對待。

1.直接影響

公共數據質量缺陷很有可能直接導致侵害相對人權益的結果。直接的侵害結果是對相對人合法權益的證實和行使形成障礙(需要通過一定程序修正數據再維護權益)。在修正數據不影響后續權益正常取得和行使的情況下,數據質量缺陷對相對人的影響就僅限于直接影響,即行權成本的提升,此種成本并不僅僅是可直接計量的一般性時間消耗,因為在糾正數據缺陷、維護自身權益而額外付出的時間可能是臨時加急“征調”的時間,此種時間對比可計劃的時間安排而言,經常包含更高的機會成本。如果數據難以被修正,或者修正所需時間成本過高,導致某些需要一定時效性的重要關聯權益喪失,則可能產生更強的直接影響。如果行權障礙已經實質性地導致關聯權益喪失,此種后果亦可被認為屬于數據質量缺陷的直接影響。

2.間接影響

數據質量缺陷的間接影響包括對利害關系人合法權益的影響和對公共利益的影響。對利害關系人的間接影響主要存在于相關數據表征前置性法律關系或法律狀態的情形,并不限于多階段行政行為中的前置性階段,也不限于個人信息處理場景。例如,錯誤的犯罪記錄可能導致相對人的近親屬就業受影響;公共信用信息數據的污染不僅可能導致相對人“被失信”,也有可能侵害其子女的受教育權益,同樣,此種污染不僅可能導致相關企業信用評級的異常下降,也可能在特定條件下恰好導致政府采購因此失去理論上最優的商品和服務來源。《中華人民共和國個人信息保護法》(以下簡稱《個人信息保護法》)和《中華人民共和國政府信息公開條例》(以下簡稱《政府信息公開條例》)等賦予信息主體自身以更正權,但受間接影響的其他利害相關方則難以尋求救濟,尤其當此種質量缺陷并未構成對第三方主觀公權利的侵害而僅影響“反射利益”時更是如此。理論上,只要某一行政決定的作出需要先查詢某一數據庫或信息平臺,都有可能受數據質量缺陷的間接影響。

數據質量缺陷對于公共利益的影響更為深遠,大數據分析、數據驅動決策乃至政務類領域模型的表現都受其影響。在數據存在污染的情形下,樣本的統計特性不能被準確呈現,關鍵決策依據也可能出錯,從而至少使得模型更加復雜、計算成本更高,重情況下會產生方向性的偏離乃至錯誤。存在質量缺陷的數據被模型學習后,可能干擾模型的正常表現,這在對數據質量要求較高的領域模型中影響尤其突出。如果數據質量缺陷僅限于個別數據,尚可通過穩健設計等技術方案進行彌補;但如果缺陷已經影響到數據的統計特征,對依賴數據的判斷或決策準確度可能造成不易防范的損害。

根據特定時空的數據質量水準和經驗性的證據,為防范數據質量缺陷而付出的成本同樣也可以被理解為數據質量缺陷的間接影響。即便不存在數據的真實性、準確性問題,數據精度和完整度等問題也會產生此方面的影響,因為其包含了不同程度的信息稀缺(scarcity of information)。過于雜亂而無法高效分析的信息稀缺往往不會隨著更多信息的產生而消失,而是需要投入決策資源來整理和理解信息。隨著公共數據體量的快速增長,保持數據質量的算力、時間、技術和人力成本將日益不可忽略,在數據質量缺陷問題頻發時,安全冗余可能會被提升,數據安全相關開銷和負擔即相應增長。當然,此種間接影響能夠一定程度上消除由于缺陷造成的其他直接和間接影響,因而是相對應追求的選擇。

數字政府建設必須充分考慮公共數據質量缺陷的直接和間接影響,但并不需要追求完全消除這些風險和影響,只能盡量將其限制在可接受的水平。關鍵是如何通過法律制度構筑數據質量保障的“基礎防線”,結構化地維持較高水準的公共數據質量,這對于缺乏相應法學理論支持的數字政府基礎法律制度而言,尚屬有一定難度的考驗。

二、公共數據質量保障實踐評析:規范依據與現實舉措

在數字政府建設和數據要素利用進程中,數據質量問題不可避免備受關注。盡管這一進程方興未艾,我國相關法律規范已開始持續體現對公共數據質量保障的重視,也已就數據質量保障采取若干舉措,但仍需要進一步加強數據質量保障,充分應對未來數字政府、智慧政務和智慧城市建設對公共數據質量的需求。

(一)規范依據

公共數據質量保障的法律依據在中央與地方層面已陸續出現。在中央層面,法律、行政法規及部門規章對公共數據質量保障的關注度尚屬有限。《中華人民共和國統計法》等法律規范雖然已經注意到數據質量問題,但還沒有應用相關術語和技術體系。行政法規層面首次提及“數據質量”當屬2000年《第五次人口普查辦法》,但僅有一條簡單的總則式規定。2004年制定的《全國經濟普查條例》兩處提及“數據質量”,并在其第28條專門規定:“地方各級經濟普查機構應當根據國務院經濟普查領導小組辦公室的統一規定,建立經濟普查數據質量控制崗位責任制,并對經濟普查實施中的每個環節實行質量控制和檢查驗收。”這一規定可謂早年公共數據質量保障方面的代表性規定。其后,統計調查方面的法律規范中有關數據質量保障的內容日漸豐富和精細,但在統計調查工作之外,中央層面法律、法規中對公共數據質量的關注仍然有限。值得注意的是,2024年1月公布的《碳排放權交易管理暫行條例》第11條第1款對公共數據質量控制進行了精細的規定:“重點排放單位應當……制定并嚴格執行溫室氣體排放數據質量控制方案,使用依法經計量檢定合格或者校準的計量器具開展溫室氣體排放相關檢驗檢測,如實準確統計核算本單位溫室氣體排放量……”這一規定表明政府已關注到部分公共數據源頭的質量問題,并以法治化的方式規范“源頭治理”的需求。

在地方層面,不少地方性法規和地方政府規章已經意識到公共數據(包括政務數據)質量保障的重要性。早在2020年,《浙江省數字經濟促進條例》第20條就對公共數據質量保障作出專門規定。2021年較有影響力的兩部法規——《上海市數據條例》和《深圳經濟特區數據條例》都關注到公共數據質量問題。2021年通過的《上海市數據條例》多條提及數據質量管理,其中第35條要求“建立健全本系統、行業公共數據質量管理體系”及“組織開展公共數據的質量監督,對數據質量進行實時監測和定期評估,并建立異議與更正管理制度。”第73條又將數據質量管理列入長三角區域數據標準化體系建設中需要建立的“基礎性標準和規范”之范圍。類似地,《深圳經濟特區數據條例》也多處涉及公共數據質量保障,其第39條專門規定:“市政務服務數據管理部門應當組織制定公共數據質量管理制度和規范,建立健全質量監測和評估體系,并組織實施。公共管理和服務機構應當按照公共數據質量管理制度和規范,建立和完善本機構數據質量管理體系,加強數據質量管理,保障數據真實、準確、完整、及時、可用……”同類規定迅速出現在其后多地的法規、規章條文中,為地方政府開展公共數據質量保障工作提供了規范依據。

隨著地方性立法對公共數據質量日益重視,其中一些理念和措施尤為值得關注。在理念層面,2022年制定的《浙江省公共數據條例》第20條在規范層面明確提出“數據全流程質量管控體系”,與同年通過的《重慶市數據條例》《遼寧省大數據發展條例》《廣西壯族自治區大數據發展條例》等法規中要求建立的“質量檢測和評估體系/機制”等相得益彰,為公共數據質量保障提供了更系統的規范認知依據。在措施層面,《江西省數據條例》《蘇州市數據條例》《杭州城市大腦賦能城市治理促進條例》《北京市公共數據專區授權運營管理辦法(試行)》等規定了公共數據質量管控機制、數據質量實時監測機制、異議與更正管理機制、數據質量核查和問題數據糾錯機制、數據質量逐級倒查反饋機制等,為公共數據質量保障工作提供了更具系統性的規則集合形式,便利系列具體規則的形成和調整。

(二)現實舉措

與上述立法進程并行的是各類政策對公共數據質量問題的重視。圍繞公共數據質量的保障與提升,中央層面已給予高度關注。2022年國務院辦公廳印發的《全國一體化政務大數據體系建設指南》(國辦函〔2022〕102號)明確指出,“政務云平臺建設與管理不協同,政務云資源使用率不高,缺乏一體化運營機制。政務數據質量問題較為突出,數據完整性、準確性、時效性亟待提升”,總體上要求“構建完善數據全生命周期質量管理體系”,并且提出了一系列具體的目標和要求。2024年9月,中共中央辦公廳、國務院辦公廳又印發了《關于加快公共數據資源開發利用的意見》,明確要求“不斷提升政務數據質量和管理水平”,并且專門強調“強化數據源頭治理和質量監督檢查,實現數據質量可反饋、使用過程可追溯、數據異議可處置”。在中央文件的指引下,各地采取了一系列舉措,展示了地方政府提升公共數據質量的意向和目標。

在提升公共數據質量的實踐舉措中,以下三類尤為值得關注:一是數據質量方面的標準編制。例如,浙江省杭州市自2022年著手制定“公共數據質量治理”系列地方標準,其中《公共數據質量治理 第1部分:體系架構》(DB 3301/T 0364.1-2022)明確“公共數據質量治理”是指“提升公共數據質量過程中能力建設、問題發現、數據整改、績效評價等活動的集合”,并形成了公共數據質量治理體系架構圖。這一標準對于全面、系統地保障公共數據質量的政務實踐而言可謂首開先河。二是數據質量保障和提升的專項行動。例如,泰州市數據局開展2024年度公共數據質量提升攻堅行動,其中包括編制高標準高可用數據目錄、建立數據質量反饋整改責任機制,建立數據異議統一受理通道,建設個人數據空間、企業數據空間、行業數據空間等主專題庫等措施。前述C省G市專項治理工作開展后,數據質量評估得分提升至59.5分,數據項合格率提升至99.47%,數據指標合格率提升至81.37%,問題發生率降至0.03%。三是數據質量保障方面的組織建設,如N市某區構建“專班+專人”的數據更新機制,區級成立數據管理專班,各數據提供單位安排專人負責按時按質完成數據更新,專班直接將數據要求和整改意見直接通知到專人。相關舉措對數據質量的保障和提升已經產生了積極的效果。

整體上,我國已經形成公共數據質量保障從法律規范、技術標準到政策文件的一系列制度化要求,也積累了數據質量保障的有益經驗。在此基礎上,解決公共數據質量保障的若干關鍵共性難題是建立完備制度保障的重要前提。

三、公共數據質量保障的進路:通過設計的精細保障

前述法律與政策實踐盡管已取得一定進展,但整個公共數據質量保障體系尚未全面建立,而三個關鍵問題仍然有待解決:一是數據質量保障相關法律關系的清晰界定;二是質量維護途徑與法益影響結構的精準匹配;三是數據質量監控體系的深度擴展。這幾個問題頗為棘手,或許都需要在“通過設計的精細保障”這一進路中得到解決。

(一)保障進路的待決難題:法律關系、維護途徑與監控體系

國內公共數據質量保障法律與政策實踐表明,“數據質量”系列術語正日漸超越統計管理領域,而法律和政策在數據缺陷治理方面正在由過去的“信息維護范式”轉變為“數據質量管理范式”。然而,此種新的范式尚未全面進入公法學視野,無論是法理層面還是“技術—規則”層面都仍然存在基礎性的待決難題。

1.數據質量保障相關法律關系的清晰界定

行政法釋義學尚未發掘數據中潛藏的法律關系。如果數據可以左右權利和合法利益的得失或損益,甚至影響決策方向,就有必要通過法律關系確認和保障其中值得保護的法益。對于其中復雜的直接與間接影響,行政法律關系的結構化功能可以發揮積極作用,為不同路徑形成的法律關系建構出一個層級化的法律關系秩序。基于混合法律關系(gemischte Rechtsverh?ltnisse)和事物聯系理論(Sachzusammenhangstheorie),基于履行公共職能過程中形成的公共數據對公共職能履行的密切關聯性以及其中包含的公法義務,無論具體處理上述公共數據的機構為何種機構,這些數據法律關系均宜被認定具有公法性質。數據法律關系較之傳統法律關系圖式有其獨特性:數據是可被復制的,而且數據利用并不必然需要控制數據,許多情況下接觸者僅獲悉其中的信息即足以實現數據利用目的,因此一項數據可能被無限次復用,而不同主體的利用對于法律秩序及公共利益目標而言利弊多有不同,其法律關系必然更多地架設于使用或利用層面。對此,私法研究中已不乏類似洞見,而公法已有類似的制度安排。例如在德國,為了有效地保障基本權利,數據保護法制要求在利用層面上實行嚴格目的限定:數據只能用于其被收集時的目的(訪問、處理和使用期限的目的綁定);此種目的限定還通過透明度的要求得到保障,包括通知受影響者、報告義務、文檔義務以及有效的處理控制(知情權、反對權、獨立的監控機構等)。

然而,當前的行政法律關系理論框架尚較為粗疏,無論是人/物二分還是實體/程序二分,都難以涵蓋數據之上的公法法律關系。行政法釋義學僅僅認識到“數據保護不僅僅是在數字化電子行政中的特定問題,而是整個行政管理領域的事務”是不夠的,必須引入適合的法律關系框架以承載公共數據污染治理的制度實踐需求。例如,受數據質量缺陷影響的組織和個人應有機會有效參與數據質量缺陷發現和修復過程,此種道義上的應然性需要轉化為法律上的請求權(甚至形成權和支配權)方能在行政法上得以完整展開,既包括查詢、校驗、更正乃至一定前提下撤回和刪除的權利,也包括未來參與預防、發現和修復數據缺陷的更廣范圍“權利束”。這就要求公法建立某種“數據法律關系”的框架,全面發現和確認數據之上承載的法益及影響鏈條,并通過恰當的法律關系配置發揮其“結構化功能”,為各類主體防止和消除相應負面影響配置必要的“程序公權”,并確立侵犯相關“數據法益”的法律責任,使公共數據質量缺陷防范與修復進程在行政法治視野及行政法釋義學框架內進行。

2.質量維護途徑與法益影響結構的合理匹配

基于多元化的法益影響結構和缺陷發現能力,公共數據質量保障需要實現維護途徑與法益影響結構的合理匹配。單純自上而下的公共數據質量保障進路難以妥善、高效地解決三個現實問題:第一,公共數據質量保障動力有限。單憑有限的責任機制,不足以促使負有相應職責的部門或機構努力發現和消除數據質量缺陷,尤其是僅直接或間接影響個人、組織權益而幾乎不會干擾行政決策的缺陷,也難以對抗部分情況下人為篡改相關記錄的利益沖動。否則很難解釋公共數據中的部分錯誤記錄何以持續存在。第二,發現數據質量缺陷的信息源不足。僅靠自行檢查并不能充分有效發現數據質量缺陷,尤其是不會引起系統報錯及明顯偏離數據分布的缺陷,也難以發現數據粒度不佳和時效性不足等往往在數據利用過程中暴露的缺陷,待數據質量缺陷風險外溢而延及權益侵害后果或數據“空轉”局面發生時,很可能為時已晚。第三,應對數據質量缺陷的技術視野不足。相關部門和機構如有條件依托政務數據中臺等系統和數據處理工具,可以應對傳統形態和已預見的數據質量缺陷,但對于新型數據質量缺陷和攻擊風險的防御能力尚屬有限。對此,走向由眾多利益關聯方和技術服務提供者支持的參與式治理可謂勢在必行。結構化的參與式治理可以回應公共數據質量保障動力與信息源的不足。信息和行動能力高度不對稱條件下,參與式治理正是防范法益遭受隱蔽侵害的關鍵途徑。根據利益的重要性區分參與程度和形式是公眾參與的重要實踐經驗。通過確定特定行政過程涉及或者將要影響的各種利益,甚至進行利益評估與分層,以便界定相應的“參與強度”,才能實現公平、公正的治理過程。也唯有通過參與式治理,才可能引入更寬廣的視角和信源,突破服務商對公共部門客戶的“單向透明玻璃”,尋求數據質量缺陷的深層防治方案。

不過,在參與式治理中,質量維護途徑與法益影響結構的合理匹配并非易事。行政過程中的參與關系(Partizipationsverh?ltnis)凸顯了當事人間的衡平機制,但卻在行政計劃與規范制定方面呈現出難以用傳統法律關系思維梳理的復雜圖景。程序法上的各類衡平機制缺乏有效的蓋然性量化判斷,但在數據質量維護中卻必須對此予以考慮。設想所有利害關系方(包括個人和組織)均可直接訪問和修改數據是不可能的理想化方案。在保護合理訪問與修改機會及效率的同時也需要防范藉由修改而可能產生的篡改數據風險、不正當競爭風險、侵害個人信息乃至數據安全風險(如竊取其他數據、發動SQL注入攻擊等);對于受間接影響的利害關系方而言,法益影響程度、保護需求和訪問乃至修改數據的風險與成本之間也存在微妙的平衡,應設置一定的參與門檻和參與路徑以實現最優的行權效率與風險控制目標平衡,這就需要在參與結構中嵌入精準的、細粒度的權限控制和風險防控方案。不僅如此,對于受數據質量缺陷影響的公共利益而言,還需要在復雜的條塊組織結構中尋求合適的行權代表和行權機制,盡可能恰如其分地代表受數據驅動型決策影響的多元視角與利益。

3.數據質量監測體系的深度擴展

既有法律規范與政策實踐都關注到了數據質量監測體系,在技術視角中,這對于科學保障公共數據質量而言至關重要,能否發現數據質量存在問題是實現數據質量缺陷治理的關鍵前提。實踐中,數據質量監控體系正在走向成熟,數據質量標準、數據感知工具、數據剖析工具、數據驗證工具、數據清洗工具、血緣追蹤(Lineage Tracking)工具、比對校驗工具、元數據管理工具等已逐漸完備并在數據倉庫等系統中集成。公法制度接納日漸成熟的技術系統而構建數據質量監控體系并非難題,關鍵是如何確保公共數據處理和利用的全過程始終在法治框架內接受數據質量監控體系的保障,其中首要難題也是公共數據監測體系的發展。制約這一目標實現的主要因素不僅有公共數據的廣泛分散,系統配置與運行成本壓力,還包括公共數據處理的規模化發展、數據污染途徑和數據污染發現與防御手段的持續升級迭代。這就需要建設動態發展的專門性機制實現復雜條件下大規模、分散化的公共數據質量監測任務。此種專門性機制應當有能力從紛繁復雜的巨大體量的數據中全方位挖掘數據質量信息,深入發現可能存在的質量缺陷,并為此提供進一步定位和治理缺陷的路徑與建議。

前述種種待決難題要求數據質量保障制度具有顯著的開放性、精確性與技術性,這就需要一條能夠充分連接法律規則與技術架構的數據質量保障進路,并由數據質量保障相關法律制度給予認可與支持。

(二)通過設計的精細保障:基本理念與技術支持

上述所有待解決難題的“解題之道”都指向這樣一個規則體系:能夠有效識別公共數據的法益影響鏈條并確認不同主體在不同條件下的請求權、形成權與支配權,進而為此配置恰當的訪問與更正權限;能夠有效容納開放性的數據利用與質量監測需求并提供確定性的回應與反饋鏈路;能夠追溯和防控質量缺陷治理過程中的數據安全風險。通過“法律3.0”的模式,此種規則體系可以基于一定的技術設計集成化、精細化實現。對于此種融合法律規則與技術支持的融合式設計,已有“通過設計的隱私”(privacy by design)“通過設計的保護”(protection by design)等系列實踐。公共數據質量保障的進路,也可以類似地表述為“通過設計的精細保障”。這一進路的基本理念是盡可能通過技術機制精細地在實現數據質量保障需求時控制伴生風險,使基于不同法律關系和法益影響的各類權能可以在數據質量控制體系內部高效精準行使。

這一進路除基礎性的權益確認工作外,各種數據質量缺陷發現與治理措施都可以陸續集成到整個數據質量保障體系中來。數據和算法技術的發展已為此準備了必要條件。除常規的感知、清洗、剖析、驗證、追蹤、校驗、容災備份、自動恢復、權限控制、審計軌跡等工具外,即便是一些比較棘手的數據質量問題,也有了針對性的發現和保障技術,同時一系列有助于減輕數據質量缺陷對數據驅動決策影響的技術亦可集成到這一體系中。例如矩陣恢復算法能夠對矩陣數據作補全或去噪處理;穩健設計可以通過選擇最優參數組合或者改變估計方法來減少系統對噪聲變化的敏感性,從而達到減少系統性能波動的目的。

通過設計的精細保障要求在公共數據處理系統或平臺設計時即預留上述技術工具的加載空間和途徑,待相關技術工具應用條件成熟時逐步加入數據處理過程。對于公共數據處理與利用的一般場景,法律規范只需要就公共數據質量保障過程規定若干基礎性規則,例如同政府部門和公共機構的數據匯聚后,對數據真實性和準確性(或客觀性與完整性)存在異議的,應當有暢通的渠道和機制接受投訴,數據處理平臺應當就此專門設置數據校核請求權和數據更正請求權的行使途徑;對于某些易被污染或質量缺陷高發的公共數據系統,需要通過技術標準確認專門的檢測方法、過程和指標,實行數據質量實時或定期檢測。進一步的質量控制與保障要求(尤其是數據利用層面對時效性和顆粒度的要求)可以訴諸法律規范指向的相關技術標準。對于數據質量保障及數據安全需求較高的場景,法律、法規或規章應針對性地作出專門規定,包括質量保障目標、主要措施與制定和完善相關標準的授權。

通過設計的精細保障進路與未來政務云平臺建設和全國一體化政務大數據體系的形成趨勢是相符的。2022年,國務院發布《國務院關于加強數字政府建設的指導意見》(國發〔2022〕14號,以下簡稱《指導意見》),明確要求“依托全國一體化政務大數據體系,統籌整合現有政務云資源,構建全國一體化政務云平臺體系,實現政務云資源統籌建設、互聯互通、集約共享。國務院各部門政務云納入全國一體化政務云平臺體系統籌管理。各地區按照省級統籌原則開展政務云建設,集約提供政務云服務。……”盡管《指導意見》中的要求未必迅速成為現實,但客觀需求和發展規律使政務云建設勢在必行。隨著公共數據體量的日漸龐大、計算開銷的大幅增長、智慧政務的持續發展、數據安全要求的不斷提高以及云原生技術的成熟,政務數據乃至更大范圍內的公共數據不斷“上云”集約處理當屬大勢所趨。云平臺對于精細劃分權限、多用戶多任務并發處理、保留訪問和操作記錄等已可謂駕輕就熟,并不需要成本高昂的額外軟硬件工具即可實現大部分精細保護需求,還可以內置一般性的及按需定制的數據質量監測模塊,為不同權限的使用者對相關數據實施質量監測提供便利。由此,在技術條件日益成熟的前提下,如何通過合理的法律制度支持“通過設計的精細保障”即為問題之關鍵。

四、公共數據質量保障的基礎性制度設計

通過設計的精細保障在邏輯上要求先明確“保護什么”,繼而回應“誰來保護”的問題,隨后解決“如何保護”的具體措施安排,這就要求公共數據質量保障方面的法律規范包含若干關鍵基礎性制度設計,形成質量保障制度的核心架構,進而在實踐探索中逐漸引入更為豐富的規則和標準,形成日益完備的數據質量保障體系。“保護什么”意味著首先需要確認受公共數據質量影響的法益;“誰來保護”要求建立結構化的參與式治理制度;“如何保護”則需要全面吸納不斷發展的數據質量保障技術,探索建立能夠應對不同場景下海量分散公共數據質量監控任務的規則和機制。

(一)公共數據法益確認制度

公共數據法益確認制度既有助于為保障數據質量提供動力,也有助于保護受數據質量缺陷影響的法益。行政法釋義學并未對受公共數據質量缺陷影響的法益提供現成的法理,相關法益的辨識和確認需要探索合適的認知架構。總體上,受公共數據質量缺陷影響且法律予以保護的利益有兩個方面:一是政府和公共機構利用數據處理相關事務的相對人,數據表征了相對人在“數字空間”中的某種狀態;二是各類用戶利用開放公共數據或公共數據授權運營產品、服務可能依法獲取的經濟利益。前一種利益包含了傳統實體法益、程序法益和個人信息保護方面的法益,數據質量方面的缺陷可以影響當事人的法律狀態,導致相關數據表征的法益遭受風險,可以借鑒德國法上保護個人或法人已經擁有的法律地位或權利的“維持現狀利益”(Bestandsinteresse)而稱之為“狀態法益”。后一種利益則包含了數據利用活動本可能產生的正當利益,本質上來源于數據的使用,可以稱之為“使用法益”。公共數據相關法益的確認應該涵蓋狀態法益和使用法益。

對于狀態法益而言,直接影響所對應的狀態法益只需要概括性的法律規則即可確認,《個人信息保護法》和《政府信息公開條例》等法律法規甚至提供了部分直接行權途徑。不過,既有法律法規的規定均僅針對個人或組織自身的信息,而不及于其他主體可能與特定個人或組織存在利害關系的信息,因此關鍵是如何確認受間接影響的狀態法益。對此,需要全面辨識現行法律制度中各類超出個人或機構自身意志控制范圍的確定性和高度蓋然性連帶影響(如犯罪記錄對近親屬就業的影響、“董監高”違法犯罪記錄對企業上市和股票發行的影響、特定職業禁入和禁止參與特定業務名單對部分單位正常開展業務的影響等),包括公法和私法上各種連帶義務、連帶責任、連帶性權利取得與行使條件以及其他形態的利害關系,并為此專門列舉行使數據質量缺陷修復請求權的前提條件,支持狀態法益受間接影響的主體維護合法權益。確認受直接和間接影響的狀態法益,將為利害相關方參與維護數據的客觀性、完整性充分暢通權益保障與救濟渠道。

對于使用法益而言,公共數據質量的缺陷將不同程度上影響用戶利用開放公共數據或授權運營數據產品、服務的經濟收益。受使用法益影響的主體不僅重視數據的客觀性和完整性,也相對更有動力發現公共數據在時效性和顆粒度方面的缺陷。在公共數據的利用收益尚難以完全確定、社會利益與經濟利益兼備的前提下,需要為用戶參與發現和反饋質量缺陷提供更廣闊的通道。只要使用者實際上直接參與了公共數據的開發利用,不論其直接期望從中獲益多少,均應確認其使用法益存在,并且明確其有權反饋數據的時效性、顆粒度等影響利用價值方面的缺陷,為其參與數據質量缺陷發現和治理提供便利。

(二)質量缺陷參與治理制度

公共數據質量保障需要建立全方位的質量缺陷參與治理制度。在宏觀層面上,這一制度可以嵌入信息行政法(Informationsverwaltungsrecht)。信息的收集和傳遞是合作知識生成和決策的基礎,而完整、及時且可靠的知識提供是行政行為質量和合法性的中心條件之一。與行政聯合體(Europ?ischen Verwaltungsverbundes)相應的信息聯合體對此負有保密和數據保護的責任,這在今天已經成為信息行政法的一部分。盡管獨立的主權國家不存在所謂的行政聯合體或信息聯合體,但相應的知識提供和數據保護責任也需要為公共事務處理的法理所確認。在微觀層面上,這一制度需要根據受影響的法益類型和數據權屬設計兼容多元主體參與的質量保障機制,確立體系化的公共數據更正(請求)權及權利行使程序,并有效控制數據安全風險。

原則上,狀態法益受數據質量缺陷影響時,相關法律主體可以對來源自身的數據依法行使更正權,而對非來源于自身的數據行使更正請求權,相關數據系統應為各種行權途徑預留技術支持空間,實現“通過設計的精細保障”。在民法學的討論中,基于數字勞動理論和洛克式的財產權限制要件,數據來源者權利的正當性得以證成,權利內容具體包括訪問權(含控制權)、使用權、收益權。這一框架對于公法學而言有一定參考價值,但尚存在不足。數據來源者對于與來源自身的公共數據通常應當享有訪問權和更正權(國防、國家安全、治安等領域列入保密范圍的數據除外),但此種權利的來源并非數字勞動,而是基于程序公正和行權效率的公共利益考量,由數據來源者對自身數據進行核對與修改是最為合理的,但相關訪問與修改必須留存記錄且接受相應行政機關或公共機構的校核。狀態法益受非來源于自身數據的質量缺陷影響時,如果訪問相關數據不涉及國家秘密、商業秘密和個人信息保護等法律限制,法益主體應享有對整個法益影響鏈條上的數據的訪問權和更正請求權;如訪問相關數據受法律限制,而法益主體有理由認為自身的狀態法益受數據質量缺陷的不利影響,則法律至少應當賦予其數據校核請求權,請求有權組織校核數據的客觀性、完整性,并告知結果。

使用法益受數據質量影響時,由于利用公共數據已存在范圍限制(如外部用戶可利用的數據應為脫敏脫密數據),具備使用法益的主體應有權在安全可控的前提下對所利用公共數據的質量實施監測,并向對相關公共數據質量負責的部門或機構反饋結果。此種反饋結果并不限于數據客觀性、完整性缺陷,諸如數據粒度過粗、數據時效性不足或數據統計方式不合理等亦可作為反饋內容。相關制度設計的關鍵在于要求系統設計時集成數據質量保障工具乃至預留安全可控的外部監測工具接口,支持數據使用者運用各種安全可控的監測工具對數據質量作深度觀察分析,同時鼓勵公共數據處理平臺運用隱私計算、同態加密、零知識證明等技術,在原始數據不出域和計算負擔合理的情況下,向用戶提供部分不宜直接訪問的數據的部分質量監測結果和關于特定數據集客觀性、完整性的有效信息,便于用戶基于自身所擁有及可訪問的數據進行交叉驗證,發現潛在的數據質量問題。鑒于提升數據粒度和時效性等關系利用價值的質量指標往往存在成本約束,相關反饋機制還應允許用戶報告數據利用的具體質量需求與預期經濟利益,以便政府部門與用戶(有時還包括公共數據授權運營組織)之間就提升數據質量展開協商,針對性地改進公共數據質量。

支撐此種參與式治理的關鍵是需要構建兼具確定性與建設性的反饋回應機制。數據質量監控體系的完整建立需要在技術性數據質量監控系統之外全面、動態地強化符合數據質量提升規律的正向反饋循環。數據質量存在的缺陷與問題只有在使用中才會被充分發現和體驗,而使用者發現問題是否有足夠的意愿、能力和暢通的渠道提供反饋,反饋問題后是否會受到及時重視、回應與解決,相關主體是否有動力和資源處理相應問題,都制約著反饋循環的建立和數據質量的提升。關于問題是否可能得到有效解決的主觀感知很可能受到實際回應態度、時間和解決問題概率的貝葉斯式影響,而且會在一定圈層內產生傳播效應,因此實際回應和解決問題的比例下降,均可能引發反饋問題占發現問題比值的相應非線性下降。同時,使用者未必能精準地判斷數據質量缺陷的來源與程度,往往也很難判斷問題得到解決的準確概率,可能只能感受到一個模糊的概率區間,因此,法律制度應當明確要求相關質量保障部門對有具體內容的反饋作出包含明確判斷的有效回應,并對有實質內容的模糊反饋作出建設性回應,既致力于維持有效回應率和暢通信息交互渠道,也致力于從交流中發現數據質量缺陷的線索。

在上述參與途徑的基礎上,參與式治理制度中還應包含數據修改意見沖突處理機制,由對相關公共數據質量負責的部門或機構對爭議數據進行校核,聽取各方當事人的意見,最終作出數據處理決定并說明理由。盡管公法學未必能夠就公共數據處理一蹴而就地確立某種“數據正當程序”的法理,但通過此種制度安排,可以逐步形成數據正當程序的制度輪廓,進而在未來支撐更深入的數據質量參與式治理機制實施。上述數據處理需求均應在相關系統設計(包括開發階段或升級迭代)時嵌入,實現“法律—技術”過程的有效融合。

(三)數據質量深度監測制度

前述兩方面的基礎性制度設計主要是充分調動受數據質量影響的各方主體參與數據質量治理,盡可能在合理成本負擔前提下發現并修正各種集中或分散存在的公共數據質量缺陷。伴隨數字政府建設、公共數據體量持續膨脹和智慧政務、智慧城市等進一步發展,零敲碎打式的分散治理途徑并不能承載公共數據質量保障的主要壓力。公共數據質量保障的主干途徑仍然應當聚焦集約化的數據質量監控與提升途徑,建立和完善可由公共數據處理平臺負責實施的數據質量深度監測制度,有效應對成規模、高負擔的數據質量治理需求。

數據質量的深度監測需要深入考察數據間的相關性和因果性,引入多層次、多模型的交叉驗證,維護數據的客觀性、完整性和時效性。公共數據之間存在廣泛的潛在相互關聯,通過挖掘關聯性可以實現對不同數據項的驗證和估計。某指數用新增用電量、新增鐵路貨運量、新增銀行貸款三項數據估計經濟狀況數據,本質上就是利用了公共數據之間的相關性和潛藏的因果關系。在不同數據源之間的數據進行交叉驗證,并不局限于簡單的數值比對,而是需要進一步擴展到模型級別的相互核驗,相當于將各個數據源視為缺失數據集,進行廣泛的因果關系發現,驗證各模型之間的一致性,及時發現數據失真、缺漏及部分數據集時間滯后等導致數據一致性、聯合分布和因果關系異常的問題。缺失數據集因果關系發現的研究成果在各個領域都有廣泛的應用,最起碼能夠實現一定條件下的數據補全,這就足以實現一定程度上的交叉驗證;基于各個數據源的因果發現,還可以進一步了解數據間不一致的可能成因及缺陷所在。即便自動化的數據質量保障工具無法確定和修復缺陷,也可以指引工作人員進行人工排查與修復。惟有模型級別的交叉驗證才能應對海量多源數據的復雜質量保障需求,進而在公共數據得到相關數據平臺的全面數字化處理時,實現涵蓋“云—庫—表”各層次的數據質量動態監控。

當然,公共數據的大規模匯集可能引發越權決定、程序違法、數據操控等風險并放大數據隱私和安全風險,但此種數據質量深度監測方式并不要求數據的匯集,而只需要交換數據補全和因果發現后的比對結果,提供數據質量缺陷的可疑路徑及分析證據,并不需要向各部門、各機構披露不屬于其職能范圍的原始數據,產生類似于隱私計算的結果。公共數據質量保障的法律制度僅需要為此種深度監測提供實施多方計算的授權和規定數據安全保障及個人信息保護要求,至于是否需要及何種程度上匯聚公共數據,則可以由立法者根據公共數據利用與數據安全、個人信息保護及相關權益保障之間的平衡具體決定,并以相應技術標準或指南指引未來公共數據處理平臺的技術設計及數據處理過程管理規則的形成。

五、結語

在數字政府和數字社會的建設與發展進程中,公共數據的質量舉足輕重。盡管“數字行政法”和“數據公權”等重要的法理基礎仍有待發展,強化公共數據的質量保障已屬時不我待。隨著公共數據規模的持續膨脹和數據利用方式的日益復雜,公共數據的質量保障必將成為一項支撐整個數字政府和智慧政務基礎的大型制度工程。本文可以被視為拋磚引玉式的初步嘗試,隨著公共數據洪流自“一葦可航”發展至“連山排海”,亦必將催生更深入、更豐富的后續研究。數字行政法需要面向數據洪流構筑堤壩、挖掘引渠和布設濾網,始終防止公共數據的處理和利用非法或不當侵蝕公民和法人的合法權益,也防范數據質量缺陷對公共利益目標的種種危害,為數據價值在公共領域的釋放豎立堅實屏障。

主站蜘蛛池模板: 济阳县| 和静县| 锦屏县| 阜宁县| 射洪县| 宜宾县| 方山县| 冀州市| 华亭县| 云阳县| 股票| 金塔县| 彰化市| 彭阳县| 高雄县| 伊宁市| 沙坪坝区| 晋城| 新和县| 奈曼旗| 南汇区| 余姚市| 麻江县| 墨脱县| 昌宁县| 永康市| 瑞安市| 深泽县| 巫山县| 千阳县| 日照市| 松江区| 乾安县| 慈溪市| 故城县| 九龙坡区| 黎平县| 乡宁县| 大安市| 榆中县| 浦县| 甘南县| 突泉县| 天长市| 津市市| 嘉禾县| 甘谷县| 娄烦县| 亚东县| 固原市| 洛扎县| 旌德县| 正阳县| 齐河县| 青阳县| 加查县| 榕江县| 南开区| 宾川县| 五原县| 丹凤县| 靖远县| 石门县| 秭归县| 探索| 广东省| 高尔夫| 贵德县| 昔阳县| 上虞市| 千阳县| 玉树县| 甘肃省| 湟中县| 当雄县| 察隅县| 松潘县| 安达市| 电白县| 区。| 霍城县| 尼木县|