微信掃一掃
那么,
為什么要對個人一生的數(shù)據(jù)進行檔案化治理?
怎么治?
未來又能發(fā)揮什么效用?
每個人的一生,其實都在產生數(shù)據(jù)。有數(shù)據(jù)專家認為,對這些數(shù)據(jù)的處理會涉及到兩個問題,一是保存,即如何將紙質檔案數(shù)據(jù)化,便于儲存和查找;一是治理,怎么讓數(shù)據(jù)歸屬和關聯(lián)到我們每個人,讓數(shù)據(jù)產生意義。
浩如煙海的檔案,不僅在保存上是個難題,傳播和利用也極為困難。
此時,數(shù)字化無疑成為一項重要“法寶”。2021年7月,《浙江省檔案工作數(shù)字化改革方案》印發(fā),要求加快檔案資源向數(shù)字化、數(shù)據(jù)化轉型。浙江在數(shù)字化改革的基礎上,依托公共數(shù)據(jù)平臺建立專題數(shù)據(jù)庫,并依照“一數(shù)一源一標準”的原則對公共數(shù)據(jù)進行整理。
“公共數(shù)據(jù)平臺就像一個水池,把與檔案相關的數(shù)據(jù)放進去,經過清洗、比對和關聯(lián),建立專題數(shù)據(jù)庫,相關部門需要時可以進行申請?zhí)崛?。”浙江省大?shù)據(jù)發(fā)展中心主任金加和向記者介紹,目前,依托平臺已歸集檔案相關數(shù)據(jù)536.1萬條,賦能省檔案館、省司法廳等18個應用,累計調用4003.9萬次。
然而,一邊是檔案數(shù)據(jù)化“熱”,一邊卻是數(shù)據(jù)檔案化“冷”。浙江大學公共管理學院副教授章燕華指出,目前檔案實踐已經普遍引入了數(shù)據(jù)理念和方法,但把檔案理念引入數(shù)據(jù)實踐卻鮮有人關注。
“為什么數(shù)據(jù)經過了標準化的處理,還需要進行檔案化治理?”嵊州的研討會上,有人拋出了這一疑問。
章燕華用“機器友好”和“人類友好”的對比來解釋其中區(qū)別,“‘一數(shù)一源一標準’治理后的數(shù)據(jù),主要用于計算機系統(tǒng)內部處理。而檔案化治理將和個人有關的數(shù)據(jù)進行匹配、關聯(lián),數(shù)據(jù)由此成為了一個連續(xù)體,可以按照人的一生來還原、建立其重要數(shù)據(jù),意義重大?!?/span>
研討會上,嵊州市檔案館、嵊州大數(shù)據(jù)中心重點討論了項目所遇到的難點。要想實現(xiàn)數(shù)據(jù)檔案化治理,技術上并非一蹴而就。
比如第一步原文識別就遇到大麻煩。技術人員在數(shù)據(jù)匯集時發(fā)現(xiàn),很多年代久遠的證明材料經常出現(xiàn)姓名印斜、字跡模糊等情況。這導致通過OCR技術識別出的字符和真實信息偏差很大,精準度不到60%。正當項目陷入僵局之時,嵊州大數(shù)據(jù)中心數(shù)據(jù)資源科科長徐成鋼靈光一現(xiàn):“不如先保證識別出最關鍵的信息身份證號,再把姓名、檔案號等信息作為備選條件,同時通過現(xiàn)有身份系統(tǒng)進行比對核實?”
果然,分步測試后,數(shù)據(jù)識別的精準度達到95%以上。
到數(shù)據(jù)匯聚這一步,直接考驗當?shù)亟陙頂?shù)字化成效。徐成鋼向記者展示了一張Excel統(tǒng)計表格,僅在“出生”這一場景,就涉及到出生醫(yī)學證明、戶口登記、居民身份證等8項證照的信息收集,每類信息還可能關聯(lián)到不同部門。還好,省里的一體化數(shù)字資源系統(tǒng)(IRS)可以回流數(shù)據(jù),將相關信息與有關業(yè)務系統(tǒng)進行對接,充分保證了數(shù)據(jù)的全面。
出生證新生兒身份證號如何補全?不同部門的數(shù)據(jù)產生沖突怎么辦?……在第三步的數(shù)據(jù)比對、校驗、加工等過程,難度持續(xù)加大。面對海量數(shù)據(jù),這些過程都要迅速完成,構建一套智能算法是關鍵。于是,項目專班與負責技術研發(fā)的杭州安鉑數(shù)據(jù)公司一道,構建了數(shù)據(jù)校驗算法3種、數(shù)據(jù)加工算法5類,用于補全關鍵業(yè)務字段值,并通過身份證信息,構建個人基本信息數(shù)據(jù)專題檔案。
“目前對于少量缺失或異常數(shù)據(jù),還需要進行人工查找和核對。隨著算法的不斷進步,相信很快這個系統(tǒng)就能實現(xiàn)全自動化。”杭州安鉑數(shù)據(jù)公司總經理王青云表示。
據(jù)悉,項目組整整用了半年時間,最終完成4114萬條數(shù)據(jù)的匯聚與808萬條數(shù)據(jù)的治理。嵊州市71萬戶籍人口基本每人實現(xiàn)了自己的電子化“一人一檔”,隨著項目推進,每個人以前、現(xiàn)在、今后產生的幾乎所有公共數(shù)據(jù),都可以以身份證為索引進行檢索、調用,而不是以前那樣分散“躺”在各種系統(tǒng)、表格中。
“如果將海量數(shù)據(jù)比作礦產資源,那么數(shù)據(jù)治理的過程就像金屬的冶煉,通過分類分級和加工處理,將寶貴的金屬材料從礦石中提取出來,滿足不同用戶的需求。”金加和直言,經過精細化治理的數(shù)據(jù),才能體現(xiàn)數(shù)據(jù)資源的價值。
“在嵊州,像我這樣在外地做生意的學生家長很多。以前給孩子報名很麻煩,不僅來回出行成本高,一旦哪個紙質證明找不到,一家人還要翻箱倒柜忙碌好久?!庇浾呗?lián)系上了在天津做小籠包生意的二孩媽媽徐女士。她說,自家二寶報名,不再像大寶報名那樣要奔波勞碌。盡管人在外地,但她登入“浙里辦”應用的網上報名系統(tǒng),所有信息會自動匹配,幾乎能夠“一鍵報名”。
這一變化,也是浙江數(shù)據(jù)治理進階之路的體現(xiàn)。通過將個人相關的檔案數(shù)據(jù)推送至“浙里辦”應用中的“浙里檔案”,數(shù)據(jù)壁壘被打通,百姓辦事自然也更方便。目前,核心業(yè)務已拓展至中小學報名系統(tǒng)、電子病歷系統(tǒng)、智慧交通系統(tǒng)等。
“我們除了在服務側為老百姓提供便利,還在治理側將應用上架‘浙政釘’,方便政府部門協(xié)同推進數(shù)據(jù)治理?!贬又菔袡n案館副館長汪偉民向記者介紹。
例如,“個人全生命周期檔案”項目中的“出生駕駛艙”,就能夠為嵊州市衛(wèi)生健康局判斷嬰幼兒托位數(shù)、制定鼓勵生育措施等工作提供依據(jù)。此外,項目還開發(fā)完成了教育、就醫(yī)、養(yǎng)老、身后共5個場景的大屏建設,為教體局、人力社保局等多個部門提供數(shù)據(jù)支撐。
眼下,數(shù)據(jù)檔案化治理仍處于探索階段,由于數(shù)據(jù)治理標準規(guī)范不一、數(shù)據(jù)質量參差不齊,許多改革參與者、研究者仍感到在“摸著石頭過河”。但采訪中,大家不約而同地都對它的“變身”充滿期待:預計今年年底,應用場景將拓展至10個人生階段,覆蓋個人全生命周期;未來,還能基于模型算法構建完整的人物社會關系圖譜,為化解民事糾紛、資產溯源追蹤等提供支持。
向更遠處看,浙江的數(shù)據(jù)治理之路將通向何方?在數(shù)據(jù)標準化、檔案化的基礎上,如何更進一步,推動數(shù)據(jù)資源更廣闊的應用,是不少專家學者的共同關切。
研討會上,數(shù)據(jù)專家為我們描繪了一條數(shù)據(jù)治理的“進階之路”:“標準化讓數(shù)據(jù)治理制度更加標準,檔案化讓數(shù)據(jù)更有價值。未來,還可以將數(shù)據(jù)資源變?yōu)閿?shù)據(jù)資產,讓數(shù)據(jù)可控制、可度量、可變現(xiàn),探索開展數(shù)據(jù)質押、數(shù)據(jù)信托,促進數(shù)據(jù)資產化應用,培育數(shù)據(jù)要素市場,助力數(shù)字經濟高質量發(fā)展?!?/span>
來源:浙江日報
嵊州生活網友情轉載,版權歸原作者所有,如有標注作者及出處有誤、侵權煩請告知,我們會立即刪除并表示歉意。
2019-2020 shengzhouw.com All Right Reserved 《嵊州生活網》版權所有
電子郵件:349829937@qq.com 法律顧問:浙江計然律師事務所 趙士建(律師)浙公網安備 33068302000729號 信息產業(yè)部備案/許可證編號:浙ICP備19052336號-3