盧希鵬專欄《數位足跡…防疫關鍵》
盧希鵬專欄《數位足跡...防疫關鍵》

盧希鵬專欄《數位足跡…防疫關鍵》

  猴子為什麼不能戴眼鏡?因為猴子在叢林中生活,需要用餘光觀察周邊行為。人類戴了眼鏡之後,就開始「聚焦」看報表,漸漸地就失去了用餘光看周邊視野的能力。結果,當叢林中有了風吹草動,猴子馬上就跑走了,人類通常都要等到報表出來,開了會,才確定有風吹草動,然後再花一個禮拜,聚焦把行動計劃列出來。這個時候,猴子早已逃到不知去向了。

  其中的關鍵是,人類看報表,猴子觀行為。報表是事後的資訊,行為是事前的訊息。過去的資料挖礦技術,分析的是交易後的資料庫報表,而這波人工智慧物聯網的大數據革命,看的卻是交易前的數位行為足跡。

  那麼,這次的新冠肺炎防疫,你是人類,還是猴子?報表記載的是過去的事,如果要料敵機先,我們需要更多的行為訊息。

  在這次台灣的防疫上,衛福部做得相當不錯,建立了疾管家官方平台,杜絕了假新聞,隨時公布「過去」最新發生了甚麼數據與新聞,這是人類的特色,聚焦看報表,都是事後的資訊,對瞭解現況,很有幫助。於是,有人要求,要看到更多的數據。要公布確診者的城市、行政區、社區、還是某一棟大樓?這掀起了一個議題,就是數據是誰的?不過,這也還是報表,不是行為。在這次防疫措施,我們缺少了料敵機先的行為數據。

  舉例來說,你在搜尋引擎輸入的關鍵字,就是一種數位行為足跡。在2009年《自然》期刊登載的文章:Detecting influenza epidemics using search engine query data (運用搜尋引擎關鍵詞數據監測流感疫情),發現各區域民眾在Google 輸入的關鍵字次數(諸如流感症狀、流感治療方法等等),與美國CDC一天後通報的各區域流感確診數量有高度相關(相關係數0.85以上)。也就是說,在新冠肺炎的防治上,我們除了多少人確診的報表,是否也有數位足跡來預測台灣各區域的風險指標。人多的地方不要去,前幾天搜尋新冠肺炎關鍵字多的區域,最近更不要去。

  當然,社群媒體的發達產生了社會傾聽(Social Listening)技術,朋友之間的交談關鍵字,甚至是社會資本結構的位置,都成為預測未來的重要行為足跡。發表於2010年的另一篇研究論文中,隨機找了319位哈佛大學的學生,然後請他們提供好朋友的名單,被提到一次以上名字的朋友(表示是人緣好的連結者)共有425人。結果朋友組的425人,平均感染流感的時間,比隨機組提早了兩個禮拜,發生疫情高峰期,也提早了46天。學校已經開學,企業已經復工,人緣好的人(如社團幹部或企業主管)就要注意了。如果他們有相對高的風險,是否要求他們一定要戴口罩,並且做好定期的檢查。

  行為的數據並不好找到。因為資訊報表是收集來的,而行為數據卻是沉澱下來的,因為行為都會留下足跡。除了關鍵字、社群討論內容、社會資本結構之外,還有人員流動的資訊。譬如,高風險的人在哪?正在從哪移動到哪?Google的導航系統為什麼可以算出哪條路段正在塞車不要去,就是有了去識別化的人員流動的大數據,但是如果政府要做跟Google類似的事,隱私權與數據權的衡量,就是另一個課題了。畢竟,有文明的人類,是不習慣做猴子的。

關閉