About medalab

This author has not yet filled in any details.
So far medalab has created 61 blog entries.

應用數學和深度學習的關係

2020-12-09T18:25:06+08:00

應用數學和深度學習的關係 作者:Manuchehr Aminian 近年來,深度學習(DL)在各種科學計算領域中帶來了可觀的進步。建基於人工智慧的基礎上,使用到了眾多的應用數學元件,應用數學和DL之間到底是有什麼關係? 這個問題正是Yann LeCun (臉書&紐約大學) 在2020年年初虛擬SIAM數據科學數學大會的大會演講主題。在演講中,LeCun簡短的介紹了機器學習(ML)的歷史,闡述了與之緊密結合的數學根基,發表了自己預期的ML未來與跟這有關的數個廣泛開放性問題,並提及了應用數學與機器學習現在的關係和未來可能帶來的貢獻。對神經網絡,ML,和DL不熟悉的讀者可以參考吉爾伯特·斯特朗在2018 SIAM新聞“深度學習的功能”文章中的介紹。 隨機梯度下降法 LeCun直接點出應用數學和DL最根本的連結:梯度下降法和最佳化。DL的目的在找出非線性函數的最理想參數組,以完成確實的任務,像是圖像分類或是文字預測。研究人員套用一種特殊的梯度下降法來找尋最佳參數組。  應用數學家常常在數值線性代數學中使用梯度下降,求Ax=b線性系統的近似解。解答x*相當於函數||Ax-b||22的最小值,從初始的猜測值x0開始,帶入所有的可能x值。研究人員將梯度下降形容為一個“向山下走”的過程,在每一步驟中都往最陡的方向做選擇。最後會產生出一系列的近似值xi,在對稱正定矩陣A上,保證會收斂到一個唯一的最小值。這種函數無可否認很特別,讓使用者可以把理論做廣泛的延伸,也因此被納入一般課堂教授內容中。  圖一。套用隨機梯度下降法到圖像資料集,近似損失表面的形象化。圖由Tom Goldstein提供。 相比起來,在DL中必須最小化的函數--所謂的”損失函數”--通常是非凸且非線性,更難以得到理論性的保障。然而,實作人員會使用基於梯度的方法,特別是會採用一個修改過的特殊版本,隨機梯度下降法 (詳圖一)。這裡的隨機形容的是損失函數的評估過程;不一次使用所有的訓練資料來評估損失,而是在梯度下降法的每個迭代運算中隨機選取資料子集來使用。LeCun把這個稱為“在霧中向山下走”。每個樣本在方向上做出充滿雜訊的估計。這個隨機的處理方式在實用上有顯著的成果。LeCun說:“沒有人會考慮其他的方法”。但是,為何這個方法會成功還有待研究人員提出理論來解釋。 過度參數化和深層網絡 接著,討論到仍有需要理論突破的範圍,LeCun首先提及了一個跟傳統數學和統計觀念相矛盾的現象:解釋DL的過度參數化模型。數學家約翰‧馮‧諾伊曼有一句名言 :“給我四個參數,我可以擬合出一隻大象。給我五個參數,我可以讓大象擺動象鼻”。這觀點反映出數學模型建模人員常有的態度,提醒建模人員要注意數學模型裡的參數數量和數據擬合後會得出的結果。數學家們普遍熟悉在擬合高次多項式時過度參數化的危險性。同理,參數擬合和可識別性本來就是微分方程模型中常見的問題,特別是當模型之間有大量的互動元件時。 但是,多年的DL實作經驗得出的卻是一個不一樣的結果。用兩個相同目標神經網路的比較來說明。有更多參數的網絡 -- 常常比起數據量,有倍數的參數數目 -- 會數值收歛到損失函數中,擬合訓練數據,並成功預測沒見過的資料。相反的,“較小”的網路經常會陷在損失曲面的局部最小值中,有收歛上的困難。 LeCun指出研究人員普遍了解這些過度參數化的網路會通過隱式正則化自動的在訓練時降低"等級",但也表明這方面的理論仍然是個謎。他因此建議應用數學家應該對這方面的知識做出貢獻。 應用數學做為背景的價值   DL在透過卷積神經網絡(CNNs)的圖像處理上特別的成功。LeCun在他的演說中就提及了許多成功的案例,包括醫學影像分析,自駕車輛,和自動緊急煞車系統。但是,是因為應用是建基於矩型點陣的圖像上,DL卷積處理才能成功的做套用。其他應用的圖像若沒有這個結構就會無法順利的套用。 圖卷積網絡就是把卷積網絡泛用到任意圖形上。LeCun瞭解延伸CNN工具到任意圖形依賴的是傅立葉變換。要套用卷積到圖像上,先在數據上使用傅立葉變換,接著過濾,相乘,最後再使用逆傅立葉變換。不同於一般的電腦科學家,大部份的應用數學家對這些工具都相當熟悉。因此他們比較容易體會實務問題跟總體理論背景的關係,容易對DL社群做出貢獻。 但是,應用數學和DL社群之間的關係不是單向的。LeCun提到實作人員希望能發展出DL方法來加速求得偏微分方程(PDEs)的數值解。過往在解答PDE時,依賴的是有限差分解或微分算子的有限元素離散化。但是在碰到剛性和/或高維度疑問時,會遇到時間和空間變數離散化的問題。當小心遵從物理定律無法順利的帶出數值解時,可以嘗試用被訓練過的神經網路來取代解答算子,透過一組範例求解。雖然這類神經網路會有準確性,精確性和守恆量保存等問題,潛在的加速卻相當可觀。在LeCun的演講中,他就提及了應用到晶格量子色動力學,流體力學和天體物理學的可能性。 一個統一的觀點 從前,神經網路主要是受想了解生物腦部運作的欲望所驅動。LeCun在演講中提到了使用DL來模仿人類學習,推理和計劃復雜事務。引述LeCun的話語,人類是“幾乎不被監督,很少被強化。” 這是為什麼?舉例來說,要成功套用深層網路到圖像處理上需要數千甚至數百萬個標記完的樣本和適合拿來做訓練的強大計算功能。神經網路在訓練過的同種類圖像中或許可以成功運作,但是若碰到沒有在訓練時見過的新圖像種類,就必須從頭做訓練。使用者也必須告知機器在處理新種物品。 這和嬰兒的學習方式明顯不同。他們在看過一個物體幾次之後就能做出正確的辨識,只需要少量的努力和微量的外部干涉。如果ML的最大目標是了解人類的學習方式,就必須仿效人們學習的速度。這個研究方向出現在各種各樣的技術上,或屬於或跳脫出現有的思考典範中;LeCun一併把這些任務歸類在“自我監督學習”中。 雖然監督學習和強化學習在獨立任務中有確實成功的案例,LeCun卻相信無論硬體如何提升,這些思考典範永遠不可能演變成“通用人工智能”。他更在演講中陳述了在發展這些方式時會遇到的根本性挑戰。其中,LeCun認為強化學習最終會無法順利的探索性質空間,尤其是在引進自然智能“很少被強化”的特徵後。他相信研究人員若使用強化學習,甚至連“貓等級的智能”都無法順利發展,更不可能做出“人類等級的智能”。因此,LeCun在演講的下半段提出了一個替代方案,透過以能量為基礎的模型做自我監督學習。這個方法完全不需要神經網路,而是使用能量曲面,獲得輸入值之間的依賴關係,可做到多輸出的預測。他簡要地敘述了幾個可能的方案但預期最後會被選定的架構是基於能量的規律化潛變數模型。 LeCun在最後更回答了一個常常遇到的問題:到底DL是自然科學還是工程科學?它是科學還是煉金術?他含蓄地點到說其實DL比較像煉金術,但是也不忘提醒“就因為我們不理解,不代表我們不應該使用”。LeCun提起歷史中機器的推出和之後理論的發現常常有一個長時間的間隔。舉例來說,在1608年就發展出的望遠鏡在50年後光學理論才成功的解釋了它的工作原理。蒸氣引擎在1695年問世,但是100年後熱力學才成功的詮釋了它的運作規則。LeCun希望可以“找出機器智能或一般智能相對應的熱力學原理”。在DL社群成功的得出任何的統一理論之前,數學家勢必將會扮演重要的角色。 這篇文章是取材於Yann LeCun應邀到今年年初虛擬2020 SIAM數據科學數學大會(MDS20)所做的演講。可以在SIAM的Youtube頻道上觀看LeCun的演講內容。 Manuchehr Aminian是加州州立理工大學數學和統計系助理教授。他的興趣橫跨數學建模,視覺化和數據科學算術。

應用數學和深度學習的關係2020-12-09T18:25:06+08:00

人工智慧和高效能運算:科學明日的推手

2020-12-09T18:25:01+08:00

人工智慧和高效能運算:科學明日的推手 作者:Aparna Chandramowlishwaran 深度學習 (DL) - 使用人工神經網路的人工智慧 (AI) 特定方法 - 被公認為21世紀最大的破壞性技術之一。自從1944年研究人員提出了第一個使用電路的神經網路後,神經網路的聲望直到近期為止持續了一波接一波的盛興與衰敗。現今,DL完整的引導著許多領域的革新,在各種可以想像的科學和工程領域中被應用。這個轉變源自於圖形處理器 (GPUs) 的發展和歷時數十年高效能運算 (HPC) 的進步,使DL在實際應用中變得切實可行。在我們即將進入的下一個十年裡,HPC和AI會持續以指數的速率相互推進。HPC持續的挑戰AI模型複雜度的極限 - 包括參數量和預測用數學神經網路層深度 - 以增加準確性並減少訓練時間。AI也同時在改變我們進行科學研究的方法。一直以來,對知識的追求都是從大理論開始,而以物理為基礎的模型至今仍是科學認知的核心。但是數據驅動的代理模型在某些任務中開始勝過第一原理模型,雖然還需要研究員的努力來解決幾個問題 - 像是模型可解讀性和泛用化 - 才有可能普及模型到大家的科學工具箱中。接下來我會總結科學家在利用AI促成科學突破時面臨到的近期趨勢和關鍵挑戰。DL最大問題是他缺少了可解讀性。AI代理模型用近似函數取代高非線性的第一原理函數,成功的把速度提升到比最先進的模擬碼還要快上幾個數量級的程度。但是,得到的代理模型 - 配上數百萬或數十億個參數 - 基本上就是一個“黑盒子”,無法得知模型資料的內在表徵(i.e., 特徵抽取)。科學家現在只能透過觀察外部介面理解神經網路,而無法瞭解內在表徵。隨著神經網路越變越深,得到的參數越來越多,專家會越來越難以解讀模型。因此有必要思考這個問題:在科學計算中,研究員真的需要十億個參數嗎,特別是因為很難用這些參數做推論,製作信賴模型?一個可以改善這個問題的方法是導入特定領域的知識 - 像是物理定律,守恆限制,不變性,和對稱性 - 到網路的設計和/或訓練中。有效利用數世紀科學知識的進步,使有涵蓋領域知識或物理特性的AI模型只需要更少的資料,就可處理更多的雜訊,並維持或增進預測的精確性。雖然單純的黑盒子DL模型現在還不能完全取代第一原理模型,做為預處理器,軟件加速器,和代理模型在複雜的科學流程中已有很好的表現(詳圖一)。圖一。一個傳統物理解算器模擬跟結合物理模擬與深度學習的框架的試樣性比較。後者的目的是跟物理解算器有一樣的輸出 (i.e., 遵重收斂限制),並同時透過深度學習加速收斂程序。圖來自參考資料[1]。基於DL方法的AI其核心是數據。在訓練神經網路上,科學DL的獨特挑戰是可用數據 (i.e., 基準真相) 的過剩和不足。在某些研究領域中,儀器可以在一次實驗中產生拍(peta)位元的數據量。但在其他使用大量模擬的領域中,產生數據以訓練深度模型的步驟卻相當昂貴。不論數據是如何產生,訓練程序都十分費時 -- 即便使用上最新的GPU硬體。雖然電腦架構的持續進步會加速數據的產生和訓練,進步速度卻不太可能跟得上AI的發展。因此,研究員必須探討AI模型的有效數據學習。因為不是所有的數據對給定的學習任務都同樣有效,數據的性質對模型的品質會有重要的影響。一個解決方案是管理出以應用為導向的數據集,減少訓練一個精確模型所需要的數據量。雖然帶入領域概念的AI模型和以應用為導向的訓練數據集可以提升模型的可解釋性和減輕其複雜度,卻可能阻礙泛用化。因此,未來的主要研究方向包含理解泛用化限制取捨與AI代理可解釋性的比較,信賴區間與預測和決策制定的聯繫以評估模型的穩健性,和量化不同規模不同來源輸入數據的不確定性。應用程序和工作流程在多樣且日益龐雜硬體平台上的可攜帶性是科學計算界近十年的大挑戰。至今,找尋性能和可攜帶性之間的最佳平衡仍然是一個熱門的研究課題。受商業AI應用程式的推動,像TensorFlow,PyTorch,和Keras這種建立在高度優化程式庫和軟體上的DL框架越來越受歡迎,成為神經網路編程裡的“標準”。他們容易被採納,可用來提取底層的演進中AI硬體,平行演算法,和特定架構優化。這些架構更提供了一個較高階的編程抽象化,有助於數據驅動的科學計算。但是,這抽象化過程卻引導出AI整合科學工作流程的新需求。既有的基礎設施通常沒有辦法讓上述的DL程式庫與框架和多源頭數據,物理模擬,建模代碼與原位分析工具做無縫整合。此外,傳統的工作流程是建立在人機迴圈的設計上,從建立假說,重複實驗到設計空間探討。日益成長的應用程式複雜度和硬體多樣性將給AI驅動科學流程帶來一個機會。未來的AI更有可能會為特定的硬體制定特殊的端到端應用工作流程,擁有隨數據和模型精進,動態適應的能力。這使得AI能有效利用新的解決方案,在工作流程更接近源頭的階段就處理數據,減少獲得解答所需的時間。如果不能讀取數據,也會無法推動新世代科學。相比起其他領域,應用在科學上的開放性知識庫和管理數據貯藏庫的缺乏是人工智慧持續發展的最大限制性因素之一。目前也還沒有一個系統性的方法可以做到同一個科學問題不同解決模型的比對。一個內含數據和模型的開放性知識庫可以加快科學應用模型的發展,也在推動新AI硬體設計時保持再現性。自動駕駛汽車,遊戲,社交網路和電子商務等應用正是當前AI硬體主要的推動力。為科學準備的知識庫,配上範例應用,有可能可以彌補數據缺乏的困擾,成功在最後推動新的AI技術並協同設計出新興的AI結構。在這篇文章裡,我簡單的描述了一些研究人員在參與DL革命時會碰到的核心問題和重要機會。科學界的DL仍然處在嬰兒期的階段。大量的問題將會在未來的十年中浮現。時間會證明在解決實際且複雜的科學問題上,DL在多大程度上會輔助或者取代掉現有的科技。參考資料[1] Obiols-Sales, O., Vishnu, A., Malaya, N., & Chandramowlishwaran, A. (2020). 計算流體力學網路 一個基於深度學習用於流體模擬的加速器. [...]

人工智慧和高效能運算:科學明日的推手2020-12-09T18:25:01+08:00

第一原理機器學習在2019年新型冠狀病毒建模中的運用

2020-10-26T02:09:14+08:00

第一原理機器學習在2019年新型冠狀病毒建模中的運用 作者:Luca Magri 和 Nguyen Anh Khoa Doan 最近幾個月內,2019年新型冠狀病毒的影響幾乎遍及了世界的每個角落。在2020年1月30日,世界衛生組織 (WHO) 宣布此疫情已成為一個國際關注的公共衛生緊急事件。3月11日,疫情被定位為大流行。5月4日歐洲中部夏令時間10:00,世界衛生組織公佈了最新數據,橫跨215個國家,確診病例343萬5894起,確認死亡案例23萬9604起[6]。此後,政府的決策將跟科學建議變得密不可分。 數學模型可以用來預測受感染,已復原,和死亡病患數量的演進,是向官方提供意見的源頭。研究人員可以從確診病例資料中推斷出接觸率 (β),恢復率 (γ),和死亡率 (μ),讓預測的準確度穩定地上升。基本傳染數 (R0) 就是合併這三個值可以得出的數據。它的含意是單一一個感染者在易受感染的人口中造成的新感染人數的平均值。若沒有預防措施,大部分的官方單位估計R0會落到2-3的範圍間[5]。這些關鍵的流行病參數(β,γ,μ,R0)非常重要,可以幫助政府選用適當的措施並拉平疫情曲線。大部分的措施會以降低R0為目標,透過減少接觸率 β 或是增加恢復率 γ [2]。理論上不論是疫苗或是治療都可以增加恢復率,但是目前既沒有2019年新型冠狀病毒的疫苗也沒有有效的治療措施。因此,目前各國政府企圖透過最小化接觸率,像是下達封鎖政策或是訂定社交距離,來控制2019年新型冠狀病毒。但是,我們到底要如何控制一個我們甚至不太了解的現象呢? 首先,我們需要能對流行病做準確的預測才能保持我們領先疾病一步的優勢。這是可以透過模型化技術達成的。但是,在只有局部或是不準確情報的情況下,我們要如何建立疾病的模型? 這個問題又更加困難了。我們找到了一個為了在渾沌動力系統中做預測所開發出來的方法[1],然後把方法運用到2019年新型冠狀病毒上 [4]。透過過往經驗得來的流行病模型第一原理和現時收集到的官方2019年新型冠狀病毒確診病例數據這兩種資料的合併來對外來做預測。儘管(某些)人的頭腦能很有效的洞悉出支配問題的第一原理,機器學習能更有效的辨識出數據裡所蘊涵的數值關係。第一原理機器學習恰巧相輔相成地結合了人腦跟機器的強項。在接著的段落裡,我們套用這個方法在一個具代表性的流行病模型上,但其實這個技術是可以被應用在更複雜的模型中的。 搭配著數學 若要幫流行病建模 (就如同幫其他的現象建模),我們需要掌握支配著動態變化的第一原理,像是假設,約束,法律,等。這些原理就是所謂不能被違背的"遊戲規則"。我們把一個國家的整體人口分組到互斥的幾個組別中:總人口 (N) = 易受感染的 (S) + 已感染的 (I) + 死亡的 (D) + 復原的(R)。我們假設總人口固定不變,但其他的變數都會隨時間做改變。這代表所有的組別都擁有同樣的特徵,也就是說組別都是同質性的,並且每一個易受感染的人都有可能被傳染這個病毒。在更複雜的模型中,這些使用到的假設是可以被鬆綁的 [2]。這個做法就是流行病SIR模型搭配生命數據和固定人口 [3],簡稱為SIRD模型。我們以數學的方式形容這個第一原理,利用著四個常微分方程式和隨著時間變化的參數(一個非線性,非自主性的動態系統): Ṡ = -(t) INS,     İ= -Ṡ-Ṙ-Ḋ,Ṙ=(t)I,Ḋ [...]

第一原理機器學習在2019年新型冠狀病毒建模中的運用2020-10-26T02:09:14+08:00

一個可以在大流行期間支持醫院工作流程管理的數學模型

2020-10-26T02:09:35+08:00

一個可以在大流行期間支持醫院工作流程管理的數學模型 作者:Marc Garbey,Guillaume Joerger,Shannon Furr 和 Vid Fikfak 跟其他的大流行一樣,2019年新型冠狀病毒在全世界的散播嚴重地阻礙了病人流量管理也同時造成了醫院資源的嚴重緊缺。因此,醫療保健專業人員必須在病人照護和資源分配上做出困難的抉擇。雖然有可用於病人分級的檢查表,大流行的動態變動卻使檢查表很難被有效的運用。高階管理人員因此需要一個新的工具,可以提升端到端的需求能見度,來做醫院裡病床限制的識別和預報。 許多政府和私人機構專注於建立告示板以提供給一般民眾2019年新型冠狀病毒的評估資訊。從大量跟流行病學數學模組相關的文獻中可以提取出一個嚴謹,適合預測2019年新型冠狀病毒動態變化的架構 [9,10]。然而,因為研究員還沒有完全瞭解這個疾病,要在地方醫院的層級優化病人工作流程管理需要的必要資料很複雜。各家醫院因此必須各自去適應2019年新型冠狀病毒每天的變化。指導方針需要時間來落實;即使遵循的是最新的訊息,臨床使用仍會得出非常不一樣的結果。 合適的數據集和敏捷數學模型 法國政府釋出了全國大部份的公立醫院在2019年新型冠狀病毒危機時期的記錄。釋出的文件揭露了住院的病患數量,加護病房病患數量,恢復且出院了的病患人數,和在醫療機構死亡的病患人數。這些數據每天被更新,最早可回溯至2020年3月18日。因為可用數據不多,我們從很簡單的模型開始,制定出可以對應到所有病人疾病管理的工作流程 (詳圖一)。 圖一. 醫院裡的病患流程 大部份需要住院的病人會先被置於醫療樓層做前期的評估和治療。在住院期間不間斷地使用非侵入式監測,醫學影像,和血液檢查來幫助確定病人狀況。有些資源,像是醫學影像和實驗室作業,是由全醫院的病人所共用。若不能負荷病人的需求,整體過程將被延緩。有一些醫療照顧的病患對保守療法有很好的反應,只住院幾天就能出院。其他病患的健康狀況確可能惡化,需要被轉移到中重度病房 (IMU) 接受額外治療,或是到加護病房 (ICU) 接受持續監測,甚至使用到機械式呼吸輔助。 IMU和ICU都需要用到大量的補給和資源。人工呼吸器不是唯一的限制因素。接受機械式呼吸輔助的病患同時也需要鎮靜劑,而且也可能會用到輔助器官衰敗患者的機器。因為我們工作流程的發展方向是由下而上[5,8],只要不欠缺必要的數據,增加以上提及的限制因素到我們的模型中在技術性來講是不困難的。其他專門提供給沒有治療效果的患者的樓層,像是恢復室或是舒緩照護樓層也應該被加入到模型中。當然,以上是標準程序的敘述。例外和異常狀況是常常會發生的。舉例來說,病患有可能一住院就直接被送進加護病房如果他/她的狀況非常不穩定。在某些醫院,恢復中的2019新型冠狀病毒病患和舒緩照護病患有可能會被放在同一個樓層。扼要地說,我們是在建立一個簡單的流程圖來幫我們(i)斷定一個病患從一種病房轉換到另一種病房的可能性和(ii)執行病患在每種病房滯留期間的統計估計運作。 因為這個離散模型是隨機的,我們需要執行很多次的模擬以便使用統計估計來求出感興趣的數值。需要透過數據的擬合來提取的未知參數眾多。為避免擬合過度,研究員應該設計一個策略,透過臨床文獻或是驗證完的假設,降低需要的未知參數量。因為工作流程通常都跟醫院的流程一樣是離散的,嘈雜的,且非線性的,同樣是可以用隨機最佳化方法來取得模型的未知參數。 疾病的演化很大程度的支配了病人的狀況。除此之外,延遲在醫療程序中會積累。生物和管理過程的持續時間通常都是用長尾型對數常態分布來形容。而簡單的指數分佈不一定理想地描述病患的住院天數 (LOS)。這兩個概念是不相衝突的。總體來講,LOS加總馬爾科夫過程裡每個步驟的時間分布,可以用每一步驟裡機率分布和時間分布的捲積來描述[7]。舉例來說,根據臨床研究結果,我們發現需要用到不自然的兩階段分解法來詮釋病患待在ICU的時間,以避開單一分佈構造可能無法完整的表達出LOS模型的限制[1]。 為了引導優化的過程,我們執行了模型的穩定性分析,把最敏感參數排名來分辨出評量的先後順序。最終成果還是會受職員的狀態和病患的組成所影響,而且臨床人員對每一個步驟的LOS都很清楚,可以提供一個大致的時間窗口讓我們在第二次檢視演算法時微調。要獲得新的大流行初期的實際死亡率是很困難的。 我們這個簡化的第一個模型基本上是使用基因演算法來做模型跟法國數據集[4]的比較來校準出六個參數值。圖二描繪的是模型跟法國2020年3月18日到2020年4月24日期間數據集相比的成功結果。 圖二. 模型跟法國醫院的數據做比較。第三十三日對應的是2020年3月18日,也是我們數據集裡的第一個日子。第七十日是2020年4月24日。3月18日前缺失的住院資料我們以一個指數模型來填補。2a. 頂部: 輸入的內容是病患住院數據。底:加護病房(ICU)中機械式呼吸輔助的病患數量跟數據集的比對。2b. 頂:每天復原離開醫院的病患數量。底:每天死亡數量。 提取訊息來合理化策略 一位管理者有可能會面臨以下簡單確重要的問題。每一層樓需要幾個病床而重症加護病房裡還剩幾個病床可以用?為了支援病人照護和確保職員不被感染,還需要訂購多少補給?醫療設施需要在最高負載量維持多久的運作時間而職員人數有辦法支持這個工作量嗎?一個重要的關鍵就是做監護病房負荷量和需要資源的預估,以決定是否需要增加資源來應付病患量的成長,或是可以把資源做再分配,重新安排原本被取消的外科手術。 圖三. 預測有第二波大流行發生時的單位負載 我們選擇一個有第二波大流行的假設情景來說明這個概念。我們假設第一周到第七周醫院的病患流量低了些許,但在第八周卻遇上第二波爆發,每天增加20%新病患量。圖三顯示每一個監護病房的負載動態。黑色的線條是第七周,而紅色的線條是將要遇上第二波疫情的第八周。最上面的,細的紅線標示出加上一個正標準差之後的值讓我們可以體會隨時間增長的預測不確定性。藍色的線條顯示的是每一個監護病房假定的容量,可以幫助判斷哪一層樓會最先飽和,會最快需要新的病床。若管理者看到這樣的預測,他們將會繼續取消選擇性外科手術,以騰出病床給預期中的2019年新型冠狀病毒病患,也會招募需要的員工和安排好額外的物資。(詳圖四) 圖四. 預測需要的基礎設施以承受我們假設情景中的第二波大流行。4a. 每一輪八小時輪班需要的員工數量。4b. 每天需要的物資數量。 我們的模型可以幫助管理者在病人照護上做出眾多的決定。圖五比較的是患者在有護士和缺少護士的狀況下的治癒和死亡率。圖五裡面的結果是有點純理論性,因為患者的風險在沒有發表的結果做根據的情況下是很難數據化的[2,3,6]。我們希望在2019年新型冠狀病毒時期累績的資料可以提供數學建模的新基礎,以求未來可以做到嚴謹的預估。 圖五. 在有第二波大流行假設情景下的預測表現。5a. 前一個禮拜的病患結果。5b. 下一個禮拜的預測病患結果。 無可否認地,我們的方法有某些限制。較小醫院的結果較難以預測,而來到急診室的病患群特徵會隨時間改變。系統性的檢測可以促成早期診斷並影響整體醫療系統的表現。從一開始就採用這個策略的國家所收集到的統計數據幫忙證實了這一點。由於病患人口和疾病模式的異質性取決於病患特徵,我們下一階段的模型會包含從電子健康紀錄中得來的病患疾病史。我們要找出一個在醫院的生態系統中會維持準確性的流行病模型,用它來精進我們的醫院工作流程模型。最後,我們預料在大流行下的數位健康電腦模型在未來會大量地使用到社會和經濟的建模用元件。 這一篇文章裡的圖形是由作者所提供。 [...]

一個可以在大流行期間支持醫院工作流程管理的數學模型2020-10-26T02:09:35+08:00

用於抑制2019年新型冠狀病毒在美國散布的替代系統

2020-10-26T02:10:03+08:00

用於抑制2019年新型冠狀病毒在美國散布的替代系統 作者: Samuel Awoniyi 研究人員目前正在發展眾多可以預測2019年新型冠狀病毒大流行擴散與控制狀況的數學模型。這裡我使用馬爾科夫鏈模型來比較兩個可行的以抑制2019年新型冠狀病毒在美國散播為目標的系統。有一個是目前正被採用的系統。另一個則是在這裡提出的替代方案,透過"補給照顧團"的概念來解決現存架構中的某些缺點。 我和我的團隊設計出的是一個能更有效的控制感染率,醫療保健設施負荷,總體成本,和國民經濟崩壞的替代系統。只需幾個禮拜的規劃,這個方法就可以在州或者社區的層級順利發行,可以是做為當今系統的後續方案,也可以直接替換掉現有的系統。 在文章的後頭會使用馬爾科夫鏈模型企圖以數學方式完整地說明提議的替代系統的優越性。在更後面會探討實際實施方針,期能有效益的幫助到美國決策者,包括各州州長職員,縣長員工,和學校系統策會委員會,等... 兩個可行的系統的描述 圖一描繪的是這兩個可行的以緩和美國2019年新型冠狀病毒狀態為目標的系統。左右兩個系統的B組別代表的都是目前全美所有新型冠狀病毒檢測呈陽性的患者和有相關症狀而住院的病患。在當今系統中,A組別包括的是其他所有不在B組別中的美國人民(組成一個共通利益的團體)。提議的替代方案中的A組別會比較小,因為要把C組別從A組別當中分離出來。C組別是代表被授命為全體B組別做服務的照顧者和補給者。 圖一。兩種可行以抑制2019年新型冠狀病毒在美國散佈為目標的系統。A組別的海綿狀結構是反映出美國這相對自由社會的可塑性。圖片是由Samuel Awoniyi提供。 C組別人員的正式職責是協調和供給B組別人員的需求,像是食物與醫療保健用品的補給,臨時住宅,和住院治療。為了最小化這個新提議系統中感染的可能性,C組別裡面的人,統稱為"紅色工作團",不管任何時候都會配戴著必要的個人保護設備(PPE)。針對這個替代系統定出了五個面對面接觸的指導方針: 方針#1:任何新型冠狀病毒檢測結果呈陽性的患者,應該在得知結果後,立刻被移入B組別中。 方針#2:在A組別裡的人員不應該跟B組別裡面的患者有直接,面對面的接觸。 方針#3:所有B組別裡面的人員在面對面互動中都應該穿戴預防性口罩。 方針#4:紅色工作團(C組別)裡的所有成員應該被限制只有在供應必要的補給和衛生保健資源時才跟B組別裡的病患接觸 方針#5:B組別裡面的病患在痊癒或是得到必要抗體後應該被移動到A組別中。 我與我的團隊提議的替代系統跟傳染病建模領域中使用到的分室模型有些相似 [3]。因為不是跟典型的分室模型一樣使用數學分析,而是使用馬爾科夫鏈逗留時間循環 [1],我們的建模成果與眾不同。 兩個相應的馬爾科夫鏈模型 遵照著前面提及的五個方針,我們應用兩個離散時間馬爾科夫鏈模型來說明我們替代系統的優越性。若把2019年新型冠狀病毒視作一個有害包裹的往返送貨員,上述兩個模型可以追溯COVID-19在當今系統中在A組別和B組別之間的來回移動,和在替代系統中在B組別和C組別之間的來回移動。這樣的應用證明了所做的馬爾科夫假設的正當性因為2019年新型冠狀病毒感染率只取決於社會遵循前述五個方針的勤勉程度。 圖二描繪了兩個離散時間馬爾科夫鏈 (DTMC)。A,B和C所代表的與圖一中相同。在每個DTMC圖形左邊的可能性是1因為要遵循上述的方針 #1: 任何新型冠狀病毒檢測結果呈陽性的患者,應該在得知結果後,立刻被移入B組別中。 圖二。兩個離散時間馬爾科夫鏈 (DTMC)。圖是由Samuel Awoniyi提供。 機率p1體現的是當今系統中A組別和B組別個體之間相對自由的面對面互動。同理,機率p2反映的是提議的替代系統中紅色工作團(組別C)和組別B裡面的成員之間受到精心控制的面對面互動。因此,按理說會得到p1p2。 如果我們讓STC1代表當今系統的DTMC的逗留時間循環,而STC2代表提議的替代系統的DTMC的逗留時間循環(詳圖二),我們會由p1p2得出STC2STC1,因為STC1 =1/p1 + 1且STC2 =1/p2 + 1。附件[1]裡有一個對計算一般馬爾科夫鍊逗留時間循環直截了當的介紹。 舉例來說,如果p1=0。5且p2=0。1,則STC1=3且STC2=11。在這個運用中,因為STC表示的是"到下一次感染的時間平均值",很明顯的在提議的替代系統中得出的值按理會比當今系統的長很多。 實際實作 在實際實作方面,我們的替代系統首先最需要的是可讓所有美國人都使用的某種可靠的新型冠狀病毒檢測。尤其是紅色工作團成員的檢測必須特別的即時,要不然提議的架構在感染可能性方面不會比當前系統有更好的結果。 紅色工作團成員包括醫療保健小組,雜貨和食物供給人員,和通訊供應小組。大部分的成員最好是都擁有了2019年新型冠狀病毒的抗體。所有團員在跟B組別裡的人面對面互動時都必須穿戴適當的PPE,在雜貨商店和其他的店舖中則必須戴著適當的口罩。這些要求是為了最小化紅色工作團裡的職員得病然後傳染給全體人口的可能性。 B組別裡無症狀的成員應該被安置在適當的旅館裡,跟B組別裡已經顯現出症狀的成員分開。這些有症狀的患者應該被安置在專門給2019年新型冠狀病毒病患的醫院中。每一個B組別的成員在跟紅色工作團的成員面對面互動時都必須穿戴適當的口罩。遵循著方針 #2,在B組別裡的成員不能跟A組別裡的人做面對面的互動。 所有A組別裡面的人在四個或更多人的面對面互動時必須配戴適當的口罩。A組別裡的人若得到認證證明其有2019年新型冠狀病毒抗體就可以照計畫或依需要去工作。因此在提議的新系統下,2019年新型冠狀病毒對於國民經濟的總體負面影響將比當今系統下的狀況好很多。 因為我們提議的替代系統實際的減少了眾人在社會中的自由,在找到了可行的疫苗或是治療方法之後應該暫停這個系統。此外,也可以在B組別連續一個月沒有人之後暫停這個替代系統。事實上感染者最終不是死亡,就是會復原並得到相關抗體,所以可以確定的是B組別一定會有空掉的一天。 我們提議的方法非常適合防止第二波2019年新型冠狀病毒的感染因為紅色工作團會控制B組別的數量使其低於臨界社區規模 (CCS) - [...]

用於抑制2019年新型冠狀病毒在美國散布的替代系統2020-10-26T02:10:03+08:00

幾何設計中的計算拓撲學:流形與分子

2020-10-26T02:10:19+08:00

幾何設計中的計算拓撲學:流形與分子 作者: Kirk Gardner, Kirk E. Jordan, Alex Harrison, James L. McDonagh, Breanndán Ó Conchúir, Thomas J. Peters, 和 Donald R. Sheehy 儘管計算拓撲學在現代相當的突出, 它的發展與推廣並不是一夕之間發生的. 這個領域能興盛在很大的程度上是仰賴了許多經典的基礎學科包含了一般, 幾何, 代數, 和低維拓撲學. 這裡我們探索計算拓撲學從機翼中的流形到藥物中的分子的運用. 簡介, 歷史, 和流形 計算拓撲學這個詞可能最早出現在一篇1983年有關電腦輔助幾何設計 (CAGD) 的博士論文中[10]. 二十年之後, 拓撲數據分析 (TDA) 的先驅者很大程度地普及了這個詞 [5, 7]. 這一篇文章強調幾何拓撲學在點雲分析中的運用, 暗示著在廣義的應用拓撲學抽象化之中CAGD和TDA的技巧整合可能性 [8]. 在幾何設計之中, 固體的邊界面經常是由兩個面交集然後順著交集處做連接所形成 (詳圖1a). 實際施行起來一定會遇到問題, [...]

幾何設計中的計算拓撲學:流形與分子2020-10-26T02:10:19+08:00
Go to Top