AI 的特點在於超強的學習能力,聊天、繪畫、寫作、作曲,就沒有它不會的。贊助商廣告你為 AI 焦慮到頭禿,Google 倒希望 AI 幫你照顧好自己的身體。這次,AI 的學習材料變成了咳嗽聲。基於 YouTube 等平台無版權的公開影片,Google 收集了 3 億條 2 秒左右的音頻數據,包括咳嗽、抽鼻子、打噴嚏和呼吸困難的聲音,然後訓練了一個 AI 基礎模型:HeAR。HeAR 可以通過你的聲音,了解你的健康狀況,甚至能在疾病的早期給出診斷。Google 沒有讓 HeAR 在實驗室束之高閣,已經和印度 AI 醫療初創公司 Salcit Technologies 展開合作。Salcit 有自己的 AI 模型 Swaasa(梵語裡意為「呼吸」)以及 app,在一些情況下可以替代傳統的肺活量測試,用戶提交 10 秒的咳嗽樣本,就能檢測某些呼吸道疾病。HeAR 拓展了 Swaasa 的技能,又延續了 Swaasa 的精神。兩者的強強聯合,首先用在基於咳嗽聲的結核病早期檢測。為什麼是結核病?首先,HeAR 有這個能力,訓練材料里,咳嗽聲就占了大概 1 億條。其次,結核病的情況比較特殊,可以治癒,但每年有數百萬病例未被診斷,耽誤了病情,原因無非是醫療落後,患者沒有條件。如果不治療,結核病的死亡率高於 50%。這就能體現 AI「聽診」的好處了——與血液測試、成像等相比,聲音是更容易獲得、成本也更低的資訊,可以直接通過智慧型手機上的麥克風和 AI 軟體收集、分析。贊助商廣告不過,在更廣泛地落地前,HeAR 還有一些問題需要解決,包括音頻樣本的背景噪音過多。除了 Google,還有一些大廠和初創公司,也在嘗試讓 AI「聽見」疾病。2021 年,301 醫院、北京大學第一醫院等聯合發起呼吸健康研究,華為在其中扮演了重要角色。擁有華為 WATCH 4 系列、WATCH GT 4 等智能手錶的用戶,可以在華為創新研究 app 選擇加入呼吸健康研究,錄製咳嗽音,採集生理數據,實現肺部感染風險篩查。「咳幾聲」,怎麼就能知道肺部有沒有感染?肺部感染的患者,咳嗽的爆發音、頻譜衰減和其他人不同,所以能被區分開來。背後默默提供支持的,是海量專業的模型數據,以及環境音識別、高精度咳嗽識別和呼吸健康篩查評估三重算法。另外,AI 也正在通過我們說話的聲音,深入我們的內心世界。聲音會因為精神健康而改變,有研究可循。抑鬱症患者講話通常更單調、更平淡、更柔和,音高範圍和音量較小,有更多停頓,也會更頻繁地停下來。焦慮症患者則會因為身體緊張,往往說得更快,呼吸更加困難。基於微軟雲服務 Microsoft Azure 的美國初創公司 Canary Speech,可以捕捉並處理 40 秒的對話語音,追蹤壓力、情緒等,從而檢測健康狀況。人類可能會自欺欺人地說「我很好」,但算法不會騙人,而是觀察你的表達方式,根據語氣詞、停頓等,做出客觀的評估。AI 不僅關注你說什麼,更關注你怎麼說。美國國立衛生研究院的願景則更為廣闊,有些「兼濟天下」的意思。研究人員計劃到 2026 年,創建一個大型的開源語音資料庫,訓練 AI 診斷疾病,最終開發一個 app,幫助全科醫生將患者轉診給專家,將服務輻射到農村等醫療欠缺的地區。贊助商廣告他們知道聲音里有大量的資訊——說話低聲、緩慢的人可能患有帕金森病,口齒不清是中風的徵兆,抑鬱症也能在聲音中找到端倪。不過,收集的語音還是有優先級,包括五種疾病:神經系統疾病、聲音障礙、情緒障礙、呼吸系統疾病、自閉症和言語遲緩等兒科疾病。某種程度上,從手錶、手環、戒指等可穿戴設備到 AI「聽診」,技術都是在將人類的感官數字化,並且功能越發豐富,更加關注身體的綜合狀況。你做冥想了嗎,你的心血管如何了,月經周期怎麼樣,運動圓環合上了嗎......首款 Apple Watch 於 2015 年發布,距今已有 10 年,我們漸漸習慣,讓身邊的智能設備,隨時、安靜、非侵入性地檢測身體。而語音是一個更日常的場景,用我們的手機就可以實現交互。不過,語音數據的偏見性、準確性、隱私問題,以及算法的黑盒本質,也讓很多研究人員擔心語音檢測的負面影響。可能未來的某一天,Siri、小愛同學等語音助理,會這樣提醒我們:親,今天咳嗽了幾次,心情跌到谷底幾次,呼吸急促了幾次......這是科技的進步,還是現實版的《美麗新世界》? 原文地址 : https://www.animattoys.com/detail/JE3IkzmQ/咳嗽幾聲Google的AI就知道我有沒有病