大模型時代顯而易見的到了,但是大模型在行業場景落地,對多數企業又是轉型升級的新命題。
隨著不同領域的大模型如火如荼地「湧現」,各行各業對大模型的態度也已經從「獵奇」逐步轉化為如何「交互」和「落地」。特別是在一些強調精度、可控性和合規性的場景中,企業對於全面接納這種大型模型還存有疑慮,期待求解。
畢竟,對模型的高度交互可能會增加數據泄露的風險,而模型過度的創造性也可能導致資訊的誤導或混亂而無法產生實效。換句話說,正是這些模型令人讚嘆的"湧現性"成了它們被更廣泛應用的障礙。
「人工智慧正成為數字化轉型的核心驅動力之一,並一直在充分發揮協同作用,助力工業企業在產品全生命周期內,持續提升效率並推動創新。」西門子中國研究院張英麗說,「西門子更看重讓大模型切實在應用場景中發揮價值。」
圖源:西門子中國官網
深耕工業人工智慧領域30餘年,西門子對於人工智慧與垂直行業的融合發展有著深厚的理解和積累。實際上,早在2018年,Google剛剛提出Transformer底層框架之時,西門子就開始了在預訓練大模型技術與產業領域的探索與創新,他們是怎麼做的?隨著大模型時代的到來,西門子下一步的計劃是什麼?
來自工業領域「頭部玩家」對行業大模型的探索與思考
作為工業領域的「頭部玩家」,西門子一直以創新的姿態,推動業界不斷擁抱從概念到技術的諸多革新,對大模型的創新探索也是如此。例如,早在2017年,西門子就已經開始在工業診斷場景中嘗試使用人工智慧,探索其具體的落地場景以及應用價值。
「西門子AI Lab的定位就是連接AI夢想到真正AI應用的橋樑,一直都在緊跟技術前沿的發展,儘管早期的嘗試更多是創新性的,但我們更想要了解它的可行性技術路徑、用戶需求以及商業價值,只有深刻把握了這些,西門子才能不斷地去做創新。」張英麗說。
今年以來,儘管通用大模型的發展令人驚艷,但企業卻在應用的過程中發現,因其缺少具體行業或產業應用場景層面的數據量而導致模型精度不理想,所以許多大模型仍然存在著「不擅長」解決具體行業問題的通病。
在張英麗看來,以上被稱為「可信AI」的話題並不是新興的議題。在模型規模尚未達到如今之龐大的時代,模型的魯棒性、可解釋性、公平性和隱私保護等方面就已經受到了高度關注。
「大模型的出現對可信AI,尤其是其『可解釋性』方面,提出了全新的挑戰。」張英麗說,「因此西門子希望找到一個更可行、更實際的技術路徑,讓AI可以在不同的場景中發揮長處、避開短處,讓各個不同的垂類大模型能夠更直接、更快速地去解決行業問題。」
得益於多年來在工業智能化領域的深耕,西門子通過服務不同行業、不同規模、不同應用場景的客戶的過程中,在工業和智能製造方面積累了深厚的知識和數據,在大模型的場景探索中,開放式數字商業平台西門子Xcelerator以注重效率、交互、協作、創新和生態的「破圈」方式,聯合數十家生態合作夥伴共同推動應用場景實踐,最終從真實需求出發,率先提出了從「智能客服」和「智能診斷」兩個方向上搭建「人工智慧大腦」的創新方案。
當被問及為何首先確定的是這兩個場景時,張英麗表示:「西門子在工業人工智慧領域有成功的落地案例,我們有數據積累,也成功驗證了其商業價值。雖然長遠來看,我們認為大語言模型在與工業世界的結合上存在更多潛在的可能性。但從短期來看,大語言模型加持的客戶服務和智能診斷環節,是前期可以進行落地嘗試的。」
圖源:西門子小程序
西門子觀察到,當下應用最成功的生成式模型,其最擅長的能力是對話理解,當給大模型提供的訓練數據集足夠全面和專業化,數據偏差的影響減少了,在人工客服的應用場景上,AI就能夠代替人類專家更加高效地處理專業問題。而在工業診斷的場景里,生成式AI模型能夠輔助運維團隊進行更加準確、迅速地智能診斷。這樣不僅降低了人類員工學習知識的時間和成本,還將工作效率提高了數十倍。
西門子QRA框架:在通用型的基礎上專注「可信生成」
為了讓大語言模型能夠回答更精專、更垂直領域的話題,並實現更多的產業應用,西門子在經過與清華大學研究團隊長期的研討後,基於清華大學在學術、技術研發以及搭建大模型等方面的強大實力,結合自身的產業優勢和數據積累,創新性地提出了「QRA框架」理念。
清華大學作為國內的「頂級學府」,一直以來都以其卓越的學術實力和科研成果而聞名於世,在人工智慧專業方面,清華大學更是一直持續保持著領先地位,在最新的軟科2023年中國大學人工智慧專業排名中,更是穩居榜首。
在QRA技術框架的研發過程中,西門子主要負責為大模型的「餵養訓練」提供脫敏處理後的行業數據,而清華大學則主攻學術研究和模型搭建。
人工智慧發展至今,「AI黑盒問題」一直如影隨形,尤其是在大語言模型領域,因其內部工作原理對最終用戶來說是不可見的,AI解決問題的「不透明化」也進一步引發了我們對使用人工智慧的擔憂。所以隨著機器學習和人工智慧技術在各個領域中的迅速發展和應用,向用戶解釋算法輸出的結果變得至關重要。
特別是在對專業性要求更高的客戶服務和工業智能診斷等應用領域,要更加避免「捏造事實」、「胡編亂造」等一類的AI「幻覺」問題。在這一點上,西門子提出的「QRA框架」就是解決「可信生成」的問題。
QRA框架的可信生成是基於知識庫去做內容生成,並不是由模型隨機生成。「這更像是人的行為——在不斷的學習和推理過程中,形成AI自己解決問題的『方法論』,當你向『它』提出問題後,『它』會在知識庫里經過檢索整合後,通過QRA框架給出回答。」張英麗表示。
並且,張英麗也表示:「我們在和清華的合作中,我們不僅希望通過用QRA框架去做可信生成,把這個技術框架做的更可靠更可信賴,同時也希望能夠把這套框架用在前面提到的兩個應用場景上,因為在客戶服務和工業診斷上都需要非常多的專業知識,並且需要將錯誤率降低到最小。」也就是說,配備了QRA框架的大模型,在回答問題時將更準確、更智能、更可信。
QRA框架也並沒有忽視「通用性」。這一點,主要體現在三個方面。
據張英麗介紹,首先,QRA框架在其技術實現的通用性會更強,支持行業客戶隨時搭建知識庫,甚至搭建什麼樣的知識庫,就會成為什麼樣的「專家」,在垂直行業領域的應用上更加具有通用性;其次,QRA框架在部署和實施上非常的靈活,支持企業客戶進行各類雲部署和本地部署;最後一點則是該框架的大小選擇上也非常靈活,主要分為百億級參數、千億級參數兩個量級,可以靈活應用不同類型的場景。
「這樣就不會出現『殺雞用牛刀』情況。」張英麗說。
據了解,西門子為了驗證後續的可持續性商業價值,目前還在繼續打磨產品,預計最快將在幾周後完成第一版基於QRA框架的模型Demo。後續也將保持更多開放探索的可能性。
西門子:「主動變革型」科技先行者的自我修煉
如今,人工智慧已經融入社會生活的方方面面,從「刷臉」支付、語音助手等日常應用,到疫情期間發揮重要作用的智能測溫系統、智能消毒機器人,都為人們提供著更加便捷和人性化的服務。
與此同時,人工智慧也從消費領域拓展到製造業、基礎設施、能源、交通、醫療等關係國計民生的關鍵領域,逐步實現規模化落地。
西門子Xcelerator集成了精心設計的物聯網硬體和軟體組合、不斷發展的合作夥伴生態體系,以及一個提供探索、教育、交流和購買功能的Marketplace,是一個面向客戶、合作夥伴、專家、開發者等在內,對所有人開放並鼓勵多方共創的Saas「即服務」平台,具有極大的個性化服務潛力,易於訪問,提供整體 OT/IT 集成,並具備深厚的領域知識,能夠為整個數字化轉型價值鏈提供強大支持。未來,西門子Xcelerator將賦能工業、樓宇、電網和交通等領域不同規模的中國企業實現數字化轉型,使其更容易、更快速、更利於規模化落地。
圖源:西門子小程序
西門子Xcelerator中國區平台產品總監邵昱坤亦表示:「生成式AI和西門子Xcelerator的結合,正在進一步提升其線上平台的用戶體驗,知識庫 大模型將讓西門子Xcelerator的搜索和客服能力更可信、更精準,用戶更容易獲得優質內容。」
隨著人工智慧在工業領域的滲透,與工業場景的融合仍然是一塊「硬骨頭」。西門子通過與清華大學這類「頂級學府」的長期強強合作,正致力於成為一名主動尋求變革的的科技先行者,在更多領域實現科技創新的場景實踐,推動前沿技術的成果轉化,助力釋放數字化產業融合的真正潛力。
未來,西門子或許會碰撞出更多科技創新的火花,我們拭目以待。「我們希望提供用得起、用得好的工業人工智慧解決方案,將工業數據的巨大隱藏價值變得可見且可得。」
換言之,西門子作為工業領域的「頭部玩家」主動尋求變革,追求的不是自身的一枝獨秀,而是客戶成就的綠蔭成林。