回复@心有猛虎丨细嗅蔷薇: 大模型這把火，燒了一年多。目前，各界對AI熱情依舊，但也多了些理性。最明顯的表現是，大家越來...

回复@心有猛虎丨细嗅蔷薇: 大模型這把火，燒了一年多。目前，各界對AI熱情依舊，但也多了些理性。最明顯的表現是，大家越來越關心大模型的商業化問題，甚至還因此引發過理想主義和務實主義的爭論。
有沒有一種可能，是公司既追求大模型技術理想，同時兼備又快又穩的商業化步伐？
商湯就屬於這類公司。在近期的發佈會上，商湯推出了新升級的大模型體系——日日新5.0。在主流客觀評測上，日日新5.0達到或超越了GPT-4 Turbo版本；同時，商湯發佈了行業首個“雲、端、邊”全棧大模型產品矩陣，並請來金山辦公、海通證券、小愛同學等頭部客戶站臺，介紹合作成果。
結合公司此前的業績數據（2023年，商湯生成式AI業務收入達12億元，同比增長200%）來看，商湯大模型的商業化已經進入快車道。理解商湯的商業化進展，其實就是在理解大模型熱潮將湧向何方。
系統理解商湯的商業化進展
一年多時間，在諸多廠商的探索中，大模型商業化的邏輯越來越清晰。公司要走通大模型商業化路徑，需要具備三方面的能力：大模型本身能力的出衆、落地不同場景的能力和靈活貼合不同客戶需求的能力。
大模型本身的能力
在行業“百模大戰”的背景下，大模型已經不是“有沒有”的問題，而是是否出色、各方面能力是否紮實的問題。只有表現可靠的大模型，才能得到客戶和用戶的青睞。
根據發佈會的信息，日日新5.0主要聚集增強了知識、數學、推理及代碼能力——文科方面，日日新5.0的創意寫作能力、推理能力以及總結能力均大幅提升；理科方面的數理能力、代碼能力及推理能力也達到業內領先水平；此外，商湯多模態大模型的圖文感知能力達到全球領先水平，多模態能力也落地到產品層面，相關產品支持長圖解析、文生圖以及跨文檔知識抽取及總結問答展示。
商湯多模態大模型在多模態大模型權威綜合基準測試MMBench和多個知名多模態榜單取得領先成績
圖源：商湯
發佈會上，商湯科技董事長兼CEO徐立現場演示了日日新5.0在高考作文、解數學題、複雜中文場景、文生圖等方面的表現，從結果來看，日日新5.0的表現相較GPT-4 Turbo等大模型均有亮點。而種種提升意味着，日日新5.0有能力賦能教育、內容、金融、數據分析等行業場景，對客戶有足夠的吸引力。
“日日新5.0”和GPT-4回答趣味推理問題：“媽媽給圓圓衝了一杯咖啡，圓圓喝了半杯後，將它加滿水，然後她又喝了半杯後，再加滿水，最後全部喝完。問圓圓喝的咖啡多，還是水多？”，“日日新5.0”回答正確。
圖源：商湯
落地不同場景的能力
當然，大模型落地在實踐中還要考慮更多因素。落地不同場景的能力，對應的是公司是否有成熟的大模型產品矩陣。
大家平時關注的各種大模型，多是雲端大模型。但在實際落地中，大模型需要根據不同的場景進行“產品化”。例如，以AI手機爲代表的AI硬件，需要的是規模可控但性能優秀的端側大模型，以及高效的端雲協同；金融、代碼、醫療、政務等行業則對可獨立部署的邊緣側AI應用有強需求。
商湯擁有“雲、端、邊”全棧大模型產品矩陣，場景覆蓋廣且能力突出。發佈會上，商湯推出了1.8B的SenseChat-Lite版本端側⼤模型。該模型在中端手機和旗艦手機的推理速度都實現了“業界最快”，遇到需要端雲協同的複雜場景時，商湯也通過智能化判斷能力提升輸出效率，降低推理成本。
根據徐立的表述，該端側模型在測試中超越了MiniCPM-2B、Phi-2等同量級的大模型，性能和7B、13B等尺度更高的模型相比也不遜色，即“同等尺度性能最優，跨級尺度全面領先”。
日日新·端側大模型性能出衆圖源：商湯
針對金融、代碼、醫療、政務等行業的邊緣側AI應用需求，商湯則推出了高性價比、開箱即用、數據安全、全國產化的企業級應用一體機。在政務場景，一體機能幫助客戶理解用戶的問題，還能提供答案的參考來源，可以明顯提升政務服務的智能化水平。
簡而言之，商湯提供的系列產品覆蓋了多數落地場景，客戶可以直接按需選用，而不是反要“遷就”大模型廠商。這也是商湯得到頭部客戶認可的重要原因。
貼合不同客戶需求的能力
目前，業界能看到的各種AI應用，更多是集中在解決個人或企業的“點狀”需求。但大家對AI其實有更高的期待。新技術應該作爲更底層的支持，去爲不同公司的不同經營環節提效，滲透到工作流中。
類比互聯網，今天沒有人會說“業務的某個環節用了互聯網”，因爲互聯網已經完全滲透到工作生活裏。同樣的，AI應用也一定會不斷參與到工作生產中的更多環節。
從合作伙伴的反饋來看，商湯的大模型正在加速參與到不同行業的生產經營中。
談及AI和辦公的結合時，金山辦公CEO章慶元分了兩個場景：個人場景和企業場景。個人場景用AI做PPT，或者寫請假申請，企業場景則是希望做到“辦公自動化”。在他看來，“AI要真正提高生產力的話，一定要能夠寫代碼，做一個Copilot。只有能調各種各樣的API，才能對企業生產力產生巨大的影響。”
具體到和商湯的合作，章慶元表示近期WPS發佈的Copilot Pro就是基於日日新大模型做的應用。Copilot Pro可以幫助企業做數據分析、調用API、寫代碼。和過去相比，Copilot Pro不需要員工有代碼能力或者懂各種API，而是可以“通過對話的形式，生成各種辦公自動化的應用”。他同時評價，“在辦公應用場景內，商湯大模型的表現十分出色。”
金山辦公CEO章慶元分享和商湯的合作成果圖源：商湯
海通證券副總經理兼首席信息官毛宇星分享了公司和商湯的合作實現智能問答、智能研發、智能研報能力。在其看來，海通證券和商湯的合作是“業務+技術”全面的戰略合作——“通過與商湯合作，我們利用大模型技術實現了海通證券數智化轉型。未來，我們還將結合全棧式AI能力，進行業務流程、交互變革與數智化業務系統重構。”
商湯和海通證券發佈金融行業多模態全棧式大模型
圖源：商湯
小米集團小愛總經理王剛着重講了商湯大模型響應速度快、時間性能力強（即呈現生成結果來源，確保內容可靠）等特點，並介紹了商湯大模型在特定場景中的精細化表現（例如，在車內場景，商湯大模型能生成簡潔清晰的內容，更符合用戶的交互習慣）。
AI落地汽車場景是行業熱門話題。分享的最後，王剛還講了一段關於小米汽車的小故事——雷軍對於小愛同學在小米汽車智能座艙上的表現要求很高。當時，小愛同學把需求發給商湯，“商湯的同學兩三天內就把所有需求幹完了”，且後續的體驗和演示“效果非常不錯”。
小米集團小愛總經理王剛和商湯科技聯合創始人、首席科學家王曉剛對話圖源：商湯
如何兼顧速度和質量
總的來看，商湯的大模型商業化兼顧速度和質量，在技術、產品、客戶層面均有領先態勢。而要理解商湯爲何能取得如此進展，我們同樣可以從三個維度入手：過往的積累、對技術和商業的認識、前瞻的“非共識”佈局。
過往的積累指的是商湯此前沉澱的客戶資源和行業經驗，以及在感知智能層面、大語言模型方面的技術積累。這些積累讓商湯在大模型時代能更快啓動商業化。徐立曾分享過，商湯在端側（移動端、車端、IoT端）的賦能經驗和技術儲備，可以協同大模型，複用拓展到更多終端場景。行業的應用反饋將幫助公司找到優勢場景，推動大模型的落地。
對技術和商業的認識，表現爲商湯的務實態度。一直以來，商湯關於AI價值的思考是，AI應該幫助傳統產業提高生產效率，而不是顛覆傳統產業。合作賦能始終是商湯的發力方向。當業界都在講大模型三要素（算力、算法、數據），商湯持續強調“場景”作爲第四要素的價值，這體現的是商湯對於“技術-商業”關係的差異化洞察。
前瞻的“非共識”佈局，指的是商湯的“大模型+大裝置”雙輪驅動路線。
從2017年後，商湯就在着手建設大裝置的原型系統。2020年，商湯決定投入56億元建設大裝置，這個耗資巨大的
非共識決策，一度引發不少爭議。徐立的邏輯是，做更通用的模型必須有更大的算力支持，建設大裝置可以讓AI的商業化不再依靠密集的人力。
這套邏輯是前瞻的，但也因爲前瞻，商湯需要頂着壓力去做。直到ChatGPT出現，大模型的邏輯得到驗證，大裝置算力的價值才獲得更多認可。而“大模型+大裝置”路線跑通之時，商湯的商業化進展也會隨之提速。今天業界看到的商湯大模型商業化進展和領先優勢，更多是“長線投入後的集中爆發”。
務實和理想的平衡
作爲人工智能頭部公司，商湯每一個動態都會影響市場對AI的看法，這次也不例外。
市場總是很矛盾，人們既相信AI是新的技術變革，但又總是希望快點看到商業回報，想要“短平快”的發展曲線。這幾乎是沒有可能的。所有能被稱爲“變革”的技術發展，都需要經歷一個投入和摸索的過程。即使是大家熟知的“移動互聯網造富”故事，前期也有通信技術突破、大範圍建設基礎設施的過程。只有投入到位、路線正確，才可能迸發出各種成果。
因爲着眼於未來、努力在務實和理想之間把握平衡，商湯這些年來的決策不總是符合行業共識。如今，商湯承受住了時間的考驗，公司的商業化成果證明了前期投入的價值。它的經歷有助於喚起市場的信心和耐心，因爲那個“技術變革催生商業增長”的美妙故事，現在依然成立。
轉至网页链接//@心有猛虎丨细嗅蔷薇:回复@濠爽的羅絲:链接进不去，辛苦一下，劳驾全部转出来。谢谢

作者：濠爽的羅絲

引用：