上海市數據科學重點實驗室主任肖仰華:用好大模型的征程剛剛開始我國企業(yè)需構建差異化競爭優(yōu)勢
近日,Meta發(fā)布性能直逼GPT-4的開源大模型Llama3,被視為開源模型發(fā)展的又一里程碑,也對閉源大模型陣營形成了新的競爭壓力。Llama3的出現將如何助推AI大模型產業(yè)發(fā)展?面對海外巨頭的開源戰(zhàn)略,我國大模型企業(yè)如何應對競爭?圍繞這些問題,上證報記者專訪了上海市數據科學重點實驗室主任肖仰華。
肖仰華認為,Llama3開源對于完善大模型產業(yè)生態(tài),加速大模型和千行百業(yè)深度融合,以及大模型應用的創(chuàng)新與普及都具有積極意義。
Llama3發(fā)布之前,OpenAI的閉源大模型GPT-4在整個大模型生態(tài)圈遙遙領先,是大模型應用方構建智能基座的優(yōu)先選擇。在肖仰華看來,Llama3的性能直逼GPT-4,為廣大大模型應用方帶來了巨大利好。更多選擇和良性競爭,有利于整個行業(yè)加速發(fā)展。
肖仰華常把智能比作電能。某種意義上Llama3的出現,意味著大模型基本達成了“發(fā)電”的里程碑,而且很多“發(fā)電廠”(基座大模型提供方)甚至還是免費(開源)。但有了電,不代表就能安全有效地用好電。
用電涉及更龐大的產業(yè),大模型的下游,也將圍繞“用智”形成更龐大的產業(yè)生態(tài)。如果說電器是用電的關鍵,那么“智器”(也就是基于大模型能力的各種解決方案與產品),將是用好大模型的關鍵。
他認為,隨著Llama3等基座大模型基本就位,大模型產業(yè)的發(fā)展焦點可能將逐步從基座模型的訓練和能力提升,過渡到打造智能化產品與解決方案上。用好大模型至關重要,絕不比訓練大模型容易。
用好大模型不僅要對大模型能力有全面、客觀的理解,還要將大模型與小模型、知識圖譜協同好,要將大模型能力有效融入現有生產與研發(fā)流程中,要基于大模型的能力對數字化、智能化架構進行解耦與重塑等。“基于大模型的能力將重塑千行百業(yè)的數字化、智能化形態(tài),這一征程才剛剛開始。”肖仰華說。
對于國內眾多大模型生態(tài)中的公司來說,Llama3的出現倒逼企業(yè)重新思考其在生態(tài)中的定位,以及如何形成差異化競爭路線,打造競爭優(yōu)勢,避免科技巨頭戰(zhàn)略性開源對自身商業(yè)戰(zhàn)略造成較大沖擊。
數據是大模型能力的源頭,肖仰華建議國內大模型企業(yè)要充分抓住我國大力發(fā)展數據要素市場的契機,在大規(guī)模高質量訓練數據、優(yōu)質指令、價值觀語料等方面加大力度,構筑特色鮮明、堅實牢固的數據護城河。
他還建議,我國大模型產業(yè)應在大模型評測方面加大研發(fā)力度,形成領先的大模型評鑒能力。隨著開源模型越來越多,智能應用與產品的研發(fā)者需要對模型能力具有較強的判斷和評價能力,進而形成面對眾多大模型的選型能力。
“大模型的智能是一種綜合能力,某種意義上對其考察評價的難度不亞于對人類智能的評價。大模型的評鑒能力足以成為大模型企業(yè)發(fā)展的核心競爭力之一。”肖仰華說。