記者 王閑樂
隨著自動駕駛、chatgpt等名詞在互聯(lián)網(wǎng)傳播,越來越多人知道了人工智能技術。那么,你知道發(fā)展人工智能技術也需要“原材料”嗎?
啟數(shù)光輪科技(上海)有限公司就是這樣一家生產(chǎn)人工智能所需要的“原材料”——數(shù)據(jù)的公司。
“現(xiàn)在人工智能大模型迅速發(fā)展,對數(shù)據(jù)的需求特別大,整個互聯(lián)網(wǎng)的數(shù)據(jù)加一起都不夠用了。”啟數(shù)光輪創(chuàng)始人謝晨說,這時候就需要通過合成數(shù)據(jù)來推動人工智能發(fā)展。他之所以從蔚來汽車辭職創(chuàng)業(yè),正是看到了這一領域的廣闊前景。
為人工智能提供海量數(shù)據(jù)
謝晨曾在英偉達、cruise、蔚來等企業(yè)擔任自動駕駛仿真負責人。在英偉達工作期間,謝晨發(fā)現(xiàn),要讓自動駕駛變得更安全,需要大量的訓練數(shù)據(jù)。如果完全依賴于現(xiàn)實世界中的數(shù)據(jù),不僅難以采集,而且存在利用率低、標注成本高和長尾場景缺乏等問題。于是,他萌生了一個大膽的想法——能不能人工合成出這些訓練數(shù)據(jù)?
“比較通俗的類比是,人工智能就像我們養(yǎng)殖的動物,需要吃飼料才能長大。可是單靠自然界中的飼料是不夠的,所以我們得想辦法去自己生產(chǎn)一些飼料。”謝晨說,他想到的辦法是將生成式人工智能(aigc)與仿真技術深度融合。
仿真技術本身并不罕見,但單靠仿真技術生成的數(shù)據(jù)真實度、泛化性與效率較低,通俗來講就是“不夠真實”,因此無法解決現(xiàn)有難點,還需探索如何與生成式人工智能相結(jié)合。謝晨結(jié)合自己負責的自動駕駛業(yè)務,開始驗證兩種技術融合的可能性。
經(jīng)過反復驗證,謝晨用了5年時間,終于摸索出了生成式人工智能與仿真技術最佳融合方法,由此可以生成映射現(xiàn)實世界的合成數(shù)據(jù)——圖像或視頻,通過訓練算法理解和學習現(xiàn)有數(shù)據(jù)便可生成3d、物理真實、可泛化的新數(shù)據(jù)。
幫助中國企業(yè)追趕特斯拉
2023年,帶著自己的研究成果,謝晨毅然決定從蔚來汽車辭職創(chuàng)業(yè)。
“我們希望,通過合成數(shù)據(jù)的應用,助力中國汽車企業(yè)在自動駕駛技術上縮小與特斯拉的差距,甚至實現(xiàn)超越。”謝晨解釋道,特斯拉現(xiàn)在在全球擁有上百萬輛汽車,它們源源不斷地傳回數(shù)據(jù)、幫助人工智能不斷優(yōu)化。而中國車企掌握的數(shù)據(jù)可能只有特斯拉的百分之一,長此以往,雙方的人工智能差距也會拉大。
“啟數(shù)光輪可以提供海量合成數(shù)據(jù),相當于加了一個杠桿,來填補中國車企在真實數(shù)據(jù)量上與特斯拉的差異。”謝晨說,啟數(shù)光輪成立后完成的第一單業(yè)務,就很好地證明了合成數(shù)據(jù)的價值。
在業(yè)務拓展過程中,有汽車廠商告訴謝晨,企業(yè)正在研制的自動駕駛有個問題始終難以解決,就是會將路邊廣告牌的人物圖案識別為真人進而啟動剎車。如果修改識別規(guī)則,又無法鑒別真正的行人,容易造成交通事故。
“其實這里的問題就在于企業(yè)缺乏足夠多的路況數(shù)據(jù)。”謝晨的團隊拿下這一單,生成了數(shù)千個包含人像廣告的各類場景,并從中挑選出帶有精確標注的數(shù)據(jù)。這些數(shù)據(jù)隨后被該車企用于算法訓練,果然有效增強了自動駕駛模型的表現(xiàn)。
由此,啟數(shù)光輪在業(yè)界嶄露頭角,作為一家初創(chuàng)企業(yè)在業(yè)內(nèi)迅速打響了名氣。成立一年多,就獲得了四輪融資,得到了多家頭部創(chuàng)投機構(gòu)的認可。
推動人工智能相關產(chǎn)業(yè)發(fā)展
從在大企業(yè)做創(chuàng)新研發(fā),到自主創(chuàng)業(yè),謝晨坦言,這一年多的經(jīng)歷給了他很大挑戰(zhàn),也讓他感到十分興奮。
從一開始,他就給自己的新公司定了一個長遠的目標:成為數(shù)據(jù)界的英偉達。對此,謝晨很有信心。“我們有一個很棒的團隊,平均年齡28歲,來自合成數(shù)據(jù)、生成式人工智能、仿真等領域的優(yōu)秀技術人員占比超過90%,還有商業(yè)領域的人才。”
目前,啟數(shù)光輪在謝晨的主導下搭建了國際領先的合成數(shù)據(jù)產(chǎn)線,擁有多項國內(nèi)外技術專利,為多家海內(nèi)外知名自動駕駛公司、國內(nèi)外主機廠提供產(chǎn)品交付并形成合作伙伴關系,累計服務客戶幾十余家,交付數(shù)據(jù)上億幀,積累場景數(shù)百萬個。
“使用合成數(shù)據(jù)訓練人工智能已經(jīng)是硅谷的共識,但國內(nèi)對這塊認識還不夠。”謝晨希望,通過啟數(shù)光輪的一系列成功案例,讓更多人意識到合成數(shù)據(jù)的價值,推動自動駕駛、具身智能等相關產(chǎn)業(yè)蓬勃發(fā)展。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“機電號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of JDZJ Hao, which is a social media platform and only provides information storage services.