每日觀察!兩秒將想象變成現實 “商湯秒畫”打造AI畫圖“模型超市”
2023-04-14 15:56:46    新民晚報

兩秒鐘,就能將你的想象變成“現實”。

在商湯技術日上,商湯“日日新”大模型體系正式問世,基于該體系的AI內容創(chuàng)作社區(qū)平臺“秒畫”也一并亮相。


【資料圖】

秒畫平臺基于商湯大裝置的GPU算力支撐,可幫助用戶免除本地化部署流程,既能使用商湯自研作畫模型高效地生成高質量內容,也可以將本地模型及其他第三方開源模型一鍵導入,生成更多樣的內容。

秒畫還提供特異性推理優(yōu)化服務,開源模型導入后會自動采用秒畫底層的模型編譯技術進行加速,實測在本地RTX3070顯卡需要10秒生成的圖片通過秒畫加速技術只需要2秒就可以生成。

超10億參數,多種風格秒生成

商湯自研的AIGC文生圖大模型擁有超10億參數,支持二次元、三次元等多種生成風格。用戶無需復雜的編程知識,只需給定提示詞,即可生成相應圖像,最高可實現6K高清圖。

無論是寫實照片、腦洞大開的藝術畫作,還是未來科幻場景,模型生成的圖像都能根據用戶需求,帶來真實的光影效果以及豐富的細節(jié)內容。憑借超快的推理性能,商湯自研作畫模型的文生圖能力,每2秒就能生成1張512*512分辨率的圖片。

高效釋放圖像生成“巧實力”

相比于爆紅AI圈的Stable Diffusion,商湯作畫大模型基于2019年開始研發(fā)的通用大模型設計體系,采用更先進的大模型結構設計與大batch訓練優(yōu)化算法,模型參數量大小為前者數倍。

核心技術包含了自研的多種算法,使其具備更優(yōu)的文本理解泛化性、圖像生成風格廣度以及圖像高質量生成細節(jié)。

此外,目前市面上所有的LoRA模型都是基于Stable Diffusion或者其變體訓練的,依托商湯基模型本身強大的泛化能力,使用其替代Stable Diffusion模型可以基于更少量數據快速訓練出質量更高的LoRA(記者注:LoRA,用于通過小數據繼續(xù)訓練,將大模型的能力適應到某個垂類領域,但會影響大模型的泛化能力)模型,實現更優(yōu)的風格定制化圖像生成,這樣的功能在秒畫平臺通過5分鐘即可實現。

擺脫算力掣肘滿足進階創(chuàng)意需求

對于有進階需求的模型創(chuàng)作者,“秒畫”平臺也可支持自行上傳數據集進行finetune、自訓練等功能,定制訓練屬于自己風格的LoRA模型,通過拖拽20張圖片訓練集,僅需5分鐘就能完成訓練,顯著降低模型的訓練門檻。

同時,用戶也可以一鍵導入Hugging Face, Civitai, GitHub 等第三方社區(qū)的開源模型進行體驗,讓用戶免除本地化部署的繁瑣流程,通過商湯AI大裝置強大的GPU算力集群、推理加速功能,即可高效生成更多樣的內容,創(chuàng)作更便利。

不僅如此,商湯還將面向B端開放API接口,結合商湯AI大裝置提供的算力,為客戶提供便利、高效的服務,打造多樣性的平臺和社區(qū)生態(tài)。

在大模型的驅動下,AI文生圖技術快速發(fā)展,可以廣泛應用于設計、營銷、游戲動畫、工程建筑、醫(yī)學、教育科普等領域,幫助人們提高創(chuàng)造力。

商湯方面表示,“秒畫”平臺的推出,在為創(chuàng)作者打造低門檻、高效率的創(chuàng)作服務的同時,還能夠充分整合社區(qū)力量連接更多資源,帶來更加便利、完善的內容生產創(chuàng)作工具,讓每一位創(chuàng)作者都能輕松地將想象變?yōu)楝F實。

新民晚報記者 郜陽

關鍵詞: