911亚洲第一精品,精品欧美,久久精品国产74国产

每日觀察!兩秒將想象變成現(xiàn)實 “商湯秒畫”打造AI畫圖“模型超市”

2023-04-14 15:56:46 新民晚報

兩秒鐘，就能將你的想象變成“現(xiàn)實”。

在商湯技術(shù)日上，商湯“日日新”大模型體系正式問世，基于該體系的AI內(nèi)容創(chuàng)作社區(qū)平臺“秒畫”也一并亮相。

【資料圖】

秒畫平臺基于商湯大裝置的GPU算力支撐，可幫助用戶免除本地化部署流程，既能使用商湯自研作畫模型高效地生成高質(zhì)量內(nèi)容，也可以將本地模型及其他第三方開源模型一鍵導入，生成更多樣的內(nèi)容。

秒畫還提供特異性推理優(yōu)化服務，開源模型導入后會自動采用秒畫底層的模型編譯技術(shù)進行加速，實測在本地RTX3070顯卡需要10秒生成的圖片通過秒畫加速技術(shù)只需要2秒就可以生成。

超10億參數(shù)，多種風格秒生成

商湯自研的AIGC文生圖大模型擁有超10億參數(shù)，支持二次元、三次元等多種生成風格。用戶無需復雜的編程知識，只需給定提示詞，即可生成相應圖像，最高可實現(xiàn)6K高清圖。

無論是寫實照片、腦洞大開的藝術(shù)畫作，還是未來科幻場景，模型生成的圖像都能根據(jù)用戶需求，帶來真實的光影效果以及豐富的細節(jié)內(nèi)容。憑借超快的推理性能，商湯自研作畫模型的文生圖能力，每2秒就能生成1張512*512分辨率的圖片。

高效釋放圖像生成“巧實力”

相比于爆紅AI圈的Stable Diffusion，商湯作畫大模型基于2019年開始研發(fā)的通用大模型設計體系，采用更先進的大模型結(jié)構(gòu)設計與大batch訓練優(yōu)化算法，模型參數(shù)量大小為前者數(shù)倍。

核心技術(shù)包含了自研的多種算法，使其具備更優(yōu)的文本理解泛化性、圖像生成風格廣度以及圖像高質(zhì)量生成細節(jié)。

此外，目前市面上所有的LoRA模型都是基于Stable Diffusion或者其變體訓練的，依托商湯基模型本身強大的泛化能力，使用其替代Stable Diffusion模型可以基于更少量數(shù)據(jù)快速訓練出質(zhì)量更高的LoRA（記者注：LoRA，用于通過小數(shù)據(jù)繼續(xù)訓練，將大模型的能力適應到某個垂類領域，但會影響大模型的泛化能力）模型，實現(xiàn)更優(yōu)的風格定制化圖像生成，這樣的功能在秒畫平臺通過5分鐘即可實現(xiàn)。

擺脫算力掣肘滿足進階創(chuàng)意需求

對于有進階需求的模型創(chuàng)作者，“秒畫”平臺也可支持自行上傳數(shù)據(jù)集進行finetune、自訓練等功能，定制訓練屬于自己風格的LoRA模型，通過拖拽20張圖片訓練集，僅需5分鐘就能完成訓練，顯著降低模型的訓練門檻。

同時，用戶也可以一鍵導入Hugging Face, Civitai, GitHub 等第三方社區(qū)的開源模型進行體驗，讓用戶免除本地化部署的繁瑣流程，通過商湯AI大裝置強大的GPU算力集群、推理加速功能，即可高效生成更多樣的內(nèi)容，創(chuàng)作更便利。

不僅如此，商湯還將面向B端開放API接口，結(jié)合商湯AI大裝置提供的算力，為客戶提供便利、高效的服務，打造多樣性的平臺和社區(qū)生態(tài)。

在大模型的驅(qū)動下，AI文生圖技術(shù)快速發(fā)展，可以廣泛應用于設計、營銷、游戲動畫、工程建筑、醫(yī)學、教育科普等領域，幫助人們提高創(chuàng)造力。

商湯方面表示，“秒畫”平臺的推出，在為創(chuàng)作者打造低門檻、高效率的創(chuàng)作服務的同時，還能夠充分整合社區(qū)力量連接更多資源，帶來更加便利、完善的內(nèi)容生產(chǎn)創(chuàng)作工具，讓每一位創(chuàng)作者都能輕松地將想象變?yōu)楝F(xiàn)實。

新民晚報記者郜陽

關鍵詞：